CRAN Task View: Official Statistics & Survey Methodologyの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載しました。

Maintainer: Matthias Templ
Contact: matthias.templ at gmail.com
Version: 2019-07-02
URL: https://CRAN.R-project.org/view=OfficialStatistics

このCRANタスクビューには、公式統計および調査方法論で一般的に使用される方法を含むパッケージのリストが含まれています。多くのパッケージは、以下に挙げるトピックのうちの複数の機能を提供します。したがって、このリストは厳密な分類ではなく、パッケージは複数回リストアップすることができます。タスクビューの最後には、SPSS、SAS、Stataなどのよく使用される統計ソフトウェアツールに関する特定のデータインポート/エクスポート機能が記載されています。

複雑な調査設計:サンプリングとサンプルサイズの計算

  • パッケージsamplingは、サーベイサンプルを作成し、設計重量を較正するためのさまざまなアルゴリズム(Brewer、Midzuno、pps、システマティック、Sampford、キューブ法によるバランス型(クラスターまたは層別)サンプリングなど)が含まれます。
  • パッケージsurveyplanningは、サンプルサイズの計算、合計見積もりの予測精度の見積もり、最適なサンプルサイズ配分の計算など、サンプル調査計画のツールが含まれています。
  • パッケージsimFrameは、Midzunoサンプリングの高速(コンパイル済みCコード)バージョンが含まれています。
  • パッケージppsは、ppsサンプリングを使用してサンプルを選択する関数が含まれています。また、層別の単純無作為抽出が可能であり、また、Sampfordのppsサンプリング法の共同包含確率を計算することも可能です。
  • パッケージstratificationは、Lavallee-Hidiroglou法の一般化と、調査集団の単変量成層することができます。
  • パッケージsurveyは、中程度のデータセットを処理することができ、Rに既に描画の調査サンプルを扱うための標準的なパッケージです。与えられた調査設計が関数svydesign()内で指定されると、ポイントと分散の推定値を計算することができます。
  • パッケージSamplingStrataは、各階層におけるサンプリングサイズがターゲット推定に精度の制約を満足させるために決定された多変量およびマルチドメインの設定、サンプリングフレームの最良の層別化を選択するためのアプローチを提供しています。異なる地層、サンプリングフレームの情報、又は同じ調査の前のラウンドからのデータ内のターゲット変数の分布を評価するために、使用することができます。
  • パッケージBalancedSamplingは、任意の規定された包含確率で、多次元空間における平衡および空間平衡確率サンプルを選択する。また、ローカルピボットメソッド、キューブとローカルキューブメソッド、およびいくつかのメソッドが含まれています。
  • パッケージgridsampleは、各PSU内のサンプリングされた世帯の望ましい数が与えられると、グリッド化された人口データを使用してユーザ定義の層内のPSUを選択します。PSUの作成に使用される人口密度は、ラスタから引き出されます。
  • パッケージPracToolsは、層別またはクラスター化された1段、2段、および3段のサンプルデザインを使用するサーベイサンプル用のサンプルサイズ計算機能と、多段階設計の分散コンポーネントおよび2フェーズ設計のサンプルサイズを計算する機能が含まれています。

複雑な調査設計:ポイントと分散の推定とモデルフィッティング

  • パッケージsurveyは、サーベイサンプルと連動します。複雑な測量デザイン(層別サンプリング設計、クラスタサンプリング、多段階サンプリング、および置換の有無にかかわらずPPSサンプリング)を指定することができます。与えられた測量デザインが関数svydesign()内で指定されると、点と分散の推定値を計算することができます。得られたオブジェクトは、ドメインまたは全調査サンプルの(Horvitz-Thompson-)合計、平均、比率および分位数を推定し、回帰モデルを適用するために使用できます。平均、合計、比率の差異の推定は、テイラー線形化またはリサンプリング(BRR、ジャッキー、ブートストラップまたはユーザー定義)のいずれかによって行うことができます。
  • パッケージsurveyのメソッドは、調査データの要約統計量を計算する際に、dplyr構文(piping)、group_byやsummarizeなどの動詞、およびその他のdplyrに由来する統語スタイルを使用してパッケージsrvyrから呼び出されます。
  • パッケージconveyは、パッケージsurveyを拡張します – 以下の指標に関するトピックを参照してください。
  • パッケージlaekenは、ブートストラップリサンプリングに基づいてドメインとストラータスのための彼らの分散を含む特定のラーケン指標(アット・リスク・オブ・貧困率、五分位の分担率、相対中央値、リスク・オブ・貧困ギャップ、ジニ係数)を推定するための関数が用意されています。
  • パッケージsimFrameを使用すると、シミュレーション環境で(ユーザ定義の)ポイントと分散推定を比較できます。これは、さまざまな調査設計の下での異なる点および分散推定値、ならびに欠損値、代表的および非代表的な外れ値に関する異なる条件を比較するためのフレームワークを提供します。
  • パッケージlavaan.surveyは、パッケージsurveyおよびlavaanのためのラッパー関数を提供しています。これは、複雑なデザインからのサンプル上の嵌合構造方程式モデル(SEM)のために使用することができる。パッケージsurveyから設計対象の機能を使用して、lavaanオブジェクトはパッケージlavaan.surveyのlavaan.survey()関数で再フィット(補正)している。これは、クラスタリングの取り込み、層別サンプリング重み、SEM分析に有限母集団修正することができます。lavaan.survey()は重みを複製し、帰属のデータセットを乗算し収納します。
  • パッケージvardpoorは、longitudinalとcrossectional対策や、どの段階クラスターサンプリング設計の変更の措置をいくつかの非線形人口統計の線形化、究極のクラスター法によるサンプル調査の分散推定、分散推定を計算することができます。
  • パッケージrpmsは、データを再帰的に分割することによって得られた各ノードのデータを調査するための線形モデルに適合します。このアルゴリズムは、1段階の階層化とクラスタリング、および選択の不等確率を説明します。
  • パッケージsvyPVpackは、パッケージsurveyを拡張します。このパッケージは、調査デザインに由来するデータを扱い、PISA、PIAACなどの大規模アセスメントのデータを処理するために作成されています。
  • パッケージweightsは、加重ピアソンの相関、部分相関、カイ二乗統計、ヒストグラムおよびt検定などの簡単な加重統計を生成するためのさまざまな関数を提供します。

複雑な調査設計:キャリブレーション

  • パッケージsurveyは、後の層別化、一般化掻き出し/キャリブレーション、グレッグ推定と重みのトリミングが可能になります。
  • パッケージsamplingにおけるCALIB()関数は、成層のサンプルに対して(応答均一性基との)無応答のためにキャリブレーションすることができます。
  • パッケージlaekenにおけるcalibWeights()関数は、パッケージsamplingからcalib()の一部のより高速な(例に応じて)実装が可能です。
  • パッケージicarusは、調査サンプリングで校正と重みに焦点を当て、SASマクロCalmarのユーザーのためのRでのよく似た設定を提供するように設計されました。
  • パッケージreweightは、特定の変数の周辺分布が所与の集団からのものとより密接に収まるようにカテゴリカル調査データの調査重みのキャリブレーションが可能になりますが、複雑なサンプリングのデザインを許可していません。
  • パッケージCalibrateSSBは、応答なしのパネルデータの重みと見積もりを計算する関数が含まれています。
  • パッケージFrames2は、デュアルフレーム調査でポイントとインターバルの推定を可能にします。2つの確率サンプル(各フレームから1つ)が描画されるとき。収集された情報は、適切に組み合わされて、関心のあるパラメータの推定量を得えます。

編集とミクロデータの目視検査

編集ツール:

  • パッケージvalidateは、ルール管理とデータ検証が含まれます。
    • validatetoolsパッケージは、検証ルールのセットを検査して単純化しています。
  • パッケージerrorlocateは、FellegiとHoltの原則に基づくエラーのローカリゼーションが含まれています。それは、カテゴリ的および/または数値的データおよび線形等価、不等式および条件付き規則をサポートします。このパッケージには、MIPベースのエラーローカライゼーションのための設定可能なバックエンドが含まれています。
  • パッケージeditrulesは、マトリクス状に等式(に)読みやすい線形に変換します。
  • パッケージdeducorrectは、パッケージeditrulesに依存しており、シンプルな丸めの演繹的補正を適用し、バランスの取れた編集をもとにエラーをタイプしたりサインしたりします。指定されたバランスの取れた編集が満たされるように値が変更されます。値がLevensteinメトリックが適用される変更されるかを判断します。
  • パッケージrspaは、式の制限に従うように数値レコードを最小限に調整する関数を実装しています。
  • パッケージSeleMixは、連続スケーリングされたデータに対して選択的な編集のために使用することができる。Y応答(S)と共変量の被依存セットに基づいて、混合モデル(ガウス汚染モデル)の推定値にエラーの影響を定量化するためのデータに当てはめます。
  • パッケージrrcovNAは、堅牢な場所と飛散予測や不完全なデータのための高降伏点を持つ堅牢な主成分分析を提供しています。これは、代表的および非代表外れ値を見つけることが適用可能である。

ビジュアルツール:

  • パッケージVIMは、適切な描画方法を使用して欠損値を視覚化するように設計されている。これは、指定された変数から欠損値の情報が選択された変数で強調表示され、単変量、変量、複数の多変量プロットを使用して、ミクロデータにおける欠損値の構造を分析するために使用することができます。また、グラフィカル・ユーザー・インタフェースが付属しています。
  • パッケージtreemapは、ツリーマップを提供する。ツリーマップは、階層構造を持つデータの集合体の空間充填視覚化したものです。色は、同等の凝集体間の差異を強調するために関連付けるために使用することができる。

帰属

反復モデルベースの方法の間の区別は、k近傍法やその他の方法で作成されています。しかし、多くの場合、この方法を使用するための基準は、公式統計では、通常、連続、半連続、バイナリ、カテゴリカル変数を数えるの混合物であるデータの規模に依存する。また、測定誤差は、非堅固な補完方法を破損する可能性がある。わずか補完方法は、変数の混合型を扱うことができますし、唯一のいくつかのメソッドは、堅牢性の問題を考慮することに注意してください。

EMベースの帰属方法:

  • パッケージmiは、欠損値、使用される回帰モデルのモデル検査の反復EMベースの複数のベイズ回帰法代入を提供しています。各変数の回帰モデルは、ユーザが定義することができます。データセットは、連続、半連続、バイナリ、カテゴリおよび/またはカウントの変数からなってもよい。
  • パッケージmiceは、反復EMベースの重回帰代入を提供しています。データセットは、連続的なバイナリ、カテゴリおよび/またはカウントの変数からなってもよい。
  • パッケージmitoolsは、分析を行い、積和補定データセットから結果を結合するためのツールが用意されています。
  • パッケージAmeliaは、元のデータと同じディメンションを持つ最初のブートストラップ標本を描画してから、EMベースの帰属のために使用されている多重代入を提供しています。それはlongitudialデータを代入することも可能です。加えて、パッケージには、グラフィカル・ユーザ・インタフェースが付属しています。
  • パッケージVIMは、適切外れ値を含むデータを処理することを可能にする強固な推定を使用して、EMベースの多重代入(関数irmi())を提供します。それは、連続、半連続、バイナリ、カテゴリおよび/またはカウント変数からなるデータを扱うことができます。
  • 単一代入メソッドは、パッケージsimputationによって他のパッケージからインクルードされるか、呼び出されます。回帰(標準、M推定、リッジ/ラッソ/エラスティックネット)、ホットデッキ法(VIMを使用)、ランダムフォレスト、EMベース、反復ランダムフォレスト代入をサポートします。
  • パッケージmixは、反復EMベースの重回帰代入を提供しています。データセットは、連続的なバイナリまたはカテゴリ変数からなることができるが、半連続変数のための方法が欠落している。
  • パッケージpanは、多変量パネルまたはクラスタ化されたデータのための多重代入を提供しています。
  • パッケージnormは、多変量正規データ用のEMベースの多重代入を提供しています。
  • パッケージcatは、多変量カテゴリカルデータのためのEMベースの多重代入を提供しています。
  • パッケージMImixは、混合の近似値を使用して多重に帰属データの結果を結合するためのツールが用意されています。
  • パッケージrobCompositionsは、組成データ(関数impCoda())のための反復モデルベース補完を提供しています。
  • パッケージmissForestは、randomForestの機能を使用して欠損値を反復的な単一代用の方法で帰結させます。それは半連続のものを除いてほとんどすべての種類の変数を扱うことができます。ランダムフォレストの基本的なブートストラップアプローチでも、複数の実行から複数の代入を得ることができますが、代入の追加の不確実性は、パッケージmiceのランダムフォレスト方法を選択する場合にのみ考慮されます。

最近傍法代入法

  • パッケージVIMは、人気のシーケンシャルと(ドメイン内)のランダムなホットデッキアルゴリズムの実装を提供します。
  • VIMはまた、大規模なデータセットのために使用することができ、高速k近傍(knn)アルゴリズムを提供します。それは、数値、カテゴリ、注文し、連続および半連続的な変数のためにガワー距離の変更を使用しています。
  • パッケージyaImputeは、異なるメトリックおよび方法は、観測間の距離を決定するために使用することができる連続変数の帰属のために人気のある最近傍ルーチンを実行します。
  • パッケージrobCompositionsは、最近傍のエイチスン距離や調整を使用して組成データ(関数impKNNa())のためのknnの補完を提供しています。
  • パッケージrrcovNAは、増強されたデータ行列の共分散の行列式を最小化することによって、(堅牢)シーケンシャル帰属関数impSeq()とimpSeqRob()のためのアルゴリズムを提供します。そのアプリケーションは、連続的なスケーリングされたデータに制限されています。
  • バイオコンダクター上のパッケージimputeは、連続変数のknnの帰属を提供しています。

コピュラベースの代入方法:

  • S4クラスパッケージCoImpは、条件付きコピュラ関数を使用して多変量欠損データを転嫁します。インピュテーション手順はセミパラメトリックです。コピュラについて異なるパラメトリックモデルの範囲は、ユーザによって選択することができながら、マージンは、非パラメトリックに低次多項式のローカル可能性によって推定されます。欠損値は、ヒットまたはミスモンテカルロ法を用いて条件付密度関数からの観察を描画することによって帰属されます。これは、継続的なスケーリングされた変数の行列または離散分布のマトリックスのいずれかのために動作します。

その他の推定補完方法:

  • パッケージmissMDAは、複数のコレスポンデンス分析(MCA)によって、主成分分析(PCA)またはカテゴリ変数によって、不完全な連続変数を代入することができます。
  • パッケージmice(関数mice.impute.pmm())とパッケージHmisc(関数aregImpute())の予測平均は、補完にマッチすることができます。
  • パッケージVIMは、適切なプロット方法を使用して欠損値の構造を視覚化することができます。また、グラフィカル・ユーザー・インタフェースが付属しています。

統計的開示制御

統計機関や他の機関からのデータは、主に機密その生の形式であり、データプロバイダは、情報の損失の最小量を保証することにより統計単位を再同定することができない両方の元のデータを変更することによって、機密性を確保しなければなりません。

  • パッケージsdcMicroは、公開および科学用ファイルを生成するために、すなわち、機密(マイクロ)データの生成のために使用することができます。パッケージには、グラフィカル・ユーザ・インタフェースが付属しています。
  • パッケージsdcTableは、機密(階層)の表形式のデータを提供するために使用することができる。それはHITASとHYPERCUBEテクニックが含まれており、(大量の)線形プログラムを解くための線形計画パッケージRglpkとlpSolveAPIを使用しています。
  • パッケージsdcTable へのインタフェースは、パッケージeasySdcTableによって提供されます。
  • パッケージsdcHierarchiesは、統計的開示管理メソッドの入力を定義するときによく使用されるネスト階層を生成、変更、インポート、および変換するためのメソッドを提供します。
  • パッケージSmallCountRoundingは、公開される相互分類が安全であるように、必要な内部セルを四捨五入して頻度テーブルを保護するために使用できます。

季節調整

一般的な時系列の方法論のために我々はTimeSeriesタスクビューを参照してください。

  • 時系列の分解は関数decompose()して行う、以上の基本データパッケージから両方の関数のstl()を使用して進めることができます。分解はまた、統計パッケージに記載されているStructTS()関数でも可能です。
  • 多くの強力なツールがパッケージx12x12GUIやパッケージseasonalを介してアクセスすることができます。
    • x12は、最初にインストールしなければならないX12 binaries用のラッパー関数を提供しています。これは、複数の時系列のバッチ処理のためのS4クラスインターフェースを使用します。
    • x12GUIは、X12-ARIMA季節調整ソフトウェア用のグラフィカル・ユーザー・インターフェースを提供します。
    • あまり機能がなく、SEATSの支援を受けてスペックは、パッケージseasonalでサポートされています。
  • 調査型の予測では個々の予測の大きなプールがあるため、GeomCombパッケージの予測組み合わせ技術が役立ちます。また、時系列の欠損値も処理できます。

統計レコードのマッチング

  • パッケージStatMatchは、一般的な変数の数を共有する2データソース間の統計的なマッチングを行うための機能を提供します。これは、尤度取り組みとを介して、またはホットデッキを介して2つのデータソースとのマッチング後に設定する合成データを作成します。
  • パッケージRecordLinkageは、リンクやデータセットを重複除外するための機能を提供します。
  • パッケージMatchItは、他のマッチング方法の中でも、最近傍マッチング、完全マッチング、最適マッチング、完全マッチングを可能にします。 2つのデータセットを一致させる必要がある場合、データは各観測のメンバーシップについての情報を含む因子変数を含む1つのデータフレームとして来る必要があります。
  • パッケージstringdistは、edits(damerau-levenshtein、ハミング、levenshtein、最適なスティングアライメント)、qgram(q-gram、cosine、jaccard距離)またはヒューリスティックメトリック(jaro、jaro-winkler)に基づいてさまざまな文字列距離を計算できます。
  • パッケージXBRLは、XBRLドキュメントからビジネス財務情報を抽出できます。

小面積の推定

  • パッケージsaeは、小領域推定のための関数、例えば、直接推定量、経験的最善予測量および複合推定量を含みます。
  • パッケージemdiは、モデル診断分析を実行したり、可視化したり、さらに処理するために結果をエクスポートするなど、推定を超えてもユーザをサポートするためのさらなる機能が含まれています。これには、変数を変換するための組み込み機能が含まれており、分散推定のためのブートストラップ手法が含まれています。Excelへのエクスポートも含まれ、自動化された方法で並列コンピューティングが適用されます。
  • パッケージrsaeは、最尤(ML)または強固なMLによる基本単位レベルの小面積の推定(SAE)モデル(別名ネストされたエラー回帰モデル)のパラメータを推定するための関数が用意されています。推定されたパラメータに基づいて、エリア別の手段の強固な予測は(含むMSE推定値を、パラメトリック・ブートストラップ)が計算されます。現在のバージョン(RSAE0.4-X)は、カテゴリ独立変数を許可しません。
  • パッケージnlmeは、ガウス線形および非線形混合効果モデルに合わせて機能を提供します。
    • lme4は、線形および一般化線形混合効果モデル、小面積の推定に使用されるの両方に合わせて機能を提供します。
  • hbsaeパッケージは、基本領域または単位レベルのモデルに基づいて、小面積の推定値を計算するための関数が用意されています。モデルは、制限された最尤法を使用して、または階層ベイズの方法で適合している。補助情報は、どちらのカテゴリ変数から生じるカウントまたは連続母集団情報からの手段とすることができます。
  • 一般化回帰分析(GREG)および単位レベルの経験的最良線形不偏予測のためのパッケージJoSAEポイントおよび分散推定EBLUP推定量をドメインレベルで作成することができます。
    • 基本的な変量効果モデルに適合するために使用されるnlmeパッケージに、基本的にラッパー関数を提供します。
  • パッケージBayesSAEは、基本的なFay-HerriotモデルからYou-Chapmanモデル、比類のないモデル、空間モデルなどの改善までのベイジアンメソッドも含まれています。

指標とインジケータとインジケータの可視化

  • パッケージlaekenは、人気のリスクの貧困と不平等の指標(アット・リスク・オブ・貧困率、五分位の分担率、相対中央値、リスク・オブ・貧困ギャップ、ジニ係数)を推定するための関数が用意されています。また、パレート分布のテールモデリングのための標準で堅牢な方法は、このような所得の変数などの継続的な単変量分布からの指標のセミパラメトリック推定のために提供されています。
  • パッケージconveyは、ジニ係数、アトキンソンインデックス、貧困リスク閾値、およびその他多くでのsurveyパッケージによって作成された、よく知られた線形化および複製ベースの設計を使用して、所得の集中と貧困の 指標に分散を推定します。
  • パッケージineqは、さまざまな不平等対策(特にジニ、タイル、エントロピー)、濃度を測定(ハーフィンダール、ローゼンブルース)、貧困対策(ワット、セン、SST、およびフォスター)を計算する。また、経験と理論のローレンツ曲線だけでなく、ペンのパレードを計算し、描画します。それは、(これらはのみREP(x、weights)を介してエミュレートすることができる)直接サンプリングの重みに対処するために設計されていません。
  • パッケージIC2は、3不平等指数が含まれています:拡張ジニ、アトキンソンと一般化エントロピー。これは、サンプリングの重みを扱うことができますし、サブグループ分解がサポートされています。
  • パッケージDHS.ratesは、人口統計および健康調査(DHS)データの重要な指標(特に出生率)とその差異を推定します。
  • パッケージmicEconIndexの関数priceIndex()は、Paasche、Fisher、Laspeyresの価格指数を見積もることができます。(商品の)量を見積もるために、関数quantityIndex()はあなたの友人かもしれません。
  • パッケージtmapは、choroplethsバブルマップのような主題図を作成するレイヤーベースの方法を提供しています。
  • パッケージrworldmapは、独自のデータを視覚化してユーザーをサポートし、データを参照されている国をマッピングする方法を概説します。例としては、例えば、与えられている、世界の銀行や国連のためにマッピングされます。また、マップを視覚化するための新しい方法を提供します。
  • パッケージrrcov3wayは、構成データにも適用可能な多方向データ解析のための堅牢な方法を提供します。
  • 統計テストを含むコンポジションテーブルのパッケージrobCompositionsメソッド。

マイクロシミュレーション

  • パッケージsimPopは、モデルベースの方法または合成再建法と補助データに基づいて、調査の集団をシミュレートすることができます。Hiercharicalと(例えば、家庭等)のクラスタ構造は方法が複雑なサンプルの設計に基づいて収集されたサンプルのために考慮したと同様に考えることができます。キャリブレーションツール(反復比例フィッティング、反復比例更新)と組合せ最適化ツール(焼きなまし)もご利用いただけます。コードは、高速の計算のために最適化されています。このパッケージはS4クラスの実装に基づいています。シミュレートされた集団は、マイクロシミュレーション研究のための基礎データとして役立つことができます。
  • MicSimパッケージは、microsimulationsためのメソッドが含まれています。与えられた初期集団、死亡率、離婚率、婚姻率、教育の変化などとその遷移行列を定義することができ、人口の未来の状態のシミュレーションに含まれています。パッケージは、コンパイルされたコードが含まれていませんが、並行してマイクロシミュレーションを実行するための機能が提供されます。
  • パッケージsmsは、与えられた領域ベースのマクロデータからミクロデータをシミュレートする機能を提供します。シミュレーテッドアニーリングは最高のエリアの利用可能な記述を満たすために使用されている。計算問題については、計算は並列モードで実行することができます。
  • パッケージsynthpopは、与えられたデータからの合成データをシミュレートするために、回帰ツリー法を使用している。これは、データ(たとえば家庭など)が階層的クラスタ情報を持たない場合に、データが複雑なサンプル設計で収集していない場合と同様に合成データを生成するのに適している。
  • 小面積推定のコンテキストでデータのシミュレーションのためのパッケージsaeSimツール。

追加パッケージと機能

様々な追加パッケージは、公式統計と調査方法で有用な特定の機能を提供して利用できます。

データのインポートとエクスポート:

  • パッケージSASciiは、read.fwf.callの引数に解析、変換した唯一のSAS入力スクリプトを使用してRに直接ASCIIファイルをインポートします。データをインポートするためのSASのスクリプトが既に利用しているときには、便利です。
  • foreignパッケージは、SAS XPortの(関数read.xport())、Stata(関数read.dta())、SPSS(関数read.spss())および様々な他のフォーマットからデータを読み出すためのツールが含まれています。これは、関数write.foreign()を参照して、様々なフォーマットへのファイルの書き込みに設備などが充実しています。
  • パッケージhavenは、SAS、Stata、およびSPSS(function read.spss())ファイルをインポートおよびエクスポートします。このパッケージは、重いデータセットを読み込むために効率的であり、高度な方法で変数と値のラベリングを処理します。
  • パッケージHmiscは、SPSS(関数spss.get())またはStata(関数stata.get())からデータセットを読み込むためのツールを提供します。
  • パッケージpxRは、その(多次元)テーブルの普及のため、世界中の様々な統計組織によって使用されるPCの軸ファイルを読み書きするための関数のセットを提供します。
  • パッケージprevRは、関数import.dhs()で直接人口動態保健調査からのデータをインポートすることが可能です。
  • パッケージquestionrは、関数describe()で、foreignやmemiscパッケージとインポートされたラベルが含まれている場合があり、データセットの変数を記述します。
  • パッケージOECDは、OECDからデータを検索し抽出します。
  • パッケージRilostatは、検索および操作ユーティリティと共にinternational labour organisation databaseからデータをダウンロードするためのツールが含まれています。また、SDMX形式でデータベース上で利用可能なilostatデータをインポートすることもできます。
  • パッケージsorviは、フィンランド政府の公開データへのアクセスを提供します。
  • パッケージeurostatは、Eurostatデータベースから検索および操作ユーティリティとともにデータをダウンロードするツールを含んでいます。
  • パッケージacsは、米国国勢調査のアメリカのコミュニティ調査と10年ごとのデータをダウンロード、操作、提示します。
  • パッケージcensusapiは、Censusデータとメタデータのデータフレームを返す米国国勢調査局APIのラッパーを実装しています。
  • パッケージcensusGeographyは、都市および州(FIPおよびICP)、地域、出生地の特定の米国国勢調査の地理的コードを変換します。
  • パッケージidbrは、米国国勢調査局のInternational Data Base APIへのリクエストを行うことができます。
  • パッケージipumsrは、IPUMSが提供する国勢調査、調査および地理データを簡単にインポートする方法を提供します。
  • パッケージnoncensusは、人口統計データとともに米国国勢調査局によって決定されたさまざまな地域情報のコレクションが含まれています。
  • パッケージtidycensusは、10年ごとの米国国勢調査とアメリカのコミュニティ調査APIと米国国勢調査局の地理的境界ファイルとの統合されたRインターフェースを提供します。
  • パッケージinegiRは、メキシコの公式統計機関であるINEGIによって公開されたデータへのアクセスをサポートしています。
  • パッケージcbsodataRは、Statistics Netherlands(CBS)公開データAPIへのアクセスを提供しています。
  • パッケージEdSurveyは、NCES教育調査および評価データの分析が含まれています。
  • パッケージnomisrは、国勢調査や労働力調査を含むノミス英国労働市場データへのアクセスを提供します。
  • パッケージreadabsは、オーストラリア統計局https://cran.r-project.org/package=readabsから時系列データをダウンロードして整理します。
  • パッケージFAOSTATは、国連の食糧農業機関(FAO)のFAOSTATデータベースからデータをダウンロードします。
  • パッケージecbは、欧州中央銀行の統計データウェアハウス(SDW)へのアクセスを提供します。
  • パッケージpxwebは、多くの国家統計機関で使用されているPX-Web / PC-Axis APIの汎用インタフェースを提供します。
  • パッケージPxWebApiDataは、例えば統計ノルウェーおよび統計スウェーデン、統計フィンランドの簡単なAPIアクセスを提供します。

その他:

  • パッケージsamplingbookは、Goeran Kauermann and Helmut Kuechenhoff (2010)による本「Stichproben. Methoden und praktische Umsetzung mit R」からのサンプリング手順が含まれています。
  • パッケージSDaAは、Lohr, S. (1999) 「Sampling: Design and Analysis, Duxbury」からの結果を再現するように設計され、本書のデータセットが含まれる。
  • samplingVarEstの主な貢献は、不均等な確率で1または2段階設計の分散推定のためのジャックナイフの選択肢です。
  • パッケージmemiscは、調査データ、グラフィック、シミュレーションを管理するためのツールが含まれています。
  • パッケージanesrakeは、米国国家選挙研究の仕様に合わせて変数を選択し、データを重み付けする包括的なシステムを提供します。
  • パッケージspsurveyは、等しく、不等確率(層別)サンプリングのための空間調査設計と分析のための機能が含まれています。
  • FFDパッケージは、病気からの自由を立証するために調査のために群れで暮らす動物の個体群の最適なサンプルサイズを計算するように設計されています。サンプルサイズを推定する基準は考慮疾患だけでなく、不完全な診断テストの群れレベルのクラスタリングを取ると、2段階の設計に基づいてサンプルを選択します。包含確率を推定する際に考慮されていません。パッケージは、同様に、グラフィカルユーザインタフェースを提供します。
  • mipfpは、ターゲット周辺表を与えられたn次元配列を比較する多次元反復比例フィッティングを提供します。
  • パッケージMBHdesignは、研究領域内の一連の(連続した)潜在的サンプリング場所から空間的にバランスのとれたデザインを提供します。
  • パッケージquantificationは、定性的調査データを定量化するためのさまざまな機能を提供します。これはCarlson-Parkin法、回帰法、均衡法、条件付き期待法をサポートしています。
  • BIFIEsurveyは、(例えば、ブートストラップからの)複製重量を含むデータを含む、教育評価における調査統計のためのツールが含まれます。
  • surveybootstrapは、複雑な調査データを使用してサンプリングのばらつきを見積もるためのさまざまな種類のブートストラップを使用するためのツールが含まれています。
  • パッケージsurveyoutliersは、関心のある変数の値をwinsorizeします。
  • パッケージunivOutlは、一変量外れ値を検出するための様々な方法を含みます。例えば、Hidiroglou-Berthelotメソッドなど。
  • パッケージextremevaluesは、一括分布のモデリングに基づいて一変量の異常値を検出するように設計されています。
  • パッケージRRregは、社会的望ましさに起因する応答バイアスを除去するための調査方法である、ランダム化された応答技術のいくつかのバリエーションに対して、単変量および多変量解析(相関、線形、およびロジスティック回帰)を実装します。
  • パッケージRRTCSは、複雑な調査のためのランダム応答テクニックが含まれています。
  • パッケージpanelaggregationは、ビジネス傾向調査データ(および他の定性調査)を様々な集約レベルで時系列に集計します。
  • パッケージsurveydataは、アンケートからのメタデータの追跡が容易になり、特定の質問を含む列を簡単に抽出できます。
  • RcmdrPlugin.samplingは、公式統計調査でのサンプリングツールが含まれています。サンプルサイズを計算し、さまざまなサンプリングデザインを使用してサンプルを選択するためのツールが含まれています。
  • パッケージmapStatsは、色分けされたマップ上の測量データ統計の自動計算と可視化を行います。

関連する記事

R言語 CRAN Task View:政府統計&調査の方法

One thought on “R言語 CRAN Task View:政府統計&調査の方法

Comments are closed.