CRAN Task View: Official Statistics & Survey Methodologyの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載した。

Maintainer: Matthias Templ
Contact: matthias.templ at gmail.com
Version: 2017-04-17
URL: https://CRAN.R-project.org/view=OfficialStatistics

このCRANタスクビューには、公式統計および調査方法論で一般的に使用される方法を含むパッケージのリストが含まれています。 多くのパッケージは、以下に挙げるトピックのうちの複数の機能を提供します。 したがって、このリストは厳密な分類ではなく、パッケージは複数回リストアップすることができます。 タスクビューの最後には、SPSS、SAS、Stataなどのよく使用される統計ソフトウェアツールに関する特定のデータインポート/エクスポート機能が記載されています。

複雑な調査設計:一般的なコメント

  • パッケージのsamplingは、調査サンプルの採取および設計重みを較正するための多くの異なるアルゴリズムを含む。
  • パッケージsurveyでは、中程度のデータセットを処理することができ、Rに既に描画の調査サンプルを扱うための標準的なパッケージである。与えられた調査設計が関数svydesign()内で指定されると、ポイントと分散の推定値を計算することができる。
  • 調査パッケージのメソッドは、調査データの要約統計量を計算するときに、dplyr構文(piping)、group_byやsummarizeなどの動詞、およびその他のdplyr-inspired構文スタイルを使用してパッケージ srvyr から呼び出されます。
  • パッケージsimFrameは公式統計でシミュレーション研究を行うために設計されています。これは、欠損値、代表と非代表外れ値に関するさまざまな条件だけでなく、デザインを異なる調査の下に別のポイントと分散推定量を比較するためのフレームワークを提供します。

複雑な調査設計:詳細

  • パッケージsurveyでは、正確なポイントと分散推定を計算するために、既に描画調査サンプルのための複雑な調査設計(層別サンプリングデザイン、クラスタ・サンプリング、多段サンプリング、交換有り無しPPSサンプリング)を指定することができます。
  • サンプルを吸引するための種々のアルゴリズムは、パッケージsampling(立方体方法等を経由してサンプリングをバランスした、Brewer、Midzuno、pps、、systematic、Sampford)に実装される。
  • ppsパッケージには、PPSのサンプリングを使用してサンプルを選択するための機能が含まれています。また、層別単純無作為抽出は、PPSサンプリングのサンフォードのメソッドのための共同包含確率を計算することが可能などである。
  • パッケージのstratificationは、Lavallee-Hidiroglou法の一般化と、調査集団の単変量成層することができます。
  • パッケージSamplingStrataは、各階層におけるサンプリングサイズがターゲット推定に精度の制約を満足させるために決定された多変量およびマルチドメインの設定、サンプリングフレームの最良の層別化を選択するためのアプローチを提供しています。異なる地層、サンプリングフレームの情報、又は同じ調査の前のラウンドからのデータ内のターゲット変数の分布を評価するために、使用することができる。
  • パッケージgridsample は、各PSU内のサンプリングされた世帯の望ましい数が与えられると、グリッド化された人口データを使用してユーザ定義の層内のPSUを選択します。 PSUの作成に使用される人口密度は、ラスタから引き出されます
  • パッケージPracTools には、層別またはクラスター化された1段、2段、および3段のサンプルデザインを使用するサーベイサンプル用のサンプルサイズ計算機能と、多段階設計の分散コンポーネントおよび2フェーズ設計のサンプルサイズを計算する機能が含まれています。
  • パッケージsamplesize4surveys は、複雑なサンプリングデザインでの合計、平均、および割合の推定に必要なサンプルサイズを計算します。

複雑な調査設計:ポイントと分散推定

  • パッケージsurveyでは、複雑な調査設計を指定することができます。得られたオブジェクトは、ドメインまたは全調査サンプルについて(ホービッツ-トンプソン-)合計、手段、比率、及び変位値を推定するために、回帰モデルを適用するために使用することができる。手段、合計および比率の分散推定はテイラー線形化やリサンプリング(BRR、jackkife、ブートストラップまたはユーザ定義)のいずれかを行うことができます。
  • convey パッケージは、パッケージsurvey を拡張します – 以下の指標に関するトピックを参照してください。
  • パッケージlaekenは、ブートストラップリサンプリングに基づいてドメインとストラータスのための彼らの分散を含む特定のラーケン指標(アット・リスク・オブ・貧困率、五分位の分担率、相対中央値、リスク・オブ・貧困ギャップ、ジニ係数)を推定するための関数が用意されています。
  • パッケージsimFrameは、シミュレーション環境で(ユーザー定義)の点と分散推定量を比較することができます。
  • lavaan.surveyパッケージには、パッケージsurveyおよびlavaanのためのラッパー関数を提供しています。これは、複雑なデザインからのサンプル上の嵌合構造方程式モデル(SEM)のために使用することができる。パッケージsurveyから設計対象の機能を使用して、lavaanオブジェクトはパッケージlavaan.surveyのlavaan.survey()関数で再フィット(補正)している。これは、クラスタリングの取り込み、層別サンプリング重み、SEM分析に有限母集団修正することができます。lavaan.survey()は重みを複製し、帰属のデータセットを乗算し収納する。
  • パッケージvardpoorは、longitudinalとcrossectional対策や、どの段階クラスターサンプリング設計の変更の措置をいくつかの非線形人口統計の線形化、究極のクラスター法によるサンプル調査の分散推定、分散推定を計算することができます。
  • パッケージrpms は、データを再帰的に分割することによって得られた各ノードのデータを調査するための線形モデルに適合します。 このアルゴリズムは、1段階の階層化とクラスタリング、および選択の不等確率を説明します。
  • パッケージsvyPVpack はパッケージsurvey を拡張します。 このパッケージは、調査デザインに由来するデータを扱い、PISA、PIAACなどの大規模アセスメントのデータを処理するために作成されています。

複雑な調査設計:キャリブレーション

  • パッケージsurveyでは、後の層別化、一般化掻き出し/キャリブレーション、グレッグ推定と重みのトリミングが可能になります。
  • パッケージsamplingにおけるCALIB()関数は、成層のサンプルに対して(応答均一性基との)無応答のためにキャリブレーションすることができます。
  • パッケージlaekenにおけるcalibWeights()関数は、パッケージsamplingからcalib()の一部のより高速な(例に応じて)実装が可能である。
  • パッケージsimPop でcalibSample()関数は、前の2つの言及の機能よりも潜在的に高速であり、よりよい使い勝手を提供します。 calibVars()は、キャリブレーション用のバイナリ変数のマトリックスを構築することができます。 calibPop()は、シミュレートされたアニーリングアプローチを使用して、家庭用データ内の集団の人を較正するために使用されます。
  • パッケージicarus は、調査サンプリングで校正と重みに焦点を当て、SASマクロCalmarのユーザーのためのRでのよく似た設定を提供するように設計されました。
  • パッケージreweightは、特定の変数の周辺分布が所与の集団からのものとより密接に収まるようにカテゴリカル調査データの調査重みのキャリブレーションが可能になりますが、複雑なサンプリングのデザインを許可していません。
  • CalibrateSSB パッケージは、応答なしのパネルデータの重みと見積もりを計算する関数が含まれています。
  • パッケージFrames2 は、デュアルフレーム調査でポイントとインターバルの推定を可能にします。 2つの確率サンプル(各フレームから1つ)が描画されるとき。 収集された情報は、適切に組み合わされて、関心のあるパラメータの推定量を得えます。

編集とミクロデータの目視検査

編集ツール:

  • パッケージeditrulesはマトリクス状に等式(に)読みやすい線形に変換します。
  • パッケージdeducorrectはパッケージeditrulesに依存しており、シンプルな丸めの演繹的補正を適用し、バランスの取れた編集をもとにエラーをタイプしたりサインしたりする。指定されたバランスの取れた編集が満たされるように値が変更されます。値がLevensteinメトリックが適用される変更されるかを判断する。
  • rspa パッケージは、式の制限に従うように数値レコードを最小限に調整する関数を実装しています。
  • パッケージSeleMixは、連続スケーリングされたデータに対して選択的な編集のために使用することができる。Y応答(S)と共変量の被依存セットに基づいて、混合モデル(ガウス汚染モデル)の推定値にエラーの影響を定量化するためのデータに当てはめられる。
  • パッケージrrcovNAは、堅牢な場所と飛散予測や不完全なデータのための高降伏点を持つ堅牢な主成分分析を提供しています。これは、代表的および非代表外れ値を見つけることが適用可能である。

ビジュアルツール:

  • パッケージVIMは、適切な描画方法を使用して欠損値を視覚化するように設計されている。これは、指定された変数から欠損値の情報が選択された変数で強調表示され、単変量、変量、複数の多変量プロットを使用して、ミクロデータにおける欠損値の構造を分析するために使用することができます。また、グラフィカル・ユーザー・インタフェースが付属しています。
  • パッケージtabplotは、大規模な統計的なデータセットをプロファイリングや探索するために使用されtableplot可視化方法を提供する。
  • パッケージtreemapは、ツリーマップを提供する。ツリーマップは、階層構造を持つデータの集合体の空間充填視覚化したものです。色は、同等の凝集体間の差異を強調するために関連付けるために使用することができる。

帰属

反復モデルベースの方法の間の区別は、k近傍法やその他の方法で作成されています。しかし、多くの場合、この方法を使用するための基準は、公式統計では、通常、連続、半連続、バイナリ、カテゴリカル変数を数えるの混合物であるデータの規模に依存する。また、測定誤差は、非堅固な補完方法を破損する可能性がある。わずか補完方法は、変数の混合型を扱うことができますし、唯一のいくつかのメソッドは、堅牢性の問題を考慮することに注意してください。

EMベースの帰属方法:

  • パッケージmiは、欠損値、使用される回帰モデルのモデル検査の反復EMベースの複数のベイズ回帰法代入を提供しています。各変数の回帰モデルは、ユーザが定義することができる。データセットは、連続、半連続、バイナリ、カテゴリおよび/またはカウントの変数からなってもよい。
  • パッケージmiceは、反復EMベースの重回帰代入を提供しています。データセットは、連続的なバイナリ、カテゴリおよび/またはカウントの変数からなってもよい。
  • パッケージmitoolsは、分析を行い、積和補定データセットから結果を結合するためのツールが用意されています。
  • パッケージAmeliaは、元のデータと同じディメンションを持つ最初のブートストラップ標本を描画してから、EMベースの帰属のために使用されている多重代入を提供しています。それはlongitudialデータを代入することも可能です。加えて、パッケージには、グラフィカル・ユーザ・インタフェースが付属しています。
  • パッケージVIMは、適切外れ値を含むデータを処理することを可能にする強固な推定を使用して、EMベースの多重代入(関数irmi())を提供します。それは、連続、半連続、バイナリ、カテゴリおよび/またはカウント変数からなるデータを扱うことができる。
  • パッケージmixは、反復EMベースの重回帰代入を提供しています。データセットは、連続的なバイナリまたはカテゴリ変数からなることができるが、半連続変数のための方法が欠落している。
  • パッケージpanは、多変量パネルまたはクラスタ化されたデータのための多重代入を提供しています。
  • パッケージnormは、多変量正規データ用のEMベースの多重代入を提供しています。
  • パッケージcatは、多変量カテゴリカルデータのためのEMベースの多重代入を提供しています。
  • パッケージMImixは、混合の近似値を使用して多重に帰属データの結果を結合するためのツールが用意されています。
  • パッケージrobCompositionsは、組成データ(関数impCoda())のための反復モデルベース補完を提供しています。
  • パッケージmissForest は、randomForestの機能を使用して欠損値を反復的な単一代用の方法で帰結させます。 それは半連続のものを除いてほとんどすべての種類の変数を扱うことができます。 ランダムフォレストの基本的なブートストラップアプローチでも、複数の実行から複数の代入を得ることができますが、代入の追加の不確実性は、パッケージmice のランダムフォレスト方法を選択する場合にのみ考慮されます。

最近傍法代入法

  • パッケージVIMは、人気のシーケンシャルと(ドメイン内)のランダムなホットデッキアルゴリズムの実装を提供します。
  • VIMはまた、大規模なデータセットのために使用することができ、高速k近傍(knn)アルゴリズムを提供します。それは、数値、カテゴリ、注文し、連続および半連続的な変数のためにガワー距離の変更を使用しています。
  • パッケージyaImputeは異なるメトリックおよび方法は、観測間の距離を決定するために使用することができる連続変数の帰属のために人気のある最近傍ルーチンを実行する。
  • パッケージrobCompositionsは最近傍のエイチスン距離や調整を使用して組成データ(関数impKNNa())のためのknnの補完を提供しています。
  • パッケージrrcovNAは増強されたデータ行列の共分散の行列式を最小化することによって、(堅牢)シーケンシャル帰属関数impSeq()とimpSeqRob()のためのアルゴリズムを提供する。そのアプリケーションは、連続的なスケーリングされたデータに制限されています。
  • バイオコンダクター代入上のパッケージimputeは、連続変数のknnの帰属を提供しています。

コピュラベースの代入方法:

  • S4クラスパッケージCoImpは、条件付きコピュラ関数を使用して多変量欠損データを転嫁する。インピュテーション手順はセミパラメトリックです。コピュラについて異なるパラメトリックモデルの範囲は、ユーザによって選択することができながら、マージンは、非パラメトリックに低次多項式のローカル可能性によって推定される。欠損値は、ヒットまたはミスモンテカルロ法を用いて条件付密度関数からの観察を描画することによって帰属されます。これは、継続的なスケーリングされた変数の行列または離散分布のマトリックスのいずれかのために動作します。

その他の推定補完方法:

  • パッケージmissMDAは、複数のコレスポンデンス分析(MCA)によって、主成分分析(PCA)またはカテゴリ変数によって、不完全な連続変数を代入することができます。
  • パッケージmice(関数mice.impute.pmm())と、パッケージHmisc(関数aregImpute())の予測平均は補完にマッチすることができます。
  • パッケージVIMは、適切なプロット方法を使用して欠損値の構造を視覚化することができます。また、グラフィカル・ユーザー・インタフェースが付属しています。

統計的開示制御

統計機関や他の機関からのデータは、主に機密その生の形式であり、データプロバイダは、情報の損失の最小量を保証することにより統計単位を再同定することができない両方の元のデータを変更することによって、機密性を確保しなければならない。

  • パッケージsdcMicro、公開および科学用ファイルを生成するために、すなわち、機密(マイクロ)データの生成のために使用することができる。パッケージには、グラフィカル・ユーザ・インタフェースが付属しています。
  • パッケージsdcTableは、機密(階層)の表形式のデータを提供するために使用することができる。それはHITASとHYPERCUBEテクニックが含まれており、(大量の)線形プログラムを解くための線形計画パッケージRglpkとlpSolveAPIを使用しています。

季節調整

一般的な時系列の方法論のために我々はTimeSeriesタスクビューを参照してください。

  • 時系列の分解は関数decompose()して行う、以上の基本データパッケージから両方の関数のstl()を使用して進めることができる。分解はまた、統計パッケージに記載されているStructTS()関数でも可能です。
  • 多くの強力なツールがパッケージx12x12GUIやパッケージseasonalを介してアクセスすることができます。x12は、最初にインストールしなければならないX12 binaries用のラッパー関数を提供しています。これは、複数の時系列のバッチ処理のためのS4クラスインターフェースを使用する。x12GUIはX12-ARIMA季節調整ソフトウェア用のグラフィカル・ユーザー・インターフェースを提供します。あまり機能がなく、SEATSの支援を受けてスペックは、パッケージseasonalでサポートされています。
  • 調査型の予測では個々の予測の大きなプールがあるため、GeomComb パッケージの予測組み合わせ技術が役立ちます。 また、時系列の欠損値も処理できます。

統計レコードのマッチング

  • パッケージStatMatchは、一般的な変数の数を共有する2データソース間の統計的なマッチングを行うための機能を提供します。これは、尤度取り組みとを介して、またはホットデッキを介して2つのデータソースとのマッチング後に設定する合成データを作成します。
  • パッケージRecordLinkageは、リンクやデータセットを重複除外するための機能を提供します。
  • パッケージMatchItは最近傍マッチング、完全一致、最適なマッチングと他の一致方法の中で、完全なマッチングを可能にする。二つのデータセットが一致しなければならない場合、データは各観測のメンバーシップについての情報を含む因子変数を含む一つのデータフレームとして来なければならない。
  • パッケージstringdistは編集(damerau-レーベンシュタイン、ハミング、レーベンシュタイン、最適な文字列の配置)、qgrams(Q-グラム、コサイン、ジャカードの距離)またはヒューリスティックメトリック(JARO、JARO-ウィンクラー)に基づいて、さまざまな文字列の距離を計算することができます。

小面積の推定

  • パッケージrsaeは、最尤(ML)または強固なMLによる基本単位レベルの小面積の推定(SAE)モデル(別名ネストされたエラー回帰モデル)のパラメータを推定するための関数が用意されています。推定されたパラメータに基づいて、エリア別の手段の強固な予測は(含むMSE推定値を、パラメトリック・ブートストラップ)が計算されます。現在のバージョン(RSAE0.4-X)は、カテゴリ独立変数を許可しません。
  • パッケージnlmeはガウス線形および非線形混合効果モデルに合わせて機能を提供し、lme4は線形および一般化線形混合効果モデル、小面積の推定に使用されるの両方に合わせて機能を提供します。
  • hbsaeパッケージには、基本領域または単位レベルのモデルに基づいて、小面積の推定値を計算するための関数が用意されています。モデルは、制限された最尤法を使用して、または階層ベイズの方法で適合している。補助情報は、どちらのカテゴリ変数から生じるカウントまたは連続母集団情報からの手段とすることができる。
  • 一般化回帰(GREG)とユニット・レベルのパッケージJoSAE点と分散推定と経験的最良線形不偏予測EBLUP推定量は、ドメインレベルで行うことができます。それは基本的に、基本的なランダム効果モデルを適合させるために使用されているnlmeパッケージにラッパー関数を提供します。

指標とインジケータとインジケータの可視化

  • パッケージlaekenは、人気のリスクの貧困と不平等の指標(アット・リスク・オブ・貧困率、五分位の分担率、相対中央値、リスク・オブ・貧困ギャップ、ジニ係数)を推定するための関数が用意されています。また、パレート分布のテールモデリングのための標準で堅牢な方法は、このような所得の変数などの継続的な単変量分布からの指標のセミパラメトリック推定のために提供されています。
  • パッケージconvey は、ジニ係数、アトキンソンインデックス、貧困リスク閾値、およびその他多くでのsurvey パッケージによって作成された、よく知られた線形化および複製ベースの設計を使用して、所得の集中と貧困の 指標に分散を推定します。
  • パッケージineqは、さまざまな不平等対策(特にジニ、タイル、エントロピー)、濃度を測定(ハーフィンダール、ローゼンブルース)、貧困対策(ワット、セン、SST、およびフォスター)を計算する。また、経験と理論のローレンツ曲線だけでなく、ペンのパレードを計算し、描画します。それは、(これらはのみREP(x、weights)を介してエミュレートすることができる)直接サンプリングの重みに対処するために設計されていません。
  • パッケージIC2は3不平等指数が含まれています:拡張ジニ、アトキンソンと一般化エントロピー。これは、サンプリングの重みを扱うことができますし、サブグループ分解がサポートされています。
  • パッケージmicEconから関数priceIndex()はパーシェ、フィッシャーとラスパイレス価格指数を推定することができます。
  • パッケージtmapはchoroplethsバブルマップのような主題図を作成するレイヤーベースの方法を提供しています。
  • パッケージrworldmapには、独自のデータを視覚化してユーザーをサポートし、データを参照されている国をマッピングする方法を概説する。例としては、例えば、与えられている、世界の銀行や国連のためにマッピングされます。また、マップを視覚化するための新しい方法を提供します。

マイクロシミュレーション

  • simPopパッケージを使用して、モデルベースの方法または合成再建法と補助データに基づいて、調査の集団をシミュレートすることができる。Hiercharicalと(例えば、家庭等)のクラスタ構造は方法が複雑なサンプルの設計に基づいて収集されたサンプルのために考慮したと同様に考えることができる。キャリブレーションツール(反復比例フィッティング、反復比例更新)と組合せ最適化ツール(焼きなまし)もご利用いただけます。コードは、高速の計算のために最適化されています。このパッケージはS4クラスの実装に基づいてた。シミュレートされた集団は、マイクロシミュレーション研究のための基礎データとして役立つことができる。
  • MicSimパッケージはmicrosimulationsためのメソッドが含まれています。与えられた初期集団、死亡率、離婚率、婚姻率、教育の変化などとその遷移行列を定義することができ、人口の未来の状態のシミュレーションに含まれています。パッケージは、コンパイルされたコードが含まれていませんが、並行してマイクロシミュレーションを実行するための機能が提供されます。
  • パッケージsmsは、与えられた領域ベースのマクロデータからミクロデータをシミュレートする機能を提供します。シミュレーテッドアニーリングは最高のエリアの利用可能な記述を満たすために使用されている。計算問題については、計算は並列モードで実行することができます。
  • パッケージsynthpopは、与えられたデータからの合成データをシミュレートするために、回帰ツリー法を使用している。これは、データ(たとえば家庭など)が階層的クラスタ情報を持たない場合に、データが複雑なサンプル設計で収集していない場合と同様に合成データを生成するのに適している。
  • 小面積推定のコンテキストでデータのシミュレーションのためのパッケージsaeSimツール。

追加パッケージと機能

様々な追加パッケージは、公式統計と調査方法で有用な特定の機能を提供して利用できます。

データのインポートとエクスポート:

  • パッケージSASciiはread.fwf.callの引数に解析、変換した唯一のSAS入力スクリプトを使用してRに直接ASCIIファイルをインポートします。データをインポートするためのSASのスクリプトが既に利用しているときには、便利です。
  • foreignパッケージは、SAS XPortの(関数read.xport())、Stata(関数read.dta())、SPSS(関数read.spss())および様々な他のフォーマットからデータを読み出すためのツールが含まれています。これは、関数write.foreign()を参照して、様々なフォーマットへのファイルの書き込みに設備などが充実しています。
  • また、パッケージhaven は、SAS、Stata、およびSPSS(function read.spss())ファイルをインポートおよびエクスポートします。 このパッケージは、重いデータセットを読み込むために効率的であり、高度な方法で変数と値のラベリングを処理します。
  • また、パッケージHmiscはSPSS(関数spss.get())またはStata(関数stata.get())からデータセットを読み込むためのツールを提供します。
  • pxRパッケージには、その(多次元)テーブルの普及のため、世界中の様々な統計組織によって使用されるPCの軸ファイルを読み書きするための関数のセットを提供します。
  • パッケージprevR、それの関数import.dhs()で直接人口動態保健調査からのデータをインポートすることが可能となる。
  • パッケージquestionrから関数describe()は、foreignやmemiscパッケージとインポートされたラベルが含まれている場合があり、データセットの変数を記述します。

サンプリング技術:

  • パッケージsamplingbookはGoeran Kauermann and Helmut Kuechenhoff (2010)による本「Stichproben. Methoden und praktische Umsetzung mit R」からのサンプリング手順が含まれています。
  • パッケージSDaAは、Lohr, S. (1999) 「Sampling: Design and Analysis, Duxbury」からの結果を再現するように設計され、本書のデータセットが含まれる。
  • samplingVarEstの主な貢献は、不均等な確率で1または2段階設計の分散推定のためのジャックナイフの選択肢である。
  • パッケージTeachingSamplingは、有限集団におけるサンプリング設計やパラメータ推定のための機能が含まれています。
  • パッケージmemiscは調査データ、グラフィック、シミュレーションを管理するためのツールが含まれています。
  • パッケージodfWeave.surveysurveyパッケージのodfWeaveのサポートを提供します。
  • パッケージspsurveyは等しく、不等確率(層別)サンプリングのための空間調査設計と分析のための施設が含まれています。
  • FFDパッケージは、病気からの自由を立証するために調査のために群れで暮らす動物の個体群の最適なサンプルサイズを計算するように設計されています。サンプルサイズを推定する基準は考慮疾患だけでなく、不完全な診断テストの群れレベルのクラスタリングを取ると、2段階の設計に基づいてサンプルを選択します。包含確率を推定する際に考慮されていません。パッケージは、同様に、グラフィカルユーザインタフェースを提供する。
  • mipfp は、ターゲット周辺表を与えられたn次元配列を比較する多次元反復比例フィッティングを提供します。
  • パッケージMBHdesign は、研究領域内の一連の(連続した)潜在的サンプリング場所から空間的にバランスのとれたデザインを提供します。
  • パッケージquantification は、定性的調査データを定量化するためのさまざまな機能を提供します。 これはCarlson-Parkin法、回帰法、均衡法、条件付き期待法をサポートしています。
  • BIFIEsurvey は、(例えば、ブートストラップからの)複製重量を含むデータを含む、教育評価における調査統計のためのツールが含まれる。
  • surveybootstrap は、複雑な調査データを使用してサンプリングのばらつきを見積もるためのさまざまな種類のブートストラップを使用するためのツールが含まれています。
  • パッケージsurveyoutliers は、関心のある変数の値をwinsorizeします。
  • パッケージRRTCS は、複雑な調査のためのランダム応答テクニックが含まれています。
  • パッケージpanelaggregation は、ビジネス傾向調査データ(および他の定性調査)を様々な集約レベルで時系列に集計します。
  • パッケージsurveydata を使用すると、アンケートからのメタデータの追跡が容易になり、特定の質問を含む列を簡単に抽出できます。
  • RcmdrPlugin.sampling には公式統計調査でのサンプリングツールが含まれています。 サンプルサイズを計算し、さまざまなサンプリングデザインを使用してサンプルを選択するためのツールが含まれています。
  • パッケージmapStats は、色分けされたマップ上の測量データ統計の自動計算と可視化を行います。
R言語 CRAN Task View:政府統計&調査の方法

One thought on “R言語 CRAN Task View:政府統計&調査の方法

Comments are closed.