CRAN Task View: Statistics for the Social Sciencesの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載した。

Maintainer: John Fox
Contact: jfox at mcmaster.ca
Version: 2016-08-18

社会科学者は社会科学に固有のものではありません。ほとんどが統計的方法の広い範囲を使用します。実際に、社会科学の中で最も統計的データ解析は、標準のRの配布の一部である基本機能と推奨パッケージでカバーされています。 以下のパッケージの説明では、私は最初の言及で基本および推奨パッケージを特定します。 特に「推奨」または「R-base」として識別されていないパッケージは、貢献パッケージです。

その他の関連タスクビュー:

基本と貢献パッケージ以外に、一般的に社会科学で用いられる方法の多くは、次のような他のCRANタスクビューに広くカバーされています。 他のタスクのビューに存在する重複情報を最小化して、アルファベット順で表示します。

  • Bayesian :混合効果モデルを含む社会科学者への関心のさまざまな設定でのベイズ推定の方法。
  • EconometricsFinance :エコノミストや金融アナリストに固有の関心の方法に加えて、これらのタスクビューは、一般的に使用される回帰モデルと方法、操作変数推定、パネルデータのモデル、およびいくつかの時系列モデルの様々なカバーしています。
  • MetaAnalysis :主な研究の結果を結合するためのメタ分析の方法。 各試験における個体のデータが利用可能である場合、メタ分析は、mixed-effects models を用いて行うことができます。
  • Multivariate :幅広い、もしこれまで網羅から、統計モデルへのデータの視覚化から、多変量データの分析、多変量カテゴリカルデータのためのコレスポンデンス分析を含むためRに実装されたメソッドのカタログ。
  • OfficialStatistics :公式統計だけでなく、survey パッケージのような複雑なサンプル調査からのデータを収集、分析するための方法をカバーしています。
  • Psychometrics :広範囲に、構造方程式モデリングなどの社会科学への関心の他のトピックと共に項目応答理論、多次元スケーリング、古典的テスト理論など、スケールの構成の方法を、カバーしています。
  • Spatial :空間回帰分析を含む、空間データのモデリング、可視化、管理するための方法。
  • SpatioTemporal :時間と位置の両方の情報をデータ分析、可視化、表現するための方法。
  • Survival :推奨survival パッケージに含まれたCox回帰のためのような基本的、標準的を越えて、生存分析のための方法(多くの場合、社会科学における「イベント履歴分析」と呼ばれます)。
  • TimeSeries :時系列の回帰法を含む時系列データをモデリング、可視化、操作、表現するための方法。

この列挙はCRANタスクビューの約3分の含まれていることは注目に値します。また、社会科学者への潜在的な関心のある他のタスクのビューがあります(このような統計的なGraphics グラフィックタスクビューなど) 。 私はあなたがlist of all task views on CRAN を見ることを提案します。

線形および一般化線形モデル:

単変量および多変量線形モデルは、R-基本statsパッケージに、glm関数による一般化線形モデル、lm関数で適してしています。 lmとglmオブジェクトに対してsummaryおよびplotの方法以上に、これらのオブジェクトをサポートする幅広い関数配列があります。

  • statsパッケージの一般的なanova関数は、乖離表の分析および分散の連続(「I型」)分析を構築します。 また、Fおよびネストされたモデルのカイ二乗尤度比検定を計算することができます。 (回帰係数を返すようなcoef、係数共分散行列のためvcov 、残差、応答の近似値に適合などの他の標準的なジェネリクスのための方法と共にだけでなく分散分析の方法を持っていることは、Rにおける統計モデルの他のクラスの典型的なものです。 )car パッケージ(associated with Fox and Weisberg, An R Companion to Applied Regression, Second Edition , Sage, 2011) の一般的な分散分析関数は、線形、一般化線形、および回帰モデルの他の多くのクラスのための部分的なテスト、いわゆる「タイプII」と「タイプIII」を構築しています。
  • 様々な仮設に対してカイ二乗Wald検定とFは、car パッケージのlinearHypothesis関数およびlmtest パッケージのcoeftestとwaldtest関数から利用できます。 これらの関数のすべてが、sandwichcar のパッケージの関数により、例えば、計算などの不均一と不均一/自己相関一貫性の共分散行列の使用を可能にします。 またgmodels パッケージのglh.test関数を参照してください。 パラメータの非線形関数は、car パッケージのdeltaMethod関数によって検定することができます。 multcomp パッケージには、多重比較のための関数が含まれています。 pscl パッケージのvuong関数は、一般線形およびいくつかの他のモデルのための非ネストされた仮説を検定します。 また、線形および一般化線形モデルの検定のためのrms パッケージを参照してください。
  • 標準Rの分布は、例えば、ハット値や、スチューデント化残差とクックの距離(hatvalues、rstudent、cooks.distanceはすべてstatsパッケージにある)として削除統計を含む、 線形および一般化線形モデル「diagnostics」のための優れた基本的な機能を提供しています。 これらは、他のパッケージによって増強されます。
    • グラフィカルな方法を強調するcar パッケージのいくつかの関数。(一般的な)分散拡大要因に対してvifのような数値診断に加えて、 例えば、(中でも)追加変数プロットに対してavPlots、コンポーネントプラス残差プロットに対してcrPlots。
    • SIR、SAVE、pHdを含む回帰の次元削減に対してdr パッケージ。
    • さまざまな診断テスト(例えば、不均一、非線形性、および自己相関 )を実装しているlmtest パッケージ。
    • forward パッケージには、「前方検索」(Atkinson and Riani, Robust Diagnostic Regression Analysis, Springer, 2000 )に基づいて診断を実装しています。
    • 他の共線性の診断は、perturb パッケージに含まれています。
    • 診断はまた、rms パッケージに記載されています。
    • 混合効果モデルの影響力データの診断のためのinfluence.ME パッケージを参照してください。
  • いくつかのパッケージがデータに適合している線形および一般化線形モデルを解釈するために有用な機能が含まれています。
    • qvcalc パッケージは、線形と一般化線形モデル(より一般的)の要因のための「準分散」を計算します。
    • effects パッケージは、例えば、線形、一般化線形、多くの他の回帰モデルに対して「調整平均」を含む効果表示を構築します。
    • 診断部分残差プロットは線形および一般化線形モデルのために利用可能です。
    • 同様に、やや少ない一般的な場合のプロットはvisreg パッケージでご利用いただけます。
    • lsmeans は、線形、一般化線形、混合モデルに対して、および仮説検定のための準備を含む、いわゆる「最小二乗手段」を実装しています。
    • Zelig のパッケージには、(“Collections” を参照)の統計モデルの多くの種類のサマリーが表示を作成します。

カテゴリとカウントデータの解析:

二項ロジットとプロビットモデルと同様に、ポアソン回帰や分割表(「過分散」二項およびポアソンデータのためのモデルを含む )のための対数線形モデルは、statsパッケージのglm関数で適合できます。 過分散データに対して、aod パッケージ、dispmod パッケージ、負の二項GLMSをもつ推奨されるMASS パッケージ(associated with Venables and Ripley, Modern Applied Statistics in S, Fourth Ed. , Springer, 2002 )のglm.nb関数を参照してください。pscl パッケージには、データをカウントするためのハードル回帰モデルとゼロ拡大に適合するのための機能が含まれています。 多項ロジットモデルは、MASSパッケージのpolr関数による順序ロジットとプロビットモデルと、推奨されるnnet パッケージでmultinom関数により適合しています。 また、多項ロジットモデルのmlogit 、多項プロビットモデルのMNP パッケージ 、過分散多項データの分析のためのmultinomRob パッケージを参照してください。 VGAM パッケージは、順序、非順序カテゴリカル応答のためのカウントデータのモデルを含む、 統一されたフレームワーク内での固定効果回帰モデルの非常に様々なフィッティングが可能です。

カテゴリカルカウントデータを分析するための他の注目すべき機能があります。

  • R-base標準パッケージのtable関数、statsパッケージのxtabsとftable関数は、分割表を構築します。
  • statsパッケージのchisq.testとfisher.testは、2要因分割表の独立性を検定するために使用することができます。
  • MASSパッケージのloglmとloglin関数は、前者はglmのフロントエンドとして、後者は反復比例適合により、分割表に階層的対数線形モデルを適合します。
  • 二項応答GLMs(便利、例えば、完全分離の場合)におけるバイアス削減に対してbrglmlogistfパッケージ、ロジスティック回帰で正確な条件推論を近似するelrm パッケージ、対数線形モデルの正確な検定のためのexactLoglinTest パッケージ、条件付きロジスティック回帰についてのsurvival パッケージのclogit関数、モザイクプロットを含むカテゴリデータのグラフィカル表示のためのvcd パッケージを参照してください。
  • gnm パッケージは、一般化非線形モデルを推定し、例えば、モビリティテーブルに特定の専門的なモデルに合うように使用することができます。 logmult パッケージは、対数乗法(例えばUNIDIFF )及び関連(例えばGoodman’s RC )モデルに合わせてgnm に基づいて便利な機能を提供します。 また、正方形テーブルのために様々な特殊なモデルを推定するためのcatspec パッケージを参照してください。
  • 前述したように、Multivariate タスクビューは、多変量カテゴリカルデータの対応分析をカバーしています。
  • 率及び割合に関するデータのベータ回帰のbetareg パッケージを参照してください、ここでは、密接にカテゴリデータに関連付けられています。

他の回帰モデル:

other task views で広範囲にカバーされたものに加えて、貢献されたパッケージでより非常に多様なモデル、baseと推奨されたパッケージによって提供される機能で非常に多様な回帰モデルを適合することが可能です。

  • 非線形回帰: statsパッケージのnls関数は、最小二乗によって非線形モデルに適合します。 nlstools は、nlsにより適合モデルを評価するためのいくつかの機能が含まれています。
  • 混合効果モデル: 線形(lme)と非線形(nlme)混合効果モデルに適合するPinheiro and Bates, Mixed-Effects Models in S and S-PLUS (Springer, 2000) に関連する推奨されるnlme パッケージは、一般的に、階層と縦データのための社会科学で使用されます。 一般化線形混合効果モデルは、MASS パッケージのglmmPQL関数、または(好ましくは)lme4 パッケージのglmer関数が適しています。 lme4 パッケージは、主にそのlmer関数により、線形混合モデルのnlme を取り替えます。 LMEとは異なり、lmer、lmerは、交差ランダム効果をサポートするが、自己相関または不等分散個体レベルのエラーをサポートしていません。 またlmeSplineslmm 、及びMCMCglmm パッケージを参照してください。
  • 一般化推定方程式: geegeepack パッケージが一般化推定方程式による限界モデルに適しています。 相関名目または序多項応答のモデルのGEE推定のためのmultgee パッケージを参照してください。
  • ノンパラメトリック回帰分析: これはRの目立った強みの一つであります。 標準Rの分布はstatsパッケージにloess.smoothとsmooth.splineの両方を含む散布図を平滑化するためのいくつかの機能が含まれています。 また、統計パッケージで、loess関数は、局所的多項式回帰により、シンプルで複数のノンパラメトリック回帰モデルに適します。 一般化加法モデルは、推奨されるmgcv パッケージとgam パッケージを含む、いくつかのパッケージでカバーされています。 後者は、HastieとTibshirani、Generalized Additive Models (Chapman and Hall, 1990) に関連する。またVGAM パッケージを参照してください。 この領域の他のいくつかの注目すべき貢献されたパッケージ次の通りです。
    • スプライン回帰に適するgss
    • 局所的多項式回帰(と密度推定 )のためのlocfit (Loader, Local Regression and Likelihood, Springer, 1999)
    • 回帰を含め、平滑化の様々な技術のためのsm (Bowman and Azzalini, Applied Smoothing Techniques for Data Analysis, Oxford, 1997)
    • 混合データタイプのカーネル平滑化メソッドを実装しているnp
    • 回帰における被説明および説明変数のACE(交互の条件付き期待値) とAVAS(加法及び分散安定化) ノンパラメトリック変換のためのacepack
  • 分位回帰: 線形、非線形、およびノンパラメトリック分位回帰するための方法が広くquantreg パッケージで提供されています。
  • 回帰スプライン: base-Rのsplinesパッケージでサポートされるパラメトリック回帰スプラインは(ノンパラメトリック平滑化スプラインとは対照的に) 、モデル式を採用する他の統計モデリング関数とlm、glmによって使用することができます。 bs(B-spline)とns(natural spline)関数を参照してください。
  • 非常に大規模なデータセット: biglm パッケージは、メモリに収まる大規模なデータセットに線形、一般線形モデルに適用することができます。

その他の統計的方法:

ここでは一般的に社会科学者によって使用される他の統計的手法の研究における実装の概略調査です。

  • 欠損データ: いくつかのパッケージは、Shafer, Analysis of Incomplete Multivariate Data (Chapman and Hall, 1997) に関連した(顕著なエージング)mixnormpan パッケージと、より新しくより積極的にメンテナンスされているAmeliamimicemitools パッケージ(後者は多重帰属データセットから推論を描画するため)を含む、多重帰属によって欠損データを扱うためのメソッドを実装します。下の“Collections” で説明する一般的なHmisc パッケージの欠損データ帰属のためのいくつかの機能もあります。 mvnmle パッケージは、平均および多変量正規データを想定した共分散の最尤推定値を検索します。 同様に、Psychometrics タスク・ビューで議論する構造方程式モデリングソフトウェアの一部が欠落しているデータと回帰モデルの最尤推定が可能です。 VIM パッケージは、欠損値と帰属値を可視化するための機能を備えています。
  • ブートストラップおよびその他のリサンプリング方法: Davison and Hinkley, Bootstrap Methods and Their Application (Cambridge, 1997) に関連した推奨されるパッケージboot は、ブートストラップのための優れた機能といくつかの関連した方法を持っています。 また、注目すべきは、ブートストラップやジャックナイフのための機能を持っている Efron and Tibshirani, An Introduction to the Bootstrap (Chapman and Hall, 1993) に関連したbootstrap パッケージです。 さらに、car パッケージのBootおよびbootCase関数、nlstools パッケージのnlsBoot、他にsimpleboot パッケージも参照してください。
  • モデルの選択: statsパッケージのstep関数およびMASS パッケージのより広範囲に適用可能なstepAIC関数は、様々な統計モデルに対して前方、後方、前後方のステップワイズ選択を実行します。leaps パッケージのregsubsets関数は、すべてのサブセット回帰を実行します。 BMA パッケージは、ベイズモデルの平均化を行います。 標準のAICとBIC関数もモデル選択に関連しています。 これらのパッケージや機能を加えて、MachineLearning タスク・ビューを参照してください。
  • ソーシャルネットワーク分析: ソーシャルネットワークの分析に有用ないくつかのパッケージがあります。
    • ネットワークのソシオメトリー分析(例えば、ブロックモデリング)のsna
    • ネットワークオブジェクトを描画、操作するためのnetwork
    • ネットワークの潜在位置やクラスターモデルのlatentnet
    • ネットワークの指数ランダムグラフモデルのergm
    • statnet project に関連した「メタパッケージ」statnet
    • また、縦社会ネットワーク分析のためのRSienaPAFit パッケージを参照してください。
    • multiplex パッケージは、複数のソーシャルネットワークの分析のための代数的な手順を実装しています。
  • 傾向スコアマッチング: MatchingMatchItoptmatchPSAgraphics パッケージとarm パッケージ(Gelman and Hill, Data Analysis Using Regression and Multilevel/Hierarchical Models, Cambridge, 2007) のmatching関数を参照してください。
  • 人口統計学的方法: demography パッケージは、死亡率、受精率、および移民を分析するためと、人口予測のために、生命表を構築するための機能が含まれています。

機能コレクション:

社会科学者にとって関心のある関数(複数ドメインの典型)を含む、分類が困難なとても不均一である、いくつかのパッケージがあります。

  • すでに、Venables and Ripley’s Modern Applied Statistics With S に関連した推奨されるMASS パッケージには、いくつかの言及をしました。 この書籍に関連する他の推奨パッケージは、ニューラルネットワーク(しかしまた、上述したように、多項ロジスティック回帰モデル)に適したNNET、空間統計のためのspatial 、 分類のための関数を含むclass です。
  • また、回帰分析、データ探索、及びデータ変換をサポートする様々な機能を有している Fox and Weisberg, An R Companion to Applied Regression, Second Edition に関連したcar パッケージを述べました。
  • Harrell, Regression Modeling Strategies, Second Edition (Springer, 2015) に関連したHmiscrms パッケージ(両方とも上記) は、データ操作、線形モデル、ロジスティック回帰モデル、および生存分析、それらの多くの「フロントエンド」またはRに他の機能の改良のための関数を提供しています。
  • Zelig パッケージは、社会科学者にとって関心のある統計モデルの広い配列を統合しています(詳細はZelig web site を参照してください)。

謝辞:

Jangman Hongは、様々な具体的な提案をしてくれた他者として、このタスクビューの一般的な改正に貢献しました。

引用した他のタスクビューでカバーされていない重要な何かを省略している場合、または、新しいパッケージや関数を言及すべき場合は、お知らせください(please let me know )。

このタスクビューのコンパイルは、カナダの社会科学と人文科学研究会からの助成金によって部分的にサポートされていました。

関連する記事

R言語 CRAN Task View:社会科学の統計

One thought on “R言語 CRAN Task View:社会科学の統計

Comments are closed.