CRAN Task View: Multivariate Statisticsの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載した。

Maintainer: Paul Hewson
Contact: Paul.Hewson at plymouth.ac.uk
Version: 2015-07-01

ベースRはどこかで、古典的な多変量解析のためのほとんどの機能が含まれています。この方法論を拡張CRAN上の多数のパッケージがあり、簡単な概要を以下に示す。多変量統計のアプリケーション固有の用途は、主成分がここにリストされている一方で、たとえば、コーディネーションがEnvironmetricsタスクビューで覆われているため、関連するタスクビューに記述されている。教師付き分類の詳細については、MachineLearningタスクビューで発見され、Clusterタスクビューで分類から目することができます。

このビューのパッケージは、大きく以下のトピックに構造化することができる。あなたには、いくつかのパッケージがリストにないと思われる場合、私に知らせてください。

多変量データをビジュアルに

  • グラフィックスの取扱い:基本グラフィックス(例えばpair()とcoplot())とlattice機能(例えばxyplot()とsplom())の範囲は、2次元の散布図、雲や3次元密度の対の配列を視覚化するのに便利である。carでのscatterplot.matrixは有用に強化されたペアごとの散布図を提供しています。これを超えると、scatterplot3dは、3次元の散布図を提供し、aplpackはbagplots、3D雲を回転させるための機能spin3R()、を提供しています。rgl依存するmisc3dは、密度を視覚化するのに便利なRにアニメーション化された機能を提供します。YaleToolkitは、多変量データのための有用な視覚化技術を幅広く提供しています。より専門的な多変量プロットは、次のものがあります。aplpack中のfaces()はChernoffのfacesを提供しています。MASSからparcoord()は、平行座標プロットを提供します。グラフィックスのstars()は、それぞれスター、レーダーやクモの巣プロットを選択できます。veganでのade4、spantree()とmstree()は最小スパニングツリー機能を提供します。calibrateはバイプロットと散布図の軸ラベルをサポートします。qhullライブラリへのインターフェースを提供するgeometryは、convexhulln()経由で関連ポイントにインデックスを提供します。ellipseは2つのパラメータの楕円を描画し、相関行列の視覚的な表示plotcorr()を提供します。denproは多変量視覚化のためにレベルセットの木が用意されています。モザイクプロットはまた、多変量カテゴリカルデータのための他の可視化技術が含まれているvcdのmosaic()やグラフィックスのmosaicplot()を経由して利用できます。gclusは散布図とパラレル座標プロットのクラスタの特定のグラフィカルな多くの拡張機能が用意されています。GGobiへの参照のためのリンクを参照してください。rggobiはGGobiとインターフェースで接続する。xgobiはダイナミックな多変量プロットだけでなく、射影追跡をリンクできるXGobiとXGvisプログラムへインタフェースで接続する。最後に、iplotsは対話並列座標プロットとモザイクプロットは非常に有益な可能性のうち、特に強力なダイナミックかつインタラクティブなグラフィックなグラフィックスを可能にする。系列下法は、行列とデンドログラムの順序を変更することができるseriationで提供されています。
  • データの前処理:Hmiscのsummarize()とsummary.formula()はわかりやすい機能を支援する;dataRep()とfind.matches()は代表性やマッチ検索の観点から与えられたデータセットの探索を支援しながら、同じパッケージvarclusから変数のクラスタリングを提供しています。cluster内のdaisy()、ベース内のdist()は距離尺度の広い範囲を提供しながら、proxyは行列間措置を含むより多くの距離測定のためのフレームワークを提供します。simbaは、類似度行列や整形などの存在/不在のデータを扱うための関数が用意されています。

仮説検定

  • ICSNPはHotellingsのT2テストだけでなく、位置の限界ランクに基づく試験、空間の中央値と空間兆候計算、形状の推定値を含むノンパラメトリック検定の範囲を提供します。2つのノンパラメトリックサンプルテストは、cramerからも利用可能です。ロケーションを調査するための空間符号とランクテスト。真球度と独立性はSpatialNPで利用できる。

多変量分布

  • 記述的対策:statsのcov()またはcor()は、それぞれ共分散および相関行列の推定値を提供する。ICSNPは、スキャッターの推定値を提供する更なる機能と空間の中央値の推定値を提供するspatial.median()など、いくつかの説明的な対策を提供しています。さらに堅牢な方法は、最小体積の楕円体、最小共分散行列式やクラシックの積による分散共分散行列のロバスト推定値を提供してMASSのcov.rob()として提供されています。covRobustは最近傍分散推定を経由して強固な共分散推定を提供しています。robustbaseはcovOGK()経由Gnanadesikan-Kettenringの直交化ペアごとの推定とcovMCD()で高速最小共分散行列式を通じて強固な共分散推定を提供しています。スケーラブル堅牢な方法は、covMcd()で高速最小共分散行列式だけでなく、covMest()でM-推定量を使用するrrcov内に設けられている。corpcorは、大規模な共分散の収縮推定と(部分的)相関行列を提供しています。
  • 濃度(推定とシミュレーション):MASSのmvnorm()は、多変量正規分布からシミュレートします。mvtnormも多変量正規分布の多変量t分布と多変量正規分布だけでなく、密度関数の両方のシミュレーションだけでなく、確率と分位の機能が用意されています。mnormtは多変量正規および多変量T密度や分布の関数だけでなく、乱数シミュレーションを提供します。snは、多変量スキューノーマルとスキューt分布のための密度、分布と乱数生成を提供します。deltはCARTと貪欲な方法による多変量密度を推定するための機能の範囲を提供します。混合に関する総合的な情報はClusterビューに与えられている、いくつかの密度推定値と乱数はksのdmvnorm.mixt()とrmvnorm.mixt()によって提供され、フィッティング混合はまたbayesm内に設けられている。ウィシャート分布からシミュレートする機能は、MCMCpack(後者はまた密度関数dwish()を持っている)のrwish()、bayesmのrwishart()のような場所の数で提供されています。KernSmoothからbkde2D()とMASSからkde2d()はビン化と非ビン化2次元のカーネル密度推定を提供し、ksashGenKernのような多変量カーネル平滑化を提供している。primは、高次元の多変量データ高密度の領域を見つけることを試みるために、患者規則帰納方法を提供し、featureも(例えば、局所モードとの関係のように)多変量データ内の特徴的有意性を決定するための方法を提供する。
  • 評価する正常:mvnormtestはシャピロ・ウィルクス・テストへの多変量拡張を提供し、mvoutlierは、強力な方法に基づいて多変量外れ値検出を提供します。ICSは、マルチ正規のテストを提供します。energyのmvnorm.etest()は、E統計(エネルギー)に基づく正規性の評価を提供する;同じパッケージのk.sample()が同じディストリビューションのサンプル数を評価する。ウィシャート分布し、共分散行列のテストは、statsにおいてmauchly.test()で与えられる。
  • コピュラ:copulaは、一般化されたアルキメデスコピュラを提供するnormal、t、Clayton、Frank、Gumbel、fgacを含むコピュラ(楕円形とアルキメデス)の範囲のためのルーチンを提供しています。

線形モデル

  • statsから、lm()(従属変数として指定されたマトリックスを含む)は多変量線形モデルを提供し、anova.mlm()は多変量線形モデルとの比較を提供する。Manova()はMANOVAを提供しています。snは多変量スキュー正常および多変量スキューTモデルに合わせているmsn.mle()とmst.mle()を提供している。plsは、部分最小二乗回帰(PLSR)と主成分回帰を提供し、pplsは、減点部分最小二乗法を提供し、drは「save」(スライスされた平均分散推定)や、「sir」(スライスされた逆回帰)などのような次元削減回帰のオプションが用意されています。plsgenomicsはゲノミクスのための分析を部分最小二乗法を提供しています。relaimpoは回帰パラメータの相対的な重要性を調査するための機能を提供します。

投影法

  • 主成分:これらはstatsからprincomp()(S-PLUSとの互換性のためにeigen()に基づく)だけでなく、prcomp()(svd()に基づいて、優先)を取り付けることができる。scaは、単純なコンポーネントを提供します。Hmiscにおけるpc1()は最初の主要なコンポーネントを提供し、スケーリングされていないデータの係数を与えます。paranは保持する次元数のホーンの評価のためのルーチンを提供し、一方、スクリープロットを評価するための追加サポートは、nFactorsに記載されています。広い行列に対して、gmodelsはfast.prcomp()とfast.svd()を提供しています。kernlabはkpca()での非線形の主成分の形を提供するために、カーネル法を使用しています。pcaPPは射影追跡により強固な主要なコンポーネントを提供します。amapは、それぞれacpgen()とacprob()を経由して一般化と堅牢主成分分析の形式のような、さらに堅牢で並列化の方法を提供します。生態環境における主要な構成要素のための更なるオプションがade4内およびSensoMineRにおける感覚の設定で利用できます。psyは、サイコメトリーで有用なルーチンを数多く提供しています。このような状況では、これらは、いくつかの変数が観測されたデータを評価するのに役立つシミュレーション結果を追加するオプションを持っているscree.plotだけでなく、従属を考えてもよい球とFPCA上にマップするsphpcaを含める。PTAkは、PCAとコレスポンデンス分析の両方に主要なテンソル解析analagousを提供しています。smatrはアロメトリーするための特定のアプリケーションに標準化された主軸の推定を提供しています。
  • 正準相関:statsにおけるcancor()は正準相関を提供しています。kernlabはkcca()で堅牢な正準相関を提供するために、カーネル法を使用しています。concorは一致メソッドが多数用意されています。
  • 冗長性分析:calibrateは、冗長解析だけでなく、正準相関のためのさらなるオプションのrda()を提供しています。fsoは線形代数から利用可能なメソッドを超えての調整を拡張するファジィ集合の調整を提供します。
  • 独立したコンポーネント:fastICAは独立成分分析(ICA)と射影追跡を行うためにfastICAアルゴリズムを提供し、PearsonICAはスコア関数を使用しています。ICSは不変座標系または独立したコンポーネントのいずれかを提供します。JADEはJADEアルゴリズムだけでなく、ICAのためのいくつかの診断を提供するインターフェイスを追加します。
  • プロクラステス分析:veganでのprocrustes()はプロクラステス分析を提供し、このパッケージには、領域がEnvironmetricsタスク・ビューに与えられている詳細と調整のための機能を提供している。GPA()を経由して一般化プロクラステス分析はFactoMineRから入手できます。

主要な座標/スケーリング方法

  • statsにおけるcmdscale()は、古典的多次元尺度を提供し、MASSのsammon()とisoMDS()はSammonとKruskalの非メトリック多次元尺度を提供しています。veganは非メトリックMDSのためのラッパーと後処理を提供しています。indscal()はSensoMineRによって提供されます。

教師なし分類

  • クラスター分析:R内で利用可能なクラスタリング方法の包括的な概要は、Clusterタスク・ビューによって提供される。標準的な技術は、statsにおける関数kmeans()によるK-平均クラスタリングとhclust()による階層的クラスタリングを含まれています。確立されたクラスタリングと可視化技術の範囲はclusterでも利用でき、いくつかのクラスター検証ルーチンはclvで提供され、ランド指数はe1071中にclassAgreement()から計算することができる。トリミングされたクラスター分析はtrimclusterから入手でき、クラスタアンサンブルは、clueから入手可能であり、ルーチンの選択を支援するための方法がclusterSimで提供され、ハイブリッド方法論はhybridHclustによって提供される。E-統計に基づいて距離尺度(edist())と、階層的クラスタリング(hclust.energy())は、energyで提供されています。マハラノビス距離ベースのクラスタリング(固定点だけでなく、clusterwise回帰用)は、fpcから提供されています。clustvarselは、モデルベースのクラスタリング内で変数選択を提供しています。ファジークラスタリングは、cluster内だけでなく、hopach(階層秩序パーティショニングと折りたたみハイブリッド)アルゴリズムによって提供されています。kohonenは、高い次元スペクトルまたはパターンを教師ありと教師なしのSONGsを提供しています。clusterGenerationは、クラスタをシミュレートするのに役立ちます。Environmetricsのタスクビューはまた、いくつかのクラスタリング技術の話題に関連する概要を説明します。モデルベースのクラスタリングはmclustで提供されています。
  • ツリー方法:木の方法の完全な詳細はMachineLearningのタスクビューに示されている。分類ツリーは時々多変量内であると考えられることを、ここで言えば十分。rpartは、この目的のために最も使用されている。partyは再帰分割を提供しています。分類および回帰訓練はcaretによって提供される。kknnは回帰並びに分類に使用することができるk最近傍法を提供する。

教師付き分類と判別分析

  • MASS内のlda()とqda()は、それぞれ線形および二次差別を提供する。mdaは、mda()およびfda()だけでなく、mars()での多変量適応的回帰スプラインとbruto()関数での適応型スプラインバックフィッティングで、混合で柔軟な判別解析を提供します。多変量適応的回帰スプラインは、earthで見つけることができます。rdaは、判別分析を正則収縮重心により高次元データの分類を提供しています。パッケージclassは、knn()でK-近傍を提供しています。knncatはカテゴリ変数のためのk最近傍を提供します。SensoMineRは階乗判別分析のためにFDA()が用意されています。パッケージの数は、分類と次元削減を提供する。klaRは変数選択や多重共に対するロバスト性だけでなく、可視化ルーチンの数が含まれています。gplsが一般化部分最小二乗法を用いて、分類を提供し、一方superpcは、教師付き分類のための主要なコンポーネントを提供します。hddplotは、機能の最適な数を決定するために、線形判別計算を交差検定用意されています。ROCRは分類器の性能を評価する方法の範囲を提供します。教師付き分類の詳細については、MachineLearningタスクビューにあります。

対応分析

  • MASSのcorresp()とmca()は、それぞれシンプルで、複数のコレスポンデンス分析を提供する。caはまた、シングルマルチと共同コレスポンデンス分析を提供しています。ade4中のca()およびmca()は、それぞれ対応し、複数のコレスポンデンス分析を提供するだけでなく、hta()で均質な表分析を加える。さらに機能が共同対応がcocorrespから提供され、また、vegan内で利用可能です。FactoMineRも簡単で、複数のcorresondence分析だけでなく、関連するグラフィカル・ルーチンを可能にするca()とmca()を提供しています。homalsは均質性の分析を提供します。

欠測データ

  • mitoolsは多重代入のためのツールを提供し、miceは多変量補完を提供し、mvnmleは欠損値を持つ多変量正規データの最尤推定を提供し、mixは混合カテゴリカルおよび連続データの多重代入を提供しています。panは、パネルデータの欠落のための多重代入を提供しています。VIMは、失われたデータの可視化だけでなく、補完するための方法を提供する。HmiscからaregImpute()とtranscan()は、さらに補完する方法を提供する。monomvnは欠落したデータパターンが単調である推定モデルを取り扱う。

潜在変数のアプローチ

  • statsにおけるfactanalは最尤による因子分析を提供し、ベイズ因子分析は、ガウス、MCMCpackにおける順序および混合の変数のために提供されている。GPArotationはGPA(勾配射影アルゴリズム)因子の回転を提供しています。FAiRは、遺伝的アルゴリズムを用いて解く因子分析を提供しています。semは、線形構造方程式モデルに適合し、ltmは項目反応理論とラッシュモデルへの拡張の範囲の下で潜在特性モデルを提供してeRmに記載されています。FactoMineRは、定量的および定性的データの複数の要因分析のためのADFM()だけでなく、複数の階層の複数の要因分析のためのMFA()とHMFA()などの因子分析法の広い範囲を提供しています。tsfaは時系列に対して因子分析を提供しています。poLCAは結果変数のさまざまな潜在クラスと潜在クラス回帰モデルを提供します。

非ガウスデータのモデル化

  • MNPは、ベイズ多項プロビット・モデルを提供し、polycorはpolchoricと四分相関行列が用意されています。bayesmは、一見無関係回帰、多項ロジット/プロビット、多変量プロビットと操作変数としてモデルの範囲を提供します。VGAMは、Vector一般化線形および付加モデル、縮小ランク回帰を提供しています。

行列操作

  • ベクトルと行列ベースの言語などの、ベースRは、パッケージMatrixSparseMによって補完される行列操作を行うための多くの強力なツールを出荷する。matrixcalcは、行列微分法のための機能が追加されます。さらにいくつかの疎行列機能もspamから入手できます。

その他ユーティリティ

  • abindは配列のためのrbind()とcbind()を一般化し、HmiscでのmApply()は行列のためのapply()を一般化し、複数の機能を渡します。前に示した機能に加えて、snは、疎外、アフィン変換および多変量スキューノーマルとスキューt分布のためのグラフィックスなどの操作を提供します。mArは、ベクターの自動回帰のために用意されています。Hmiscブートストラップからrm.boot()は対策モデルを繰り返した。psyはまた加重措置及び2つ以上の評価者間の合意など、Cohenのカッパに基づく統計の範囲を提供します。cwhmiscは、ellipse()、normalise()、様々な回転関数など、関心のある興味深い支援する機能が含まれています。desirabilityは、多変量最適化のための機能を提供します。geozooはGGobiにおける幾何オブジェクトのプロットを提供しています。

 

関連する記事

  • R言語 CRAN Task View:堅牢な統計的方法R言語 CRAN Task View:堅牢な統計的方法 CRAN Task View: Robust Statistical Methodsの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載した。 Maintainer: Martin Maechler Contact: Martin.Maechler at […]
  • R言語 CRAN Task View:数値解析R言語 CRAN Task View:数値解析 CRAN Task View: Numerical Mathematicsの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載した。 Maintainer: Hans W. Borchers Contact: hwborchers at […]
  • R言語 CRAN Task View:政府統計&調査の方法R言語 CRAN Task View:政府統計&調査の方法 CRAN Task View: Official Statistics & Survey Methodologyの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載した。 Maintainer: Matthias Templ Contact: matthias.templ at […]
  • R言語 CRAN Task View:時系列解析R言語 CRAN Task View:時系列解析 CRAN Task View: Time Series Analysisの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載した。 Maintainer: Rob J. Hyndman Contact: Rob.Hyndman at […]
  • R言語 CRAN Task View:薬物動態データの解析R言語 CRAN Task View:薬物動態データの解析 CRAN Task View: Analysis of Pharmacokinetic Dataの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載した。 Maintainer: Bill Denney Contact: wdenney at […]
R言語 CRAN Task View:多変量統計

One thought on “R言語 CRAN Task View:多変量統計

Comments are closed.