R言語 CRAN Task View：多変量統計 | トライフィールズ

CRAN Task View: Multivariate Statisticsの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載しました。

Maintainer:	Paul Hewson
Contact:	Paul.Hewson at plymouth.ac.uk
Version:	2021-11-19
URL:	https://CRAN.R-project.org/view=Multivariate

ベースRには、古典的な多変量解析の機能の大部分が含まれています。この方法を拡張したCRANには多数のパッケージがありますが、その概要を以下に示します。多変量統計のアプリケーション固有の使用方法は、関連するタスクビューで説明しています。例えば、主要な構成要素がここにリストされています。設定はEnvironmetricsタスクビューでカバーされています。教師付き分類の詳細は、MachineLearningタスク・ビューおよびClusterタスク・ビューの監督されていない分類に記載されています。

このビューのパッケージは、大まかに次のトピックで構成されます。一部のパッケージがリストにないと思われる場合は、私に知らせてください。

多変量データの可視化

グラフィックスの取扱い：
- 基本グラフィックス（例えばpair()とcoplot()）とlattice機能（例えばxyplot()とsplom()）の範囲は、AAAは、2次元散布図、雲および3次元密度のペアワイズ配列を視覚化するのに有用です。
- carのscatterplot.matrixは、有用に強化されたペアごとの散布図を提供しています。
- scatterplot3dは、3次元の散布図を提供します。
- aplpackは、3D雲を回転させるための機能bagplots 、spin3R()を提供しています。
- rglに依存するmisc3dは、密度を視覚化するのに便利なRにアニメーション化された機能を提供します。
- YaleToolkitは、多変量データのための有用な視覚化技術を幅広く提供しています。より専門的な多変量プロットは、次のものがあります。
- aplpackのfaces()は、Chernoffのfacesを提供しています。
- MASSのparcoord()は、平行座標プロットを提供します。
- グラフィックスのstars()は、それぞれスター、レーダーやクモの巣プロットを選択できます。
- ade4のmstree()、veganのspantree()は、最小スパニングツリー機能を提供します。
- calibrateは、バイプロットと散布図の軸ラベルをサポートします。
- qhullライブラリへのインターフェースを提供するgeometryは、convexhulln()経由で関連ポイントにインデックスを提供します。
- ellipseは、2つのパラメータの楕円を描画し、相関行列の視覚的な表示plotcorr()を提供します。
- denproは、多変量の視覚化のためのレベルセットツリーを提供します。
- モザイクプロットは、多変量カテゴリカルデータのための他の可視化技術が含まれているvcdのmosaic()やグラフィックスのmosaicplot()を経由して利用できます。
- gclusは、散布図とパラレル座標プロットのクラスタの特定のグラフィカルな多くの拡張機能が用意されています。
- GGobiへの参照のためのリンクを参照してください。
- xgobiは、ダイナミックな多変量プロットだけでなく、射影追跡をリンクできるXGobiとXGvisプログラムへインタフェースで接続します。
- iplotsは、対話並列座標プロットとモザイクプロットは非常に有益な可能性のうち、特に強力なダイナミックかつインタラクティブなグラフィックなグラフィックスを可能にします。
- 系列下法は、行列とデンドログラムの順序を変更することができるseriationで提供されています。
データの前処理：
- Hmiscのsummarize()とsummary.formula()はわかりやすい機能を支援します;dataRep()とfind.matches()は代表性やマッチ検索の観点から与えられたデータセットの探索を支援しながら、同じパッケージvarclusから変数のクラスタリングを提供しています。
- clusterのdaisy()、ベース内のdist()は、距離尺度の広い範囲を提供します。
- proxyは、行列間措置を含むより多くの距離測定のためのフレームワークを提供します。

仮説検定

ICSNPは、HotellingsのT2テストだけでなく、位置の限界ランクに基づく試験、空間の中央値と空間記号計算、形状の推定値を含むノンパラメトリック検定の範囲を提供します。
- 2つのノンパラメトリックサンプルテストは、cramerからも利用可能です。
- SpatialNPは、位置、球形度、独立性を調べるための空間標識とランクテストが利用できます。

多変量分布

記述的尺度：
- statsのcov()またはcor()は、それぞれ共分散および相関行列の推定値を提供します。
- ICSNPは、スキャッターの推定値を提供する更なる機能と空間の中央値の推定値を提供するspatial.median()など、いくつかの説明的な対策を提供しています。
- さらに堅牢な方法は、最小体積の楕円体、最小共分散行列式やクラシックの積による分散共分散行列のロバスト推定値を提供してMASSのcov.rob()として提供されています。
- covRobustは、最近傍分散推定を経由して強固な共分散推定を提供しています。
- robustbaseは、covOGK()経由Gnanadesikan-Kettenringの直交化ペアごとの推定とcovMCD()で高速最小共分散行列式を通じて強固な共分散推定を提供しています。
- スケーラブル堅牢な方法は、covMcd()で高速最小共分散行列式だけでなく、covMest()でM-推定量を使用するrrcovに設けられています。
- corpcorは、大規模な共分散の収縮推定と（部分的）相関行列を提供しています。
密度（推定とシミュレーション）：
- MASSのmvnorm()は、多変量正規分布からシミュレートします。
- mvtnormは、多変量正規分布の多変量t分布と多変量正規分布だけでなく、密度関数の両方のシミュレーションだけでなく、確率と分位の機能が用意されています。
- mnormtは、多変量正規および多変量T密度や分布の関数だけでなく、乱数シミュレーションを提供します。
- snは、多変量スキューノーマルとスキューt分布のための密度、分布と乱数生成を提供します。
- deltは、CARTと貪欲な方法による多変量密度を推定するための機能の範囲を提供します。
- 混合に関する総合的な情報は、Clusterビューに与えられています。
- いくつかの密度推定値と乱数は、ksのdmvnorm.mixt()とrmvnorm.mixt()によって提供され、フィッティング混合はまたbayesmに設けられています。
- ウィシャート分布からシミュレートする機能は、MCMCpack（後者はまた密度関数dwish()を持っている）のrwish()、bayesmのrwishart()のような場所の数で提供されています。
- KernSmoothのbkde2D()とMASSのkde2d()は、ビン化と非ビン化2次元のカーネル密度推定を提供ます。
- ksは、ashとGenKernのような多変量カーネル平滑化を提供しています。
- primは、高次元の多変量データ高密度の領域を見つけることを試みるために、患者規則帰納方法を提供ます。
- featureは（例えば、局所モードとの関係のように）、多変量データ内の特徴的有意性を決定するための方法を提供します。
評価する正常：
- mvnormtestは、シャピロ・ウィルクス・テストへの多変量拡張を提供します。
- mvoutlierは、ロバストな手法に基づいた多変量の外れ値検出を行います。
- ICSは、マルチ正規のテストを提供します。
- energyのmvnorm.etest()は、E統計（エネルギー）に基づく正規性の評価を提供します;
  - 同パッケージのk.sample()は、同じディストリビューションのサンプル数を評価します。
  - ウィシャート分布、共分散行列のテストは、statsにおいてmauchly.test()で与えられます。
コピュラ：
- copulaは、一般化されたアルキメデスコピュラを提供するnormal、t、Clayton、Frank、Gumbel、fgacを含むコピュラ（楕円形とアルキメデス）の範囲のためのルーチンを提供しています。

線形モデル

statsから、lm()（従属変数として指定されたマトリックスを含む）は多変量線形モデルを提供します。
- anova.mlm()は、多変量線形モデルとの比較を提供します。
- Manova()は、MANOVAを提供しています。
- snは、多変量スキュー正常および多変量スキューTモデルに合わせているmsn.mle()とmst.mle()を提供しています。
- plsは、部分最小二乗回帰（PLSR）と主成分回帰を提供ます。
- drは、「save」（スライスされた平均分散推定）や、「sir」（スライスされた逆回帰）などのような次元削減回帰のオプションが用意されています。
- plsgenomicsは、ゲノミクスのための分析を部分最小二乗法を提供しています。
- relaimpoは、回帰パラメータの相対的な重要性を調査するための機能を提供します。

投影法

主成分：
- これらはstatsからprincomp()（S-PLUSとの互換性のためにeigen()に基づく）だけでなく、prcomp()（svd()に基づいて、優先）を取り付けることができる。
- Hmiscにおけるpc1()は、最初の主要なコンポーネントを提供し、スケーリングされていないデータの係数を与えます。
- paranは、保持する次元数のホーンの評価のためのルーチンを提供します。
- 一方、スクリープロットを評価するための追加サポートは、nFactorsに記載されています。
- 広い行列に対して、gmodelsは、fast.prcomp()とfast.svd()を提供しています。
- kernlabは、kpca()での非線形の主成分の形を提供するために、カーネル法を使用しています。
- pcaPPは、射影追跡により強固な主要なコンポーネントを提供します。
- amapは、それぞれacpgen()とacprob()を経由して一般化と堅牢主成分分析の形式のような、さらに堅牢で並列化の方法を提供します。
- 生態環境における主要な構成要素のための更なるオプションがade4およびSensoMineRにおける感覚の設定で利用できます。
- psyは、心理測定に有用な様々なルーチンを提供します。この文脈では、球にマッピングされるsphpca()と、いくつかの変数が依存するとみなされるfpca()が含まれます。scree.plot（）にはシミュレーション結果を追加して観測データを評価するオプションがあります。
- PTAkは、PCAとコレスポンデンス分析の両方に主要なテンソル解析analagousを提供しています。
- smatrは、標準化された長軸推定を提供し、特定の用途をallometryに提供します。
正準相関：
- statsにおけるcancor()は正準相関を提供しています。
- kernlabは、kcca()で堅牢な正準相関を提供するために、カーネル法を使用しています。
冗長性分析：
- calibrateは、冗長解析だけでなく、正準相関のためのさらなるオプションのrda()を提供しています。
- fsoは、線形代数から利用可能なメソッドを超えての調整を拡張するファジィ集合の調整を提供します。
独立したコンポーネント：
- fastICAは、独立成分分析（ICA）と射影追跡を行うためにfastICAアルゴリズムを提供ます。
- PearsonICAは、スコア関数を使用しています。
- ICSは、不変座標系または独立したコンポーネントのいずれかを提供します。
- JADEは、JADEアルゴリズムだけでなく、ICAのためのいくつかの診断を提供するインターフェイスを追加します。
プロクラステス分析：
- veganのprocrustes()は、プロクラステス分析を提供します。
  - このパッケージはまた、命名のための機能を提供し、その領域に関するさらなる情報は、Environmetrics タスクビューで与えられます。
- GPA()を経由する一般化プロクラステス分析は、FactoMineRから利用できます。

主要な座標/スケーリング方法

statsにおけるcmdscale()は、古典的多次元尺度を提供します。
- MASSのsammon()とisoMDS()は、SammonとKruskalの非メトリック多次元尺度を提供しています。
- veganは、非メトリックMDSのためのラッパーと後処理を提供しています。
- indscal()は、SensoMineRによって提供されます。

教師なし分類

クラスター分析：
- R内で利用可能なクラスタリング方法の包括的な概要は、Clusterタスク・ビューによって提供されます。
- 標準的な技術は、statsにおける関数kmeans()によるK-平均クラスタリングとhclust()による階層的クラスタリングを含まれています。
- 確立されたクラスタリングと可視化技術の範囲は、clusterでも利用できます。
- いくつかのクラスター検証ルーチンはclvで提供されます。
- ランド指数はe1071のclassAgreement()から計算することができます。
- クラスタアンサンブルは、clueから利用可能です。
- ルーチンの選択を支援するための方法は、clusterSimで提供されます。
- E-統計に基づいて距離尺度（edist()）と、階層的クラスタリング（hclust.energy()）は、energyで提供されています。
- マハラノビス距離ベースのクラスタリング（固定点だけでなく、clusterwise回帰用）は、fpcから提供されています。
- clustvarselは、モデルベースのクラスタリング内で変数選択を提供しています。
- ファジークラスタリングは、cluster内だけでなく、hopach（階層秩序パーティショニングと折りたたみハイブリッド）アルゴリズムによって提供されています。
- kohonenは、高い次元スペクトルまたはパターンを教師ありと教師なしのSONGsを提供しています。
- clusterGenerationは、クラスタをシミュレートするのに役立ちます。
- Environmetricsのタスクビューは、いくつかのクラスタリング技術の話題に関連する概要を説明します。
- モデルベースのクラスタリングは、mclustで提供されています。
ツリー方法：
- ツリーメソッドの詳細は、MachineLearningのタスクビューに掲載されています。
- 分類木は、多変量解析法の中で考慮されることがあります。
- rpartは、この目的のために最も使用されています。
- partyは、再帰分割を提供しています。
- 分類および回帰訓練は、caretによって提供されています。
- kknnは、回帰並びに分類に使用することができるk最近傍法を提供します。

教師付き分類と判別分析

MASS内のlda()とqda()は、それぞれ線形および二次差別を提供します。
- mdaは、mda()およびfda()ならびにmars()およびbruto()関数を使用した適応スプラインバックフィリングの多変量適応回帰スプラインと混合および柔軟な判別分析を提供します。
- 多変量適応的回帰スプラインは、earthで見つけることができます。
- classは、knn()でK-近傍を提供しています。
- SensoMineRは、階乗判別分析のためにFDA()が用意されています。
- パッケージの数は、分類と次元削減を提供します。
- klaRは、変数選択や多重共に対するロバスト性だけでなく、可視化ルーチンの数が含まれています。
- gplsは、一般化された部分最小二乗を使用して分類を提供します。
- hddplotは、クロスバリデーションされた線形判別計算を提供して、最適な特徴数を決定します。
- ROCRは、分類器の性能を評価する方法の範囲を提供します。
- 教師付き分類の詳細については、MachineLearningタスクビューにあります。

対応分析

MASSのcorresp()とmca()は、それぞれシンプルで、複数のコレスポンデンス分析を提供します。
- caは、シングルマルチと共同コレスポンデンス分析を提供しています。
- ade4のca()およびmca()は、対応および複数の対応分析をそれぞれ提供し、hta()を用いて均質な表分析を追加します。
- さらなる機能性は、veganで利用可能です。
- 共同対応は、cocorrespから利用可能です。
- FactoMineRは、簡単で、複数のcorresondence分析だけでなく、関連するグラフィカル・ルーチンを可能にするca()とmca()を提供しています。
- homalsは、均質性の分析を提供します。

欠測データ

mitoolsは、多重代入のためのツールを提供します。
- miceは、多変量補完を提供します。
- mixは、混合カテゴリカルおよび連続データの多重代入を提供しています。
- panは、パネルデータの欠落のための多重代入を提供しています。
- VIMは、失われたデータの可視化だけでなく、補完するための方法を提供します。
- HmiscのaregImpute()とtranscan()は、さらに補完する方法を提供します。

潜在変数のアプローチ

statsのfactanal()は、最尤による因子分析を提供します。
- ベイジアン因子分析は、MCMCpack のガウス関数、順序変数、および混合変数に対して行われます。
- GPArotationは、GPA（勾配射影アルゴリズム）因子の回転を提供しています。
- semは、線形構造方程式モデルに適合します。
- ltmは、項目反応理論とラッシュモデルへの拡張の範囲の下で潜在特性モデルを提供してeRmに記載されています。
- FactoMineRは、定量的および定性的データの複数の要因分析のためのADFM()だけでなく、複数の階層の複数の要因分析のためのMFA()とHMFA()などの因子分析法の広い範囲を提供しています。
- poLCAは、結果変数のさまざまな潜在クラスと潜在クラス回帰モデルを提供します。

非ガウスデータのモデル化

MNPは、ベイズ多項プロビット・モデルを提供します。
- polycorは、polchoricと四分相関行列が用意されています。
- bayesmは、一見無関係回帰、多項ロジット/プロビット、多変量プロビットと操作変数としてモデルの範囲を提供します。
- VGAMは、Vector一般化線形および付加モデル、縮小ランク回帰を提供しています。

行列操作

ベクトルと行列ベースの言語などの、ベースRは、MatrixとSparseMによって補完される行列操作を行うための多くの強力なツールがあります。
- matrixcalcは、行列微分法のための機能が追加されます。
- さらにいくつかの疎行列機能は、spamから利用できます。

その他ユーティリティ

abindは、配列のためのrbind()とcbind()を一般化します。
- HmiscのmApply()は、行列のためのapply()を一般化し、複数の機能を渡します。
- 前に示した機能に加えて、snは、疎外、アフィン変換および多変量歪正規分布と歪t分布のためのグラフィックスなどの操作を提供します。
- mArは、ベクターの自動回帰のために用意されています。
- Hmiscのrm.boot()は、反復測定モデルをブートストラップします。
- psyは、重み付けされた尺度を含むCohenのカッパに基づく統計の範囲と2人以上の評価者間の合意を提供します。
- cwhmiscは、ellipse()、normalise()、様々な回転関数など、関心のある興味深い支援する機能が含まれています。
- desirabilityは、多変量最適化のための機能を提供します。
- geozooは、GGobiにおける幾何オブジェクトのプロットを提供しています。

R言語 CRAN Task View：多変量統計

「R言語 CRAN Task View：多変量統計」への1件のフィードバック