R言語 CRAN Task View：堅牢な統計的方法

CRAN Task View: Robust Statistical Methodsについて、機械翻訳を交えて日本語化し掲載しております。

1 概要
2 回帰
3 多変量解析
4 クラスタリング（多変量）
5 大規模データセット
6 記述統計学／探索的データ解析
7 時系列
8 計量経済学モデル
9 バイオインフォマティクスのための堅牢な方法
10 生存分析のための堅牢な方法
11 調査のための堅牢な方法
12 いくつかの方法論のコレクション
13 ロバストで耐性のある方法論への他のアプローチ

概要

Maintainer:	Martin Maechler
Contact:	Martin.Maechler at R-project.org
Version:	2023-07-01
URL:	https://CRAN.R-project.org/view=Robust
Source:	https://github.com/cran-task-views/Robust/
Contributions:	このタスクビューに対する提案や改良は、GitHubのissueやpull request、またはメンテナのアドレスに電子メールで送ってください。詳しくはContributing guideをご覧ください。
Installation:	このタスクビューのパッケージは、ctvパッケージを使用して自動的にインストールすることができます。例えば ctv::install.views(“Robust”, coreOnly = TRUE)は全てのコアパッケージをインストールし、 ctv::update.views(“Robust”)はまだインストールされていない最新状態のパッケージを全てインストールします。詳しくはCRAN Task View Initiativeをご覧ください。

統計モデリングに対するロバスト（耐性）手法は、1980年代の初期からSで、そしてRではstatsパッケージで利用することができます。例えば、median()、mean(*, trim =. )、mad()、IQR()、あるいはfivenum()、graphicsパッケージのboxplot()の背後にある統計量）、ロバストノンパラメトリック回帰のlowess() （および loess() ）は、2003年に runmed() によって補完されていました。さらに重要な機能として、推奨パッケージであるMASS（Bill VenablesとBrian Ripleyによる、Modern Applied Statistics with Sを参照）が利用できるようになりました。最も重要なのは、ロバスト回帰のためのrlm()とロバスト多変量散布と共分散のためのcov.rob()を提供していることです。

このタスクビューは、より新しく、より速く、より効率的なアルゴリズムと、特に新しいモデルの（ロバスト化の）ためのRアドオンパッケージを提供するものです。

追加や拡張の提案は、メンテナにメールで送るか、上記リンク先のGitHubリポジトリにイシューやプルリクエストを提出してください。

ロバスト統計の分野で活躍する科学者の国際的なグループが、散在するいくつかの開発を調整し、重要なものは互いに補完し合うRパッケージのセットで利用できるようにしようと努力しています（2005年10月から）。これらのパッケージは、「Essentials」と呼ばれる基本パッケージをベースに、他のパッケージがその上に構築され、特定のモデルやアプリケーションに必要な機能を拡張していくもので、robustbaseと呼ばれています。2020年Robust Statistics: Theory and Methodsの第2版以来、RobStatTMは、特に robustbaseと rrcovからインポートすることで、その推定量と例をカバーしています。さらに、S-PLUSのロバストライブラリをRパッケージ化し、InsightfulとKjell KonisによってGPLライセンスされた、非常に包括的なパッケージであるrobustがあります。robustbaseとrrcovは元々重なる部分が多かったのですが、現在では robustは robustbaseとrrcovに依存しており、 robustは一般ユーザ向けの便利なルーチンを提供し、 robustbaseとrrcovは基本機能を含み、より高度な統計学者にロバストモデリングの幅広い選択肢を提供しています。

パッケージは大まかに以下のようなトピックで構成されており、通常、最初に robustbase、rrcov、robustパッケージの機能に言及します。

回帰

線形回帰：
- lmrob()（robustbase）とlmRob()（robust）。
- 前者は速いSアルゴリズムと不均一と自己相関訂正された（HAC）標準誤差の最新を使用しています。
- 後者はMaronnaと（2000）ヨハイのMSアルゴリズムを利用します。予測因子の中で要因が存在するときに自動的に。
- （S-推定量（したがって、MM-推定量）はリサンプリングに基づいてどこに通常はひどく失敗）。ltsReg()とS()は、robustbaseで利用できるのではなく、比較のために。
- MASSのrlm()は、ロバスト線形モデルのための最初に広く利用できる実装されていて、非常に最初のMM-推定実装の1つです。
- robustregは、（純粋なRで）線形回帰のための非常にシンプルなM-推定値を提供します。
- Koenkerの分位回帰quantregは、L1スプライン経由でノンパラメトリック回帰のためにもそうする特別なケースとして、（別名LAD、最小絶対偏差）回帰が含まれていることに注意してください。
- mblmのmblm()は、中央値ベース（タイルセンまたはシーゲルの繰り返された）単純な線形モデルに適合します。
- ロケーション(とスケール)モデルは切片のみの回帰であり、例えば lmrob(y ~ 1)のようにアプローチできることに注意してください。非常に小さなサンプルのために、location robLoc()とscale robScale()もrevssによって提供されています。
回帰の一般化線形モデル（GLMs）：
- 一般化線形モデル（GLM）は、glmrob()（robustbase）とglmRob()（robust）の両方で提供されます。
- drgeeは、「二重に堅牢な」一般化推定方程式（GEEs）が適合します。
- complmrob は、共変量としての構成データによる堅牢な線形回帰を行います。
一般化された平滑/加算（GAM-like）回帰：
- GJRMのgamlss()は、オプションgamlss(*, robust = TRUE)で、多くのモデル・ファミリーを（LSSの「location-scale-shape」変換スコープをラップした）ロバストにフィットさせることができます。
非線形/平滑（ノンパラメトリック関数）回帰：
- 堅牢な非線形モデルのフィッティングは、robustbaseのnlrob()で利用することができます。
混合効果（線形および非線形）回帰：
- 混合効果モデルの分位点回帰（したがってL1またはLAD）は、lqmmで利用できます。
- rlmeからのランクベースの混合効果フィッティングに対して、ロバスト線形混合効果モデリングのためのMMのようなアプローチは、robustlmmから利用できます。
- skewlmmは、歪んだ正規分布の尺度混合によるロバストな線形混合効果モデルLMMを提供します。

多変量解析

ここでは、robustbase上（「依存先」）を構築するrrcovは、素敵なS4のクラスベースの方法、堅牢な多変量分散共分散推定のための複数の方法を提供し、堅牢なPCA方法が追加されます。
rrcovNAによって拡張され、不完全または欠損（NA）データに対して堅牢な多変量法を提供します。
これは、高次元のデータのための堅牢な多変量のメソッドを提供しているrrcovHDにより拡張されます。
特化した堅牢なPCAパッケージは、pcaPP（Projection Pursuit経由）、rpca（「sparse」を含む）、rospcaです。歴史的に、標準的なRのprincomp()を使用することによって堅牢なPCAを実行できることに注意してください。例えば、X <- stackloss; pc.rob <- princomp(X, covmat= MASS::cov.rob(X))
robustbaseは、robustのfastmcd()、同様にcovOGK()用より少しより柔軟なバージョン、covMcd()が含まれています。
OTHOのrobust covRob()は、自動的に、大きな次元数pに対して特にpairwiseQC()メソッドを選択します。
robustXは、実験的、またはその他の、まだ確立されていない手順については、BACON()とcovNCC()が含まれている。後者は、WangとRaftery（2002）の近隣の分散推定（NNVE）を提供し、covRobustでもご入手いただけます。
mvoutlier（robustbase）は、高次元での外れ値を識別するためのいくつかの方法が用意されています。
GSEは、失われたデータの存在下で多変量場所と散乱を推定します。
RSKCは、Robust Sparse K-means Custeringを提供します。
堅牢な混合物判別分析（RMDA）用robustDAは、ノイズの多いクラスラベルとの混合モデルの分類器を構築します。
robcorは、特にFastQn()にスケール推定値に基づいて強固なペアワイズ相関を計算します。
covRobustは、WangとRaftery（2002）の最近傍分散推定（NNVE）メソッドを提供します。堅牢なPCAは標準Rのprincomp()を用いて行うことができることに注意してください。
例えば、X <- stackloss; pc.rob <- princomp(X, covmat= MASS::cov.rob(X))CRANタスクビューMultivariateおよびClusterを参照してください。

クラスタリング（多変量）

クラスタ耐性分散（/標準誤差）推定（別名「サンドイッチ」）は考慮していません。むしろ例えばモデルベースおよび階層的クラスタリング手法、特に堅牢性に重点を置いています。
「中央値付近の周りのパーティショニング」を実装しているclusterのpam()は部分的に堅牢ですが（非常に堅牢なk-meansの代わりにメジアン）、十分ではありません。例えば、k個のクラスタは、残りのデータの大部分に対して1個のクラスタをk-1個の異常値から構成することができます。
「本当に」堅牢なクラスタリングは、次のパッケージよって提供されます。
- genie
- Gmedian
- otrimle（トリムされたMLEモデルベース）
- tclust（ロバストなトリミングクラスタリング）

大規模データセット

BACON()（robustX）は、伝統的な堅牢共分散に基づく外れ値検出器よりも拡大（n,p）には適用すべきです。

記述統計学／探索的データ解析

stats()など、上記

時系列

Rのrunmed()はメディアンフィルタを実行している最も強力な提供しています。
robfilterは、一般的に繰り返される（加重）の中央値回帰に基づいて単変量時系列に対してロバスト回帰とフィルタリングの方法が含まれています。
RobPerは、特に不規則な間隔時系列に対して、堅牢なピリオドグラム推定のためのいくつかの方法が用意されています。
ピーター・ラックデュッシェルは、R-Forge上のrobust-tsを参照して、堅牢な時系列パッケージの努力をリードし始めています。
さらに、robKalman、「堅牢なカルマンフィルタACMおよびRLSフィルタのルーチン」は、R-フォージにrobkalmanを参照して、開発されています。

計量経済学モデル

計量経済はHAC（不均一と自己相関が補正された）標準誤差を好む傾向があります。
モデルの広いクラスの場合、これらはsandwich、同様にclubSandwichとclusterSEsによって提供されます。
そのVCOV（lmrob()）にも注意してロバストに推定線形モデルのためのHAC標準誤差のバージョンを使用しています。
また、CRANタスクビューのEconometricsを参照してください。

バイオインフォマティクスのための堅牢な方法

いくつかのパッケージは、特殊な堅牢な方法を提供するBioconductor projectにあります。
RobLoxBioCは、オミックスデータを前処理するための無限頑強な推定を提供しています。

生存分析のための堅牢な方法

coxrobustは、Coxモデルにおけるロバスト推定を提供しています。

調査のための堅牢な方法

robsurveyは、ロバストな調査回帰推定とロバストなHorvitz-Thompson推定量を提供します。

いくつかの方法論のコレクション

WRS2は、ランドウィルコックスのコレクションからANOVA及びANCOVAための堅牢なテストが含まれています。
walrusは、WRS2の計算を基に構築され、異なるユーザーインターフェイスを提供します。
robethは、回帰、多変量推定、その他の多くの機能と豊富なRobETH FortranライブラリとのインタフェースのR関数が含まれています。

ロバストで耐性のある方法論への他のアプローチ

distrとそのいくつかの子パッケージもロバスト推定の概念を探求することができます。例えば、R-Forge上のdistrを参照してください。
特に、これらに基づいて、プロジェクトrobastを最適堅牢推定やテストの計算だけでなく、必要なインフラ（主に、S4クラスとメソッド）および診断のためのRパッケージの実装を目指す。M Kohl（2005）。これは、RパッケージRandVar、RobAStBase、RobLox、RobLoxBioC、RobRexが含まれています。さらに、ROptEstおよびROptRegTS。
RobustAFTは、ガウスとlogWeibullエラーの堅牢な加速故障時間回帰を計算します。
堅牢な分散メタ回帰のrobumeta。
- metaplusは、t-または正規分布の混合を介して頑健性を追加します。
ssmrobは、サンプル選択モデルでロバスト推定し、推定しています。

概要

回帰