CRAN Task View: Robust Statistical Methodsの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載した。

Maintainer: Martin Maechler
Contact: Martin.Maechler at R-project.org
Version: 2018-06-18
URL: https://CRAN.R-project.org/view=Robust

統計モデリングのための堅牢な(または「耐性」)の方法は、1980年代の初めから、Sで利用されてきた。その後、パッケージstatsのRにおいて。例としては、2003年にrunmed()によって補完されていた堅牢なノンパラメトリック回帰のため、lowess()(とloess())またはパッケージグラフィックで統計の背後にあるboxplot()、median()、mean(*,trim=)、mad()、IQR()、fivenum()である。更に多くの重要な機能は、推奨(したがって、すべてのRのバージョンに存在する)パッケージMASS(ビル・ベナブルズとブライアンリプリーによる、書籍Modern Applied Statistics with S を参照してください)で利用可能になりました。最も重要なことは、彼らは堅牢な多変量散乱及び共分散のためのロバスト回帰とcov.rob()のためにrlm()を提供しています。

このタスクビューは、新しいかより速く、より効率的なアルゴリズムと、特に新しいモデル(のロバスト)のために提供されたRについてのアドオンパッケージである。

task view maintainerへの追加や拡張のための提案を送信してください。

ロバスト統計の分野で働いている科学者の国際的なグループは、散乱開発のいくつかを調整し、お互いを補完Rパッケージのセットを介して重要なものを利用可能にするための努力(2005年10月以降)にしました。これらは、特定のモデルやアプリケーションに不可欠な機能を拡張する、上に構築する(潜在的に多くの)他のパッケージとの造語robustbase、「重要事項」で基本パッケージの上に構築する必要があります。さらに、今InsightfulとKjell KonisのおかげでGPLicensedのRパッケージとして、S-PLUSの堅牢なライブラリのバージョン、非常に包括的なパッケージrobustがある。もともと、「robustbase」と「robust」との間に多くの重複があった。今robustrobustbaseに依存している。前者はカジュアルなユーザーのための便利なルーチンを提供する。後者は基本的な機能が含まれている。堅牢なモデリングのためのオプションの大規模な範囲でより高度な統計学者を提供する。

私たちは、大きく以下のトピックにパッケージを構築し、通常、最初のパッケージのrobustbaserobustで機能性はもちろんします。

  • 回帰(線形、一般化線形、非線形モデルのincl混合効果):
    • lmrob()(robustbase)とlmRob()(robust)。
    • 前者は速いSアルゴリズムと不均一と自己相関訂正された(HAC)標準誤差の最新を使用しています。
    • 後者はMaronnaと(2000)ヨハイのMSアルゴリズムを利用する。予測因子の中で要因が存在するときに自動的に。
    • (S-推定量(したがって、MM-推定量)はリサンプリングに基づいてどこに通常はひどく失敗)。ltsReg()とlmrob.S()関数は、robustbaseで利用できるのではなく、比較のために。
    • MASSからrlm()は、ロバスト線形モデルのための最初に広く利用できる実装されていて、非常に最初のMM-推定実装の1つでもある。
    • robustregは(純粋なRで)線形回帰のための非常にシンプルなM-推定値を提供する。
    • Koenkerの分位回帰パッケージquantregがL1スプライン経由でノンパラメトリック回帰のためにもそうする特別なケースとして、(別名LAD、最小絶対偏差)回帰が含まれていることに注意してください。
    • ロバスト線形混合効果モデリングのためのMM様のアプローチは、パッケージrobustlmmから利用可能であるのに対し、分位回帰(したがってL1またはLAD)混合効果モデルでは、パッケージlqmmで提供されています。
    • パッケージmblmの関数mblm()は、中央値ベース(タイルセンまたはシーゲルの繰り返された)単純な線形モデルに適合します。
    • パッケージTEERegは線形モデルのため、元素の推定量をトリミングし提供します。
    • 一般化線形モデル(GLMS)は、パッケージrobustloggammaが一般化ログガンマモデルに焦点を当てているglmrob()(robustbase)とglmRob()(robust)の両方の経由で設けられている。
    • 堅牢な順序回帰は、rorutadis(UTADIS)によって提供されている。
    • 堅牢な非線形モデルのフィッティングがrobustbaseのnlrob()で入手することができます。
    • multinomRobはカウントデータのために過分散多項回帰モデルに適合します。
    • rgamrobustgamは両方、堅牢GAMs、すなわち、堅牢な一般化加法モデルをフィットする。
    • drgeeは「二重に堅牢な」一般化推定方程式(GEEs)が適合します。
    • complmrob は、共変量としての構成データによる堅牢な線形回帰を行います。
  • 多変量解析:
    • ここでは、robustbase上(「依存先」)を構築するrrcovパッケージには、素敵なS4のクラスベースの方法、堅牢な多変量分散共分散推定のための複数の方法を提供し、堅牢なPCA方法が追加されます。
    • これは、不完全または欠損(NA)データ用のための堅牢な多変量のメソッドを提供しているrrcovNA、高次元のデータのための堅牢な多変量のメソッドを提供しているrrcovHDにより拡張されます。
    • 機能的データを重視した高次元データは、roahd によっても強固に扱われます。
    • 特化した堅牢なPCAパッケージは、pcaPP (Projection Pursuit経由)、rpca (「sparse」を含む)、rospca です。 歴史的に、標準的なRのprincomp()を使用することによって堅牢なPCAを実行できることに注意してください。 例えば、X <- stackloss; pc.rob <- princomp(X, covmat= MASS::cov.rob(X))
    • ここでは、robustbaserobustのfastmcd()、同様にcovOGK()用より少しより柔軟なバージョン、covMcd()が含まれています。
    • OTHOのrobust covRob()は自動的に、大きな次元数pに対して特にpairwiseQC()メソッドを選択しました。
    • パッケージrobustXは、実験的、またはその他の、まだ確立されていない手順については、BACON()とcovNCC()が含まれている。後者は、WangとRaftery(2002)の近隣の分散推定(NNVE)を提供し、covRobustでもご入手いただけます。
    • RobRSVDは、堅牢な正則化特異値分解を提供しています。
    • mvoutlierrobustbase建物)は、高次元での外れ値を識別するためのいくつかの方法が用意されています。
    • GSEは、失われたデータの存在下で多変量場所と散乱を推定する。
    • RSKCはRobust Sparse K-means Custeringを提供する。
    • 堅牢な混合物判別分析(RMDA)用robustDAは、ノイズの多いクラスラベルとの混合モデルの分類器を構築します。
    • robcorは特にFastQn()にスケール推定値に基づいて強固なペアワイズ相関を計算する。
    • covRobustはWangとRaftery(2002)の最近傍分散推定(NNVE)メソッドを提供します。堅牢なPCAは標準Rのprincomp()を用いて行うことができることに注意してください。
    • 例えば、X <- stackloss; pc.rob <- princomp(X, covmat= MASS::cov.rob(X))CRANタスクビューMultivariateおよびClusterを参照してください。
  • クラスタリング(多変量):
    • クラスタ耐性分散(/標準誤差)推定(別名「サンドイッチ」)は考慮していません。 むしろ例えば モデルベースおよび階層的クラスタリング手法、特に堅牢性に重点を置いています。
    • 「中央値付近の周りのパーティショニング」を実装しているcluster のpam()は部分的に堅牢ですが(非常に堅牢なk-meansの代わりにメジアン)、十分ではありません。 例えば、k個のクラスタは、残りのデータの大部分に対して1個のクラスタをk-1個の異常値から構成することができます。
    • 「本当に」堅牢なクラスタリングは、次のパッケージよって提供されます。
      • genie,
      • Gmedian
      • otrimle (トリムされたMLEモデルベース)
      • snipEM (snipping EM)、
      • qclust (Gaussian混合のロバスト推定)、
      • tclust (ロバストなトリミングクラスタリング)
  • 大規模なデータセット:
    • BACON()(robustX内)は、伝統的な堅牢共分散に基づく外れ値検出器よりも拡大(n,p)には適用すべきである。
    • OutlierDMは複製された高スループット・データの異常値を検出します。(CRANタスクビューMachineLearningも参照してください。)
  • 記述統計/探索的データ解析:boxplot.stats()など、上記
  • 時系列:
    • Rのrunmed()はメディアンフィルタを実行している最も強力な提供しています。
    • パッケージrobfilterは、一般的に繰り返される(加重)の中央値回帰に基づいて単変量時系列に対してロバスト回帰とフィルタリングの方法が含まれています。
    • RobPerは、特に不規則な間隔時系列に対して、堅牢なピリオドグラム推定のためのいくつかの方法が用意されています。
    • ピーター・ラックデュッシェルは、R-Forge上のrobust-tsを参照して、堅牢な時系列パッケージの努力をリードし始めている。
    • さらに、robKalman、「堅牢なカルマンフィルタ?ACM-およびRLS-フィルタのルーチン」は、R-フォージにrobkalmanを参照して、開発されています。

これらの(最後の2つの項目)がCRANからまだ利用できないことに注意してください。

  • 計量経済学モデル:
    • 計量経済はHAC(不均一と自己相関が補正された)標準誤差を好む傾向がある。
    • モデルの広いクラスの場合、これらはパッケージsandwichによって提供される。
    • そのVCOV(lmrob())にも注意してロバストに推定線形モデルのためのHAC標準誤差のバージョンを使用しています。
    • また、CRANタスクビューのEconometricsを参照してください。
  • バイオインフォマティクスのための堅牢な方法:
    • いくつかのパッケージは、特殊な堅牢な方法を提供するBioconductor projectにあります。
    • また、RobLoxBioCはオミックスデータを前処理するための無限頑強な推定を提供しています。
  • 生存分析のための堅牢な方法:
    • パッケージcoxrobustはCoxモデルにおけるロバスト推定を提供しています。
    • OutlierDCは打ち切りデータのための分位回帰を用いて異常値を検出します。
  • 調査のための堅牢な方法:
    • R-forge上で唯一、パッケージrhteは、堅牢Horvitz-Thompson推定器を提供する。
  • 地球統計学:
    • パッケージgeorobは、クリギングなど多くの空間データ、の強固な地球統計分析を目的としています。
  • いくつかの方法論のコレクション:
    • WRS2は、ランドウィルコックスのコレクションからANOVA及びANCOVAための堅牢なテストが含まれています。
    • walrus は、WRS2 の計算を基に構築され、異なるユーザーインターフェイスを提供します。
    • robethは、回帰、多変量推定、その他の多くの機能と豊富なRobETH FortranライブラリとのインタフェースのR関数が含まれています。
  • 堅牢で耐方法論に他のアプローチ:
    • パッケージdistrとそのいくつかの子パッケージもロバスト推定の概念を探求することができます。例えば、R-Forge上のdistrを参照してください。
    • 特に、これらに基づいて、プロジェクトrobastを最適堅牢推定やテストの計算だけでなく、必要なインフラ(主に、S4クラスとメソッド)および診断のためのRパッケージの実装を目指す。M Kohl(2005)。これは、RパッケージRandVarRobAStBaseRobLoxRobLoxBioCRobRexが含まれています。さらに、ROptEst、およびROptRegTS
    • RobustAFTは、ガウスとlogWeibullエラーの堅牢な加速故障時間回帰を計算します。
    • 堅牢な分散メタ回帰のrobumeta
      • metaplus は、t-または正規分布の混合を介して頑健性を追加します。
    • ssmrobはサンプル選択モデルでロバスト推定し、推定しています。

関連する記事

  • R言語 CRAN Task View:機械学習&統計学習R言語 CRAN Task View:機械学習&統計学習 CRAN Task View: Machine Learning & Statistical Learningの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載した。 Maintainer: Torsten Hothorn Contact: Torsten.Hothorn at […]
  • R言語 CRAN Task View:統計遺伝学R言語 CRAN Task View:統計遺伝学 CRAN Task View: Statistical Geneticsの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載した。 Maintainer: Giovanni Montana Contact: g.montana at […]
  • R言語 CRAN Task View:政府統計&調査の方法R言語 CRAN Task View:政府統計&調査の方法 CRAN Task View: Official Statistics & Survey Methodologyの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載した。 Maintainer: Matthias Templ Contact: matthias.templ at […]
  • R言語 CRAN Task View:クラスター分析&有限混合モデルR言語 CRAN Task View:クラスター分析&有限混合モデル CRAN Task View:Cluster Analysis & Finite Mixture Modelsの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載した。 Maintainer: Friedrich Leisch and Bettina Gruen Contact: Bettina.Gruen […]
  • R言語 CRAN Task View:時系列解析R言語 CRAN Task View:時系列解析 CRAN Task View: Time Series Analysisの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載した。 Maintainer: Rob J. Hyndman Contact: Rob.Hyndman at […]
R言語 CRAN Task View:堅牢な統計的方法

One thought on “R言語 CRAN Task View:堅牢な統計的方法

Comments are closed.