CRAN Task View: Machine Learning & Statistical Learningの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載した。

Maintainer: Torsten Hothorn
Contact: Torsten.Hothorn at R-project.org
Version: 2017-04-19
URL: https://CRAN.R-project.org/view=MachineLearning

いくつかのアドオンパッケージは、コンピュータサイエンスと統計の境界線で開発されたアイデアやメソッドを実装しています。この分野の研究は、通常、機械学習と呼ばれています。 パッケージは、大まかに次のトピックで構成できます。

  • ニューラルネットワーク:
    • 単隠れ層ニューラルネットワークは(base Rに同梱)パッケージnnetに実装されています。
    • パッケージRSNNSは、シュトゥットガルトニューラルネットワークシミュレータ(SNNS)へのインターフェースを提供しています。
    • FCNNライブラリへのインターフェースは、パッケージFCNN4R でユーザー拡張可能な人工ニューラルネットワークを使うことができます。
    • rnn は、リカレントニューラルネットワークを実装します。
    • ニューラルネットワークの深い学習フレーバーを実装しているパッケージは、次になります。
      • darch (制限付きボルツマンマシン、深い信念ネットワーク)
      • deepnet (フィードフォワードニューラルネットワーク、制限付きボルツマンマシン、深い信念ネットワーク、積み重ね自動エンコーダー)
      • RcppDL (自動エンコーディングノイズ除去エンコーダー、 ボルツマンマシン、深い信念ネットワーク)
      • h2o (フィードフォワードニューラルネットワーク、ディープオートエンコーダ)
  • 再帰分割:
    • ツリー構造のモデルは、CART bookで次のアイデア、回帰、分類および生存分析のためのrpart(ベースRに同梱)とtreeに実装されています。
    • パッケージrpartは、CARTのようなtreeを計算するために推奨されます。
    • パーティショニングアルゴリズムの豊富なツールボックスがWekaで提供され、パッケージRWekaはC4.5とM5のJ4.8-バリアントを含め、この実装へのインターフェースを提供します。
    • Cubistパッケージは、端末の葉、インスタンスベースの修正およびブースティングの線形回帰モデルで(木に似ている)、ルールベースのモデルに適合します。
    • C50パッケージは、C5.0の分類木、ルールベースモデル、およびこれらのバージョンはブーストを収めることができます。
    • 公平な変数選択と統計停止基準に二つの再帰分割アルゴリズムは、パッケージpartyに実装されています。mob()はパラメトリックモデルを分割するために使用することができるが、関数ctree()は応答と各入力変数間のテスト独立のためノンパラメトリック条件推論手順に基づいています。
    • 二分木および応答のノード分布を可視化するための拡張可能なツールは、同様に、パッケージpartyで提供されています。
    • ツリー構造の変化係数モデルは、パッケージvcrpartに実装されています。
    • バイナリ入力変数に関する問題のパッケージLogicRegは、論理回帰を実装しています。
    • 木の可視化のためのグラフィカルなツールは、パッケージmaptreeで提供されています。
    • ランダム効果による時系列データをモデル化するためのツリーは、パッケージREEMtreeによって提供されています。
    • 混合モデルの分割はRPMMによって行われる。
    • 木や予測と視覚化のための統一されたメソッドを表すための計算インフラをpartykitに実装されています。
    • このインフラストラクチャは、全体的に最適な木の進化的学習を実現するために、パッケージevtreeによって使用される。
    • 斜めの木は、パッケージoblique.treeで提供されています。
  • ランダムフォレスト:
    • 回帰や分類のためのランダムフォレストアルゴリズムの参照実装は、パッケージrandomForestで提供されています。
    • ipredパッケージは、回帰、分類と生存分析のための袋詰めなど、アンサンブル学習を経由して複数のモデルの組み合わせをバンドルしています。
    • また、条件推論ツリーに基づいて、任意のスケールで測定された応答変数のランダムフォレスト変異体は、パッケージpartyに実装される。
    • randomForestSRCは生存、回帰と分類の問題のためのBreimanのランダムフォレストの統一された処置を実装しています。
    • 分位回帰フォレストquantregForestは、ランダムフォレストアプローチによる探索的変数の数値応答の分位を退縮することができる。
    • バイナリデータの場合、LogicForestは、論理回帰ツリーパッケージLogicRegの森がある。
    • varSelRFBorutaパッケージは、ランダムフォレストアルゴリズムのための手段で変数選択に焦点を当てています。
    • 加えて、パッケージrangerRborist は、ランダムフォレストの高速なC++実装へのRインターフェイスを提供しています。
    • 木の下で重要な変数の分割を特徴とする強化学習木は、RLT パッケージで実装されています。
  • 正則収縮方法:
    • パラメータ推定値にいくつかの制約を持つ回帰モデルは、lasso2larsパッケージを取り付けることができる。
    • パラメータのグループのための同時更新とLasso(GroupWiseでlasso)は、パッケージgrplassoで利用可能です。
    • grpregパッケージは、グループMCPおよびグループSCADなどの他のグループペナルティモデルの数を実装しています。
    • 一般化線形モデルおよびCoxモデルのためのL1正則化パスは、パッケージglmpathで利用可能な関数から得ることができる。
    • 線形回帰、ロジスティックおよび多項回帰モデルのために全体lassoや弾性ネットの正則化パス(elasticnet)でパッケージglmnetから取得することができる。
    • penalizedパッケージは、lasso(L1)とridge(L2)ペナルティ回帰モデル(GLMおよびCoxモデルの両方)の代替実装を提供します。
    • biglasso パッケージは、データをRAMに格納できない場合、L1ペナルティの下でガウス分布およびロジスティック線形モデルに適合します。
    • パッケージRXshrink は、指定された収縮経路のTRACEを識別して表示し、収縮の適切な程度を決定するために使用できます。
    • lasso罰則の下でセミパラメトリック加法ハザードモデルは、パッケージahazによって提供されています。
    • 線形回帰のための投げ縄収縮技術の一般化は、リラックスしたlassoと呼ばれ、パッケージrelaxoで提供されている。
    • スパースソリューションを生成するために、オプションのLASSOペナルティフィッシャーのLDA投影がパッケージpenalizedLDAに実装されています。
    • 遺伝子発現解析のための収縮重心分類器とユーティリティは、パッケージpamrに実装されています。
    • 多変量適応的回帰スプラインの実装は、パッケージearthで提供されています。
    • 罰則モデル(SCADまたはL1罰則)内のSVMでのクローン選択を介して可変選択は、パッケージpenalizedSVMに実装されています。
    • ペナルティ判別分析の様々な形態のパッケージhdardasdaで実装されています。
    • パッケージLiblineaRはLIBLINEARライブラリへのインターフェースを提供しています。
    • ncvregパッケージには、座標降下アルゴリズムを使用してSCADおよびMCP回帰罰則の下で線形およびロジスティック回帰モデルに適合します。
    • ハイスループットリッジ回帰(すなわち、処罰多くの予測変数を持つ)とheteroskedastic効果モデルはbigRRパッケージの焦点である。
    • 正則リスク最小化のためのバンドルのメソッドの実装は、利用可能なフォームパッケージbmrmです。
    • 非ガウスと異分散エラーの下でLassoは、hdm によって推定され、Lasso回帰の低次元のコンポーネントの推定、高次元設定での推定治療効果の推論も含まれています。
    • パッケージSIS は、一般化線形およびコックスモデルでsure独立性スクリーニングを実装しています。
  • ブースト:
    • 様々な形態の勾配ブーストが、パッケージgbm (ツリーベースの機能勾配降下ブースティング)において実施される。
    • パッケージxgboost は、いくつかのユーザ定義の目的関数の基本学習者として効率的なツリーを使ってツリーベースのブースティングを実装します。
    • ヒンジ損失はパッケージbstの昇圧実装によって最適化されています。
    • パッケージGAMBoostは、ブースティングアルゴリズムによって一般化加法モデルを適合させるために使用することができる。
    • 一般化線形、加法やノンパラメトリックモデルのための拡張可能なフレームワークが後押しパッケージmboostで提供されています。
    • 尤度ベースのコックスモデルの後押しがCoxBoostにし、GMMBoost内混合モデルのために実装されています。
    • GAMLSSモデルは、gamboostLSSによってブースティングを使用して取り付けることができる。
    • 回帰タスクを扱うためのGradient Descentに基づくさまざまな学習アルゴリズムの実装は、gradDescent パッケージで利用できます。
  • サポートベクターマシンとカーネル法:
    • e1071中から関数のsvn()はLIBSVMライブラリへのインターフェースを提供し、パッケージkernlab(SVMsを、RVMsや他のカーネルの学習アルゴリズムを含む)は、カーネル学習のための柔軟なフレームワークを実装しています。
    • SVMLightの実装(唯一の1-に対するすべての分類用)へのインターフェースは、パッケージklaRで提供されています。
    • カーネル特徴空間内の関連する寸法は、モデルの選択と予測のための手順を提供しているrdetoolsを用いて推定することができる。
    • パッケージgmum.r は、LIBSVMとSVMLightへのRインタフェースを提供します。
  • ベイズ法:
    • 最終モデルは、多くの弱学習器(異なるアンサンブルメソッドではない)を介して合計で定義されているベイズ加法回帰木(BART)は、パッケージBayesTree に実装されています。
    • ベイズ非定常、セミパラメトリック非線形回帰とベイズカートと木が植えられた線形モデルを含む木が植えられたガウシアンプロセスによるデザインは、パッケージtgpで利用できるようになります。
  • 遺伝的アルゴリズムを用いた最適化:
    • パッケージrgprgenoudは、遺伝的アルゴリズムに基づく最適化ルーチンを提供している。
    • パッケージRmalschainsは、実数値のパラメータ最適化のためのローカル検索で定常状態遺伝的アルゴリズムを組み合わせた進化的アルゴリズムの特殊なタイプであるローカルサーチ鎖、とミームのアルゴリズムを実装しています。
  • 相関ルール:
    • パッケージarulesは、高頻度項目セットおよび相関ルールを閉じた最大頻度項目セット、高頻度項目セットをマイニングするためのアプリオリとエクラの実装へのインターフェースだけでなく、スパースバイナリデータを効率的に処理するための両方のデータ構造体を提供している。
    • パッケージopusminer は、トランザクションデータのキー関連付けを、レバレッジまたはリフトのいずれかを使用して、自己充足品目セットの形で効率的に見つけるための、OPUS Minerアルゴリズム(C ++で実装されています)へのインターフェイスを提供します。
  • ファジールールベースのシステム:
    • パッケージfrbsは、回帰と分類のためのデータからファジィルールベースシステムを学習するための標準的な方法のホストを実装しています。
    • パッケージRoughSetsは、単一のパッケージ内のラフ集合論(RST)とファジーラフ集合論(FRST)の総合的な実装を提供します。
  • モデル選択と検証:
    • パッケージe1071は、ハイパーパラメータチューニングのための機能tune()があり、機能errorest()(ipred)は、誤り率推定のために使用することができます。
    • サポートベクターマシンのコストパラメータCは、パッケージsvmpathの機能を利用して選択することができる。
    • ROC解析と候補分類器を比較するための他の視覚化技術のための機能がパッケージROCRから入手できます。
    • パッケージhdistabsはモデルの範囲のための安定性の選択を実装し、hdiはまた、高次元モデル内の他の推論手順を提供しています。
  • その他の手順:
    • 証拠分類は、パッケージevclass でデンプスター・シェーファーの質量関数を使用して、テストパターンのクラスについての不確実性を定量化します。
    • OneR (Oneルール)パッケージには、豊富な診断機能と一緒に値や数値データの欠落の洗練された処理のための機能強化と分類アルゴリズムを提供しています。
    • spa は、フィーチャベースのデータとグラフベースのデータを組み合わせて、何らかの応答を予測します。
  • メタパッケージ:
    • パッケージcaretは、パラメータチューニングと変数の重要施策を含め、予測モデルを構築するためのその他の関数が用意されています。パッケージには、様々な並列実装(例えば、MPI、NWSなど)で使用できます。
    • 同じような精神で、パッケージmlrは様々な統計や機械学習パッケージへの高レベルのインターフェイスを提供しています。
    • パッケージSuperLearner は、同様のツールボックスを実装しています。
    • h2o パッケージは、とりわけ、ランダムフォレスト、GBM、GLM(弾性ネット正則)、およびディープラーニング(フィードフォワード多層ネットワーク)などの多くの人気アルゴリズムのスケーラブルな実装を有する汎用機械学習プラットフォームを実装しています。
  • 統計的学習の要素:
  • GUIのrattleはRのデータマイニングのためのグラフィカル・ユーザー・インターフェースである。

CORElearnは、最も近い隣人、木、ランダムフォレスト、およびいくつかの機能の選択方法として機械学習アルゴリズムのかなり広いクラスを実装します。

同様に、パッケージrminerインタフェースいくつかの学習アルゴリズムは、他のパッケージに実装され、複数の業績指標を計算します。

R言語 CRAN Task View:機械学習&統計学習

One thought on “R言語 CRAN Task View:機械学習&統計学習

Comments are closed.