CRAN Task View: Phylogenetics, Especially Comparative Methodsの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載した。

Maintainer: Brian O’Meara
Contact: omeara.brian at gmail.com
Version: 2017-04-09
URL: https://CRAN.R-project.org/view=Phylogenetics

生命の歴史は系統学的な状況の中で展開されます。 比較系統発生法は、系統樹に沿った歴史的パターンを分析するための統計的アプローチです。 このタスクビューは、様々な異なる比較系統発生方法を実装するRパッケージを記述します。 これは活発な研究分野であり、情報の多くは変更される可能性があります。 注意すべきことは、多くの重要なパッケージはCRANにはないということです。以前はCRANにあったもので、後でアーカイブされました(例えば、Rが更新されたときに必要な変更を加えられなかった場合など) まだCRANにはありません。 そのようなパッケージはgithub、R-forge、または著者のWebサイトにあります。

Rに木を取得する:

  • S4 phylo4クラス(phylobaseで実装)も提供されていても、Rの木は通常、のS3 phyloクラス(apeで実装)に格納されています。
  • apeはnewickフォーマット(時々一般にphylipフォーマットとして知られている)やNEXUS形式の外部ファイルからのツリーを読み取ることができます。またnewick文字列(すなわち、「(human,(chimp,bonobo));」)として手作業で木の入力を読み取ることができます。
  • phylobaseとその軽量兄弟rnclはNEXUS、Newick、および他のツリー形式を読み取るNexus Class Libraryを使用することができます。
  • treebaseがオンラインツリーリポジトリTreeBASEからツリーを読み込み検索でき、rdryadは、オンラインデータリポジトリDryadからデータを引き出すことができます。
  • RNeXMLは、NeXMLフォーマットのメタデータを読み取り、書き込み、および処理することができます。PHYLOCHはBEAST、MrBayes、その他の系統学プログラム(PHYLOCHは作者のwebsiteでしか入手できない)から木を読み込むことができます。
  • phyext2 は、シムマップ形式を含むさまざまなツリー形式を読み書きできます。
  • rotl は、Open Tree of Lifeプロジェクトの合成ツリーと個々の調査ツリーを引き出すことができます。

ユーティリティ関数:これらのパッケージは、木や関連するデータを操作するための関数が含まれています。

  • apeは、ランダムに、polytomiesを解決し、ブランチの長さを作成し、ツリーのサイズやその他のプロパティに関する情報を取得するための、より多くの機能を備えています。
  • phylobaseは、ツリー(すなわち、その子孫のちょうど2つで指定された特定のノードからのすべての子孫を取得)を横断するための機能を備えています。
  • geigerは、分類群の重複セットに木やデータを整理することができます。
  • evobiRは(いくつかの違いを許可するように)名のファジー・マッチングを行うことができます。
  • BoSSAは、GenBankおよびBLAST系列からの配列をロードすることができます。
  • rphastは、例えば、配列データから進化の推定モデル、保全または加速するためのアラインメントのスコア、カスタム系統発生隠れマルコフモデルまたは保護に基づいて要素を予測など、比較および進化ゲノミクス分析の多くの種類のために使用することができるPHASTへのRインタフェースを実装する。
  • SigTreeは、多重比較のための補正を可能にしながら、いくつかの治療に応答する枝を検索します。
  • dendextendは、木々を細分葉を追加し、より多く含む樹状図を、操作することができます。

先祖代々の国家再建:

  • 連続的な文字は、最尤、一般化最小二乗またはapeで独立コントラストを用いて再構成することができる。
  • 内部ノードの先祖代々の状態ではないものの、ブラウン運動やオーンスタイン-ウーレンベックモデルの下のルート祖先のキャラクターの状態は、ouchに再構成することができる。
  • 離散文字がapeを使用して状態間の遷移率をパラメータ化マルコフモデルの様々な方法を用いて再構成することができる。
  • markophylo は、制約のある置換率、サイト間での分割率、ブランチ固有率、サンプリングバイアス、および非定常ルート確率を組み込むことができるモデルと離散文字型の広範なセットを収めることができます。
  • phytoolsは、木上の形質の確率的な文字のマッピングを行うことができます。

多様化分析:

  • 時間プロットによる系統は、ape で行うことができます。
  • nLTT は、ABCアプローチにおける要約統計量として使用できる時間統計値を介して正規化された系統を推定することができる。 生存モデルと適合度テスト(多様化モデルのテストに適用される)のように、現存種のみが存在する場合の簡単な出生死モデル(sensu Nee et al。1994)をapeに適合させることができます。
  • TESSは、大量絶滅など、時間依存の多様化とモデルの下で木の尤度を計算することができます。
  • 多様化(sensu MagellonとSanderson)の正味の速度はgeigerで計算することができる。
  • diversitreeは、BiSSE法(マディソンら1997)およびそれ以降の改善(FitzJohnら2009)を実装します。
  • TreeParは、割合が時間の関数(すなわち、大量絶滅イベントで)として、または種の数の関数として変更することができるモデルで分化、絶滅率を推定する。
  • caperは、多様性にAA形質の効果を評価するmacrocaicテストを行うことができます。
  • apTreeshapeも、差動多様化(descriptionを参照)のためのテストを持っています。
  • iteRatesは、ツリーを受けて微分多様化領域を特定し、視覚化することができます。
  • DDDは、密度依存性からの時折の脱出に密度依存モデルと同様のモデルを適合することができます。
  • BAMMtoolsは、レートシフト、多様化モデルの比較、およびその他の機能の可視化を可能にするBAMMプログラムへのインターフェースである。
  • DDDは、種分化や絶滅が多様性に依存しているかどうかをテストするだけでなく、主要な技術革新を識別し、密度依存性プロセスをシミュレートするために、多様性に依存する出生死滅過程に基づいて最尤メソッドを実装しています。
  • expoTreeは、密度依存モデルの下で木の尤度を計算することができます。
  • PBDは、長引く種分化モデルの下で木の尤度を計算することができます。
  • phyloTop は、感染症の木に関連する特別な機能とデータセットを用いたツリーの形状を調査するための機能を有しています。

発散回数:

  • ノンパラメトリック率スムージング(NPRS)とペナルティ尤度はapeに実装することができる。

系統発生推論:

  • UPGMA、近隣結合、系統発生的再構築のバイオnjと高速ME法は、パッケージapeですべて実装されています。
  • phangornは、距離、節約、そして尤度を使用して木を推定することができる。
  • ipsは、Rの中から自分の容易な使用を可能にする、MrBayes、Beast、そしてRAxML含むいくつかの木の推論や他のプログラムをラップしている。
  • phyclustは、それらの配列をクラスタ化することができます。
  • phytoolsは、MRPのsupertree推定と最小二乗を使用してツリーを構築することができます。
  • Rphylipは、倹約、尤度、距離、ブートストラップ、キャラクターの進化、およびより下のツリー推論のためのプログラムの多種多様なPHYLIPをラップします。
  • phylotoolsは、他のソフトウェアでの分析のためのsupermatricesを構築することができます。
  • pastisは、ベイズツリー検索の制約を作るために分類学的情報を使用することができます。
  • RADamiは、pyRADで使用するためにRADseqデータをインポートすることができます。
  • expandsは、腫瘍の系統発生を再構築し、集団にそれらをクラスタ化することができます。outbreaker は、疾患ならびに疾患の広がりの他のパラメータのための伝達木を推論することができます。
  • OutbreakToolsは、同様の機能を持っています。配列データのインポートの詳細については、Geneticsタスクビューを参照してください。pegasも有用であり得る。

時系列:

  • 古生物学の時系列データは、paleoTSを用いて(ランダムウォークまたは静止モデルに基づいて)進化の系統発生のフィッティングと比較モデル(モデルテスト手法を使用して)の尤度ベースのフレームワークを使用して分析することができる。
  • strapは、系統樹の層序解析を行うことができます。

木シミュレーション:

  • 木々は、様々なTreeSimにおける制約やgeigerにおける出生死亡過程で一定のレート出生死を使用してシミュレートすることができます。
  • ランダム木は(ノンパラメトリックツリー用)エッジのランダム分割または(造膜助剤の木のための)ヒントをランダムクラスタリングによってapeで発生させることができる。
  • paleotreeは、化石堆積、サンプリング、およびそれから生じる木だけでなく、観測された化石の分類群を条件とする樹木から発生する木をシミュレートすることができます。
  • TESSは、大量絶滅を含む、時間依存分化および/または絶滅率で木をシミュレートすることができます。

特性の進化:

  • 連続文字のための独立したコントラストがapepicante、またはcaper(これはまた、ブランチやクランチのアルゴリズムを実装しています)を使用して計算することができます。
  • 時間の所与の瞬間に変化する不等速度または速度のモデルならびにPAGELの変換を含む別個の形質進化の分析は、geigerで行うことができる。
  • DiscMLは、観察不能なデータ、ガンマレート分布、およびカスタム遷移行列に対処するためのアプローチを含めて離散形質のモデルの柔軟な配列を実装します。
  • corHMMは、2つまたは3つの(パジェルの旧離散プログラムに似ている)バイナリ形質および(パジェルの旧マルチステートのプログラムに似ている)マルチステート形質の複雑なモデルのために別々の特性だけでなく、フィット感の相関モデルに隠しレートを探すことができます。
  • ブラウン運動モデルはgeigerape、およびpaleotreeに収まることができます。
  • 複数のレートブラウン運動はmotmotとRBrownieに収まることができます(両方とも現在はCRAN上にないが、古いバージョンは、archiveから取得ダウンロードすることができます)。
  • ブラウン運動からの偏差はgeigerOUwieで調べることができる。
  • mvMORPHは、ブラウン運動、初期のバースト、ACDC、OUをフィットし、単変量または多変量データにモデルをシフトすることができます。
  • オーンスタイン-ウーレンベック(OU)のモデルは、(複数の平均、割合、および引力値を持つ)OUwie、(複数の手段で)geigerapeouchに装着することができる。
  • surfaceは、OU最適にシフトを推測するouchをラップする。
  • bayouもまた、異なるOUモデル間のデータ駆動型の選択を可能にする。
  • geigerは、シングルに最適なモデルに適合しています。
  • トレンドを持つパジェルの変換とモデルを含む他の連続モデルは、geigerにフィットすることができます。
  • ANOVAとMANOVAの系統発生文脈でもgeigerで実現することができる。
  • 伝統的なGLS法(sensu GrafenやMartins)はapePHYLOGRcaperで実現することができる。
  • 系統発生的自己回帰(sensu Cheverudら)と系統発生の自己相関(モランのI)は、apeまたはadephyloに実装することができる(ご希望があればモランのIの有意差検定は、ランダム化の手順により計算される)。
  • GLMMを用いて形質との相関関係もMCMCglmmを用いて調べることができる。
  • phylolmは、大きな木に適して、系統発生的線形回帰と高速アルゴリズムを使用して、系統発生ロジスティックregresssionモデルを収めることができます。
  • phytoolsも特色進化の速度を調査し、確率的な文字のマッピングを行うことができます。
  • metaforは、系統発生の構造を占めてメタ分析を行うことができます。
  • pmcは、モンテカルロに近づく使用して(geigerouchから)いくつかの形質モデルのモデル妥当性を評価します。
  • geomorphは、系統発生的文脈で幾何学的形態計測分析を行うことができます。
  • MPSEMは、系統発生固有ベクトルマップを使用して、関連する種からの情報に基づいて、一つの種の特徴を予測することができる。
  • Rphylipは、独立したコントラスト、しきい値モデル、およびより多くを行うことができるPHYLIPをラップします。
  • convevolは、系統発生上の収束進化のためにテストすることができます。

特性シミュレーション:

  • 連続形質は、geigerでspeciationalモデル、OUwieouchでハンセンモデル(OUの形)、ouchgeigerapepicanteOUwie、およびcaperでブラウン運動を使用してシミュレートすることができる。
  • 個別の形質は、geigerで連続時間マルコフモデルを用いてシミュレートすることができる。
  • phangornは、DNAやアミノ酸をシミュレートすることができる。離散と連続形質の両方はレートがgeigerに時間を通じて変化モデルの下でシミュレートすることができます。
  • phytoolsは、確率的な文字マッピングを使用して個別の文字をシミュレートすることができます。
  • phylolmは、ツリーに沿って連続またはバイナリ特性をシミュレートすることができます。

ツリー操作:

  • ACDCを使って枝の長さのスケーリング;パジェルの(1999)ラムダ、デルタとカッパのパラメータ;とオーンスタイン・ウーレンベックアルファパラメータ(ultrametricツリー用のみ)はgeigerで提供されています。
  • phytoolsもブランチの長さのスケーリングと同様に、いくつかのツリーの変換(ヒントを追加、サブツリーを見つけること)ができます。
  • ルーティング、polytomiesの解決、先端の落下、Grafenの方法を含めブランチ長の設定は、すべてのapeを使用して行うことができます。
  • 絶滅分類群は、geigerを使って枝刈りすることができます。
  • phylobaseは、クエリや木々(S4)を使用するための多数の機能を提供しています。
  • ツリーの再構成(NNIおよびSPR)はphangornを行うことができる。
  • paleotreeは、化石の分類群だけでなく、より普遍的な変換で発生サンプリングの問題に基づいてツリーを操作するための機能を備えています。
  • dendextendは、木々を細分葉を追加し、より多く含む樹状図を、操作することができます。

コミュニティ/微生物生態学:

  • picanteveganSYNCSAphylotoolsPCPScaperDAMOCLES 、およびcatiは群集生態学と系統学を使用するためのいくつかのツールを統合します。
  • HMPTreesGUniFracは微生物群集を比較するためのツールを提供しています。
  • betapartは、ターンオーバーと、分類学上(ベースの発生率と豊かさ)の機能と系統発生のベータ多様性のnestedness-結果として得られる成分を分離、コンピューティング・ペアワイズ相違点(距離のマトリックス)と複数サイトの相違を可能にします。

Phyloclimaticモデリング:

  • phyloclimは、この分野でいくつかの新しいツールが統合されています。

系統地理/生物地理学:

  • phylolandは、系統発生上のマッピングされた空間移民のモデルを実装し、それは統計的な系統地理学的枠組みの中で限られた分散および競合的排除を推定することを目的としている。
  • jaathaは、種ごとに複数の個人と2種のために人口統計学的なパラメータを推測することができます。
  • BioGeoBEARSは、離散生物地理学のためのさまざまなモデルを実装しています。

種/人口区切り:

  • adhocは、DNAバーコードの参照ライブラリのためのアドホック距離閾値を推定することができる。

ツリープロットと可視化:

  • ユーザーの木はapeadephylophylobasephytoolsouchおよびdendextendを使ってプロットすることができます。
  • paleoPhylopaleotreeは古生物学的系統発生を描画するために特化されます。
  • 木々も検討(ズーム)とapeを使用して相関曲線とみなすことができる。
  • 先祖代々の状態の再構築は、apepaleotreeを使って枝に沿って可視化することができる。
  • phytoolsは、morphospaceにツリーを投影することができる。
  • BAMMtoolsは、木の上BAMMによって計算されたレートシフトを視覚化することができます。
  • 人気のR可視化パッケージggplot2は系統発生を可視化するためにggtreeによって拡張することができる。
  • 樹木は、idendr0 を使って(樹状図として)対話的に調べることもできます。
  • phylocanvas は、phylocanvas javascriptライブラリを使用して系統樹を埋め込むことを可能にする「htmlwidgets」のウィジェットです。

木の比較:

  • ツリーとツリーの距離は、distoryRphylipでを評価し、追加の分析で用いることができる。
  • apeは、ツリーツリーの距離を計算し、また、関連するヒントの間のリンクと2本の木を示すプロットを作成することができます。
  • kdetreesは、このような水平遺伝子伝達などの推論の問題やプロセスを表すことができる系統樹のコレクション内の潜在的な範囲外の観測を識別するためのノンパラメトリックメソッドを実装します。
  • dendextendは、デンドログラムを比較して、複数の対策を評価することができます。

分類:

  • taxizeなど、種名を確認する分類学的階層を取得し、名前のスペルを確認するなどの分類学的タスクのためのWeb APIを一式と対話することができます。
  • evobiRは(文字の進化のシミュレーション、D-統計を計算するなど)、より高い分類学的レベルでツリーを作り、NCBIまたはITIS、および様々な他の雑多な機能から分類ツリーをダウンロードするための関数が含まれています。
  • ReolもEOLによって使用されるタクソノミーから分類木を作成することができます。
  • pastisは、ベイズツリー検索の制約を作るために分類学的情報を使用することができます。

遺伝子ツリー-種の木:

  • HyPhyは、種ツリーに遺伝子ツリーを和解させる重複や損失コストをカウントすることができます。それはまた、家族の木の中から遺伝子の木の履歴をsamplyすることができます。
  • phybaseは、シミュレートし、遺伝子の木と種の木を分析するための多くの機能を持つが、もはやCRAN上にない。
  • rmetasim は、metasimシミュレーションエンジンを使用して風景の向こう側の人物や個人をシミュレートできます。

その他:

  • treebaseは、TreeBase、系統発生と系統発生データのオンラインリポジトリから木をダウンロードするための方法を提供しています。

注意事項:

  • 少なくとも10個のパッケージがこのドメインでphy *として開始されます。同様の名前のパッケージ(phytoolsとphylotools、phylobaseとphybase)が2組含まれています。 これは簡単に混乱を招く可能性があり、将来のパッケージ作成者はパッケージの命名時にこのような重複を考慮することが推奨されます。
  • 明確にするために、phytools は、特に比較メソッドのための幅広い機能を提供しており、Liam Revellによって管理されています。
  • phylotools は、スーパーマトリックスを構築する機能があり、Jinlong Zhangによって管理されています。
  • phylobase は、系統樹および関連するデータのためのS4クラスを実装し、Francois Michonneauによって維持されています。
  • phybase は、樹木の実用的な機能と遺伝子樹木の質問に対する多くの機能を持ち、Liang Liuによって書かれていますが、もはやCRANには現れません。

 

参考資料

  • Butler MA, King AA 2004 Phylogenetic comparative analysis: A modeling approach for adaptive evolution. American Naturalist 164, 683-695.
  • Cheverud JM, Dow MM, Leutenegger W 1985 The quantitative assessment of phylogenetic constraints in comparative analyses: Sexual dimorphism in body weight among primates. Evolution 39, 1335-1351.
  • FitzJohn RG, Maddison WP, and Otto SP 2009. Estimating trait-dependent speciation and extinction rates from incompletely resolved phylogenies. Systematic Biology 58: 595-611.
  • Garland T, Harvey PH, Ives AR 1992 Procedures for the analysis of comparative data using phylogenetically independent contrasts. Systematic Biology 41, 18-32.
  • Hansen TF 1997. Stabilizing selection and the comparative analysis of adaptation. Evolution 51: 1341-1351.
  • Maddison WP, Midford PE, and Otto SP 2007. Estimating a binary character’s effect on speciation and extinction. Systematic Biology 56: 701?710.
  • Magallon S, Sanderson, M.J. 2001. Absolute Diversification Rates in Angiosperm Clades. Evolution 55(9):1762-1780.
  • Moore, BR, Chan, KMA, Donoghue, MJ (2004) Detecting diversification rate variation in supertrees. In Bininda-Emonds ORP (ed) Phylogenetic Supertrees: Combining Information to Reveal the Tree of Life, Kluwer Academic pgs 487-533.
  • Nee S, May RM, Harvey PH 1994. The reconstructed evolutionary process. Philosophical Transactions of the Royal Society of London Series B Biological Sciences 344: 305-311.
  • Pagel M 1999 Inferring the historical patterns of biological evolution. Nature 401, 877-884
  • Pybus OG, Harvey PH 2000. Testing macro-evolutionary models using incomplete molecular phylogenies. Proceedings of the Royal Society of London Series B Biological Sciences 267, 2267-2272.
R言語 CRAN Task View:系統学、特に比較方法

One thought on “R言語 CRAN Task View:系統学、特に比較方法

Comments are closed.