CRAN Task View: Phylogenetics, Especially Comparative Methodsの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載しました。
Maintainer: | Brian O’Meara |
Contact: | omeara.brian at gmail.com |
Version: | 2022-03-21 |
URL: | https://CRAN.R-project.org/view=Phylogenetics |
生命の歴史は系統学的な状況の中で展開されます。比較系統発生法は、系統樹に沿った歴史的パターンを分析するための統計的アプローチです。このタスクビューは、様々な異なる比較系統発生方法を実装するRパッケージを記述します。これは活発な研究分野であり、情報の多くは変更される可能性があります。注意すべきことは、多くの重要なパッケージはCRANにはないということです。以前はCRANにあったもので、後でアーカイブされました(例えば、Rが更新されたときに必要な変更を加えられなかった場合など) まだCRANにはありません。そのようなパッケージはgithub、R-forgeまたは著者のWebサイトにあります。
Rに木を取得する:
- Rのツリーは通常、S3 phyloクラス(apeで実装)に格納されますが、S4 phylo4クラス(phylobaseで実装)も使用できます。
- apeは、newickフォーマット(時々一般にphylipフォーマットとして知られている)やNEXUS形式の外部ファイルからのツリーを読み取ることができます。またnewick文字列(すなわち、「(human,(chimp,bonobo));」)として手作業で木の入力を読み取ることができます。
- phylobaseとその軽量の兄弟rnclは、Nexus Class Libraryを使用してNEXUS、Newickおよびその他のツリー形式を読み取ることができます。
- treebaseは、オンラインツリーリポジトリTreeBASEからツリーを読み込み検索できます。
- rdryadは、オンラインデータリポジトリDryadからデータを引き出すことができます。
- RNeXMLは、NeXMLフォーマットのメタデータを読み取りおよび書き込み、処理することができます。PHYLOCHは、BEAST、MrBayes、その他の系統学プログラム(PHYLOCHは作者のwebsiteでしか入手できない)から木を読み込むことができます。
- phyext2は、シムマップ形式を含むさまざまなツリー形式を読み書きできます。
- rotlは、Open Tree of Lifeプロジェクトの合成ツリーと個々の調査ツリーを引き出すことができます。
- treeioパッケージは、Newick、Nexus、New Hampshire eXtendedフォーマット(NHX)、jplaceとPhylipフォーマット、BEAST、EPA、HyPhy、MrBayes、PAML、PHYLDOG、pplacer、r8s、RAxML、RevBayesのデータを読み込むことができます。
- phylogramは、Newickファイルを樹状図オブジェクトに変換できます。
- brranchingは、phylomaticを含むオンラインリポジトリから系統樹を取り出すことができます。
ユーティリティ関数:これらのパッケージは、木や関連するデータを操作するための関数が含まれています。
- apeは、ランダムに、polytomiesを解決し、ブランチの長さを作成し、ツリーのサイズやその他のプロパティに関する情報を取得するための、より多くの機能を備えています。
- phylobaseは、ツリー(すなわち、その子孫のちょうど2つで指定された特定のノードからのすべての子孫を取得)を横断するための機能を備えています。
- geigerは、分類群の重複セットに木やデータを整理することができます。
- tidytreeは、ツリーオブジェクトをきちんとしたデータフレームに変換することができ、ツリーデータを操作するための他のきちんとしたアプローチを持っています。
- evobiRは、(いくつかの違いを許可するように)名のファジー・マッチングを行うことができます。
- SigTreeは、多重比較のための補正を可能にしながら、いくつかの治療に応答する枝を検索します。
- dendextendは、木々を細分葉を追加し、より多く含む樹状図を、操作することができます。
- apexは、複数の遺伝子DNAアライメントを扱うことができ、apeおよびphangornの樹木推論の使用および分析をより容易にします。
- aphidは、系統学に基づいて配列を重み付けすることができ、多重配列アラインメントを含む様々な目的のために隠れマルコフモデル(HMM)を使用することができます。
先祖代々の国家再建:
- 連続的な文字は、最尤、一般化最小二乗またはapeで独立コントラストを用いて再構成することができます。
- 内部ノードの先祖代々の状態ではないものの、ブラウン運動やオーンスタイン-ウーレンベックモデルの下のルート祖先のキャラクターの状態は、ouchに再構成することができます。
- 離散文字がapeを使用して状態間の遷移率をパラメータ化マルコフモデルの様々な方法を用いて再構成することができます。
- markophyloは、制約のある置換率、サイト間での分割率、ブランチ固有率、サンプリングバイアス、および非定常ルート確率を組み込むことができるモデルと離散文字型の広範なセットを収めることができます。
- phytoolsは、木上の形質の確率的な文字のマッピングを行うことができます。
多様化分析:
- 時間プロットによる系統は、apeで行うことができます。
- 現存する種のみが存在する場合の単純な出生死モデル(sensu Nee ら1994)は、生存モデルおよび適合度検定(多様化モデルの検定に適用される)と同様にapeに適合させることができます。
- TESSは、大量絶滅など、時間依存の多様化とモデルの下で木の尤度を計算することができます。
- geigerは、多様化(sensu MagellonとSanderson)の正味の速度を計算することができます。
- diversitreeは、BiSSE法(マディソンら1997)およびそれ以降の改善(FitzJohnら2009)を実装します。
- TreeParは、割合が時間の関数(すなわち、大量絶滅イベントで)として、または種の数の関数として変更することができるモデルで分化、絶滅率を推定します。
- caperは、多様性にAA形質の効果を評価するmacrocaicテストを行うことができます。
- apTreeshapeは、差動多様化(descriptionを参照)のためのテストを持っています。
- iteRatesは、ツリーを受けて微分多様化領域を特定し、視覚化することができます。
- DDDは、密度依存性からの時折の脱出に密度依存モデルと同様のモデルを適合することができます。
- BAMMtoolsは、レートシフト、多様化モデルの比較、およびその他の機能の可視化を可能にするBAMMプログラムへのインターフェースです。
- DDDは、種分化や絶滅が多様性に依存しているかどうかをテストするだけでなく、主要な技術革新を識別し、密度依存性プロセスをシミュレートするために、多様性に依存する出生死滅過程に基づいて最尤メソッドを実装しています。
- PBDは、長引く種分化モデルの下で木の尤度を計算することができます。
- phyloTopは、感染症の木に関連する特別な機能とデータセットを用いたツリーの形状を調査するための機能を有しています。
発散回数:
- ノンパラメトリック率スムージング(NPRS)とペナルティ尤度は、apeに実装することができます。
- geigerは、指定された標準ツリーに一致するソースツリーを伸ばすための合同処理を行うことができます。
- treedaterは、さまざまな時計モデル、信頼性を評価する方法、および異常値を検出する方法を実装します。
系統発生推論:
- apeは、UPGMA、近隣結合、系統発生的再構築のバイオnjと高速ME法をすべて実装しています。
- phangornは、距離、節約、そして尤度を使用して木を推定することができます。
- ipsは、MrBayes、Beast、RAxMLを含むいくつかのツリー推論と他のプログラムをラップし、R内から簡単に使用できるようにします。
- phyclustは、それらの配列をクラスタ化することができます。
- phytoolsは、MRPのsupertree推定と最小二乗を使用してツリーを構築することができます。
- Rphylipは、倹約、尤度、距離、ブートストラップ、キャラクターの進化、およびより下のツリー推論のためのプログラムの多種多様なPHYLIPをラップします。
- phylotoolsは、他のソフトウェアでの分析のためのsupermatricesを構築することができます。
- pastisは、ベイズツリー検索の制約を作るために分類学的情報を使用することができます。
- 配列データのインポートの詳細については、Genetics タスクビューを参照してください。
- pegasも有用であるかもしれません。
時系列:
- 古生物学の時系列データは、paleoTSを用いて(ランダムウォークまたは静止モデルに基づいて)進化の系統発生のフィッティングと比較モデル(モデルテスト手法を使用して)の尤度ベースのフレームワークを使用して分析することができます。
- strapは、系統樹の層序解析を行うことができます。
木シミュレーション:
- 木々は、様々なTreeSimにおける制約やgeigerにおける出生死亡過程で一定のレート出生死を使用してシミュレートすることができます。
- ランダム木は(ノンパラメトリックツリー用)エッジのランダム分割または(造膜助剤の木のための)ヒントをランダムクラスタリングによってapeで発生させることができます。
- paleotreeは、化石堆積、サンプリング、およびそれから生じる木だけでなく、観測された化石の分類群を条件とする樹木から発生する木をシミュレートすることができます。
- TESSは、大量絶滅を含む、時間依存分化および/または絶滅率で木をシミュレートすることができます。
特性の進化:
- 連続文字のための独立したコントラストがape、picanteまたはcaper(これはまた、ブランチやクランチのアルゴリズムを実装しています)を使用して計算することができます。
- 時間の所与の瞬間に変化する不等速度または速度のモデルならびにPAGELの変換を含む別個の形質進化の分析は、geigerで行うことができます。
- ブラウン運動モデルは、geigerおよびape、paleotreeに収まることができます。
- 多速度ブラウン運動は、RBrownieに適合することができます。
- ブラウン運動からの偏差は、geigerおよびOUwieで調べることができます。
- mvMORPHは、ブラウン運動、初期のバースト、ACDC、OUをフィットし、単変量または多変量データにモデルをシフトすることができます。
- オーンスタイン-ウーレンベック(OU)のモデルは、(複数の平均、割合、および引力値を持つ)OUwie、(複数の手段で)geiger、ape、ouchに装着することができます。
- geigerは、シングルに最適なモデルに適合しています。
- geigerは、トレンドを持つパジェルの変換とモデルを含む他の連続モデルを適合させます。
- geigerは、ANOVAとMANOVAの系統発生文脈を実行できます。
- apeおよびPHYLOGR、caperは、伝統的なGLS法(sensu GrafenやMartins)を実行できます。
- 系統発生的自己回帰(sensu Cheverud et al)および系統発生的自己相関(Moran’s I)は、apeで実装することができます-または、Moran’s Iの有意性検定をランダム化手順を介して計算する場合は、adephyloで実行できます。
- MCMCglmmは、GLMMを用いて形質との相関関係を調べることができます。
- phylolmは、大きな木に適して、系統発生的線形回帰と高速アルゴリズムを使用して、系統発生ロジスティックregresssionモデルを収めることができます。
- brmsは、連続形質と離散形質の間の相関関係を調べることができ、種ごとに複数の測定値を組み込むことができます。
- phytoolsも、特色進化の速度を調査し、確率的な文字のマッピングを行うことができます。
- metaforは、系統発生の構造を占めてメタ分析を行うことができます。
- pmcは、モンテカルロに近づく使用して(geigerとouchから)いくつかの形質モデルのモデル妥当性を評価します。
- phyregは、Grafen(1989)の系統発生系回帰を実装しています。
- geomorphは、系統発生的文脈で幾何学的形態計測分析を行うことができます。
- dispRityは、時間による視差および他の視差関連の分析を行うことができます。
- MPSEMは、系統発生固有ベクトルマップを使用して、関連する種からの情報に基づいて、一つの種の特徴を予測することができます。
- Rphylipは、独立したコントラスト、しきい値モデル、およびより多くを行うことができるPHYLIPをラップします。
- convevolとwindexは、どちらも系統発生の収束進化をテストすることができます。
特性シミュレーション:
- 連続形質は、geigerでspeciationalモデル、OUwie、ouchでハンセンモデル(OUの形)、ouch、geiger、ape、picante、OUwieおよびcaperでブラウン運動を使用してシミュレートすることができます。
- 個別の形質は、geigerで連続時間マルコフモデルを用いてシミュレートすることができます。
- phangornは、DNAやアミノ酸をシミュレートすることができます。
- 離散と連続形質の両方はレートは、geigerに時間を通じて変化モデルの下でシミュレートすることができます。
- phytoolsは、確率的な文字マッピングを使用して個別の文字をシミュレートすることができます。
- phylolmは、ツリーに沿って連続またはバイナリ特性をシミュレートすることができます。
ツリー操作:
- ACDCを使用したブランチ長のスケーリング。 Pagel(1999)のラムダ、デルタ、カッパパラメータ。 Ornstein-Uhlenbeck alphaパラメーター(ウルトラメトリックツリーのみ)は、geigerで使用できます。
- phytoolsは、ブランチの長さのスケーリングと同様に、いくつかのツリーの変換(ヒントを追加、サブツリーを見つけること)ができます。
- 発根、ポリトミーの解決、ヒントのドロップ、Grafenの方法を含む枝の長さの設定はすべて、apeを使用して実行できます。
- 絶滅分類群は、geigerを使って枝刈りすることができます。
- phylobaseは、クエリや木々(S4)を使用するための多数の機能を提供しています。
- ツリーの再構成(NNIおよびSPR)は、phangornで実行できます。
- paleotreeは、化石の分類群だけでなく、より普遍的な変換で発生サンプリングの問題に基づいてツリーを操作するための機能を備えています。
- dendextendは、木々を細分葉を追加し、より多く含む樹状図を、操作することができます。
コミュニティ/微生物生態学:
- picanteおよびvegan、SYNCSA、phylotools、PCPS、caper、DAMOCLESは、群集生態学と系統学を使用するためのいくつかのツールを統合します。
- HMPTreesとGUniFracは、微生物群集を比較するためのツールを提供しています。
- betapartは、ターンオーバーと、分類学上(ベースの発生率と豊かさ)の機能と系統発生のベータ多様性のnestedness-結果として得られる成分を分離、コンピューティング・ペアワイズ相違点(距離のマトリックス)と複数サイトの相違を可能にします。
- adivは、種、機能、系統発生の多様性、アルファ、ベータ、ガンマの多様性を含む多様な生物多様性の指標を計算することができます。
- entropartは、Tsallisエントロピーに基づいて多様性を測定し、分割し、アルファ、ベータ、およびガンマ多様性を計算することができます。
- metacoderは、メタデータのような最新のハイスループットシーケンシングから生成されたような大きな分類データセットを扱うためのRパッケージです。
Phyloclimaticモデリング:
- phyloclimは、この分野でいくつかの新しいツールが統合されています。
系統地理/生物地理学:
- phylolandは、系統発生上のマッピングされた空間移民のモデルを実装し、それは統計的な系統地理学的枠組みの中で限られた分散および競合的排除を推定することを目的としています。
- diversitreeは、2つの領域に基づく多様化分析のためのGeoSSEメソッドを実装しています。
種/人口区切り:
- adhocは、DNAバーコードの参照ライブラリのためのアドホック距離閾値を推定することができます。
ツリープロットと可視化:
- ユーザーの木は、apeおよびadephylo、phylobase、phytools、ouch、dendextendを使ってプロットすることができます。
- paleoPhyloとpaleotreeは、古生物学的系統発生を描画するために特化されます。
- 木々も検討(ズーム)とapeを使用して相関曲線とみなすことができます。
- 先祖代々の状態の再構築は、apeとpaleotreeを使って枝に沿って可視化することができます。
- phytoolsは、morphospaceにツリーを投影することができます。
- BAMMtoolsは、木の上BAMMによって計算されたレートシフトを視覚化することができます。
- 人気のR可視化パッケージggplot2は、系統発生を可視化するためにggtreeによって拡張することができます。
- 樹木は、idendr0 を使って(樹状図として)対話的に調べることもできます。
- phylocanvasは、phylocanvas javascriptライブラリを使用して系統樹を埋め込むことを可能にする「htmlwidgets」のウィジェットです。
- ggmullerは、系統発生を頻度ダイナミクスとともにプロットすることを可能にします。
木の比較:
- ツリーとツリーの距離は、distoryとRphylipで評価し、追加の分析で用いることができます。
- apeは、ツリーツリーの距離を計算し、また、関連するヒントの間のリンクと2本の木を示すプロットを作成することができます。
- kdetreesは、このような水平遺伝子伝達などの推論の問題やプロセスを表すことができる系統樹のコレクション内の潜在的な範囲外の観測を識別するためのノンパラメトリックメソッドを実装します。
- dendextendは、デンドログラムを比較して、複数の対策を評価することができます。
分類:
- taxizeなど、種名を確認する分類学的階層を取得し、名前のスペルを確認するなどの分類学的タスクのためのWeb APIを一式と対話することができます。
- evobiRは、(文字の進化のシミュレーション、D-統計を計算するなど)、より高い分類学的レベルでツリーを作り、NCBIまたはITIS、および様々な他の雑多な機能から分類ツリーをダウンロードするための関数が含まれています。
- pastisは、ベイズツリー検索の制約を作るために分類学的情報を使用することができます。
遺伝子ツリー-種の木:
- HyPhyは、種ツリーに遺伝子ツリーを和解させる重複や損失コストをカウントすることができます。それはまた、家族の木の中から遺伝子の木の履歴をsamplyすることができます。
他のプログラムとの相互作用:
- geigerは、合同関数を通じてPATHd8を呼び出すことができます。
- ipsは、MrBayes、Beast、RAxMLなどのいくつかのツリー推論やその他のプログラムをラップし、Rから簡単に使用できるようにします。
- Rphylipは、パシモニー、尤度、距離、ブートストラッピング、文字の進化などの下で、ツリー推論のための幅広い種類のプログラムであるPHYLIP をラップします。
- BoSSAは、さまざまなツールからの情報を使用して、照会シーケンスを参照ツリーに配置できます。
- pastisは、分類学的情報を使用して、MrBayesツリーの検索に制約を加えることができます。
その他:
- treebaseは、TreeBase、系統発生と系統発生データのオンラインリポジトリから木をダウンロードするための方法を提供しています。
注意事項:
- 少なくとも10個のパッケージがこのドメインでphy *として開始されます。同様の名前のパッケージ(phytoolsとphylotools、phylobaseとphybase)が2組含まれています。これは簡単に混乱を招く可能性があり、将来のパッケージ作成者はパッケージの命名時にこのような重複を考慮することが推奨されます。
- phytoolsは、特に比較メソッドのための幅広い機能を提供しており、Liam Revellによって管理されています。
- phylotoolsは、スーパーマトリックスを構築する機能があり、Jinlong Zhangによって管理されています。
- phylobaseは、系統樹および関連するデータのためのS4クラスを実装し、Francois Michonneauによって維持されています。
- phybaseは、樹木の実用的な機能と遺伝子樹木の質問に対する多くの機能を持ち、Liang Liuによって書かれていますが、もはやCRANには現れません。
参考資料
- Borregaard, M.K., Rahbek, C., Fjeldsaa, J., Parra, J.L., Whittaker, R.J. and Graham, C.H. 2014. Node-based analysis of species distributions. Methods in Ecology and Evolution 5(11): 1225-1235.
- Butler MA, King AA 2004 Phylogenetic comparative analysis: A modeling approach for adaptive evolution. American Naturalist 164, 683-695.
- Cheverud JM, Dow MM, Leutenegger W 1985 The quantitative assessment of phylogenetic constraints in comparative analyses: Sexual dimorphism in body weight among primates. Evolution 39, 1335-1351.
- FitzJohn RG, Maddison WP, and Otto SP 2009. Estimating trait-dependent speciation and extinction rates from incompletely resolved phylogenies. Systematic Biology 58: 595-611.
- Garland T, Harvey PH, Ives AR 1992 Procedures for the analysis of comparative data using phylogenetically independent contrasts. Systematic Biology 41, 18-32.
- Hansen TF 1997. Stabilizing selection and the comparative analysis of adaptation. Evolution 51: 1341-1351.
- Maddison WP, Midford PE, and Otto SP 2007. Estimating a binary character’s effect on speciation and extinction. Systematic Biology 56: 701–710.
- Magallon S, Sanderson, M.J. 2001. Absolute Diversification Rates in Angiosperm Clades. Evolution 55(9):1762-1780.
- Moore, BR, Chan, KMA, Donoghue, MJ (2004) Detecting diversification rate variation in supertrees. In Bininda-Emonds ORP (ed) Phylogenetic Supertrees: Combining Information to Reveal the Tree of Life, Kluwer Academic pgs 487-533.
- Nee S, May RM, Harvey PH 1994. The reconstructed evolutionary process. Philosophical Transactions of the Royal Society of London Series B Biological Sciences 344: 305-311.
- Pagel M 1999 Inferring the historical patterns of biological evolution. Nature 401, 877-884
- Pybus OG, Harvey PH 2000. Testing macro-evolutionary models using incomplete molecular phylogenies. Proceedings of the Royal Society of London Series B Biological Sciences 267, 2267-2272.
R言語 CRAN Task View:系統学、特に比較方法
ピンバック:R言語 CRAN Task Views | トライフィールズ