CRAN Task View: Phylogeneticsについて、機械翻訳を交えて日本語化し掲載しております。
Maintainer: | William Gearty, Brian O’Meara, Jacob Berv, Gustavo A. Ballen, Diniz Ferreira, Hilmar Lapp, Lars Schmitz, Martin R. Smith, Nathan S. Upham, Jonathan A. Nations |
Contact: | willgearty at gmail.com |
Version: | 2023-04-03 |
URL: | https://CRAN.R-project.org/view=Phylogenetics |
Source: | https://github.com/cran-task-views/Phylogenetics/ |
Contributions: | このタスクビューに対する提案や改良は、GitHubのissueやpull request、またはメンテナのアドレスに電子メールで送ってください。詳しくはContributing guideをご覧ください。 |
Installation: | このタスクビューのパッケージは、ctvパッケージを使用して自動的にインストールすることができます。例えば、ctv::install.views(“Phylogenetics”, coreOnly = TRUE)は全てのコアパッケージをインストールし、ctv::update.views(“Phylogenetics”)はまだインストールしていない全てのパッケージと最新のものをインストールします。詳しくはCRAN Task View Initiativeを参照してください。 |
概要
生命の歴史は系統的な文脈の中で展開され、この進化の歴史を表すために系統樹(しばしば「ツリー」と略される)が開発されます。比較系統樹法は、このような系統樹に沿った歴史的パターンを分析するための統計的アプローチです。このタスクビューでは、(i)系統樹の取り扱い、操作、解析を容易にするRパッケージ、(ii)比較系統樹法を実装するRパッケージ、(iii)系統樹法を特定の分野に適用するRパッケージについて説明します。これは活発な研究分野であり、情報の多くは変更される可能性があります。多くの重要なパッケージはCRANにありません: 以前 CRANにあり、後にアーカイブされた(例えば、R が更新される際に必要な変更を取り込めなかった場合)か、他の場所で開発されCRANではまだ利用できないかのどちらかです。このようなパッケージは、GitHub、R-Forge、Bioconductor、または著者のウェブサイトにあります。このドメインでは、少なくとも10個のパッケージがphy*として始まり、2組の似た名前のパッケージ(phytoolsとphylotools、phylobaseとphybase)があります。
質問があれば、タスクビューのメンテナーや特定のパッケージのメンテナーに遠慮なく連絡してください。また、R-SIG-Phyloメーリングリストを購読している方は、そちらにも質問をお寄せください。
範囲
コアパッケージ
- apeは、Rで系統樹を保存するために一般的に使用されるS3 phyloクラスを実装します。
- これは、Newick/PhylipおよびNEXUS形式のツリーの読み取り、書き込み、視覚化によく使用されます。
- また、樹木の操作(樹木の根付け、先端の削除、ポリトミーのランダムな解消など)、樹木の推定(近傍結合、bio-nj、高速ME法など)、系統的比較解析(離散的・連続的キャラクタの再構築、形質進化と多様化の基本モデルの当てはめなど)を行うための多くの機能を備えています。
- また、ランダム ツリーの生成、GenBankからのデータの取得、時間およびコレログラム・プロットによる系統の作成にも使用できます。
- phylobaseは、系統樹と比較データを組み合わせるS4 phylo4クラスを実装します。
- この新しいクラスは、S3 phyloクラスほど一般的には使用されていませんが、系統比較手法(adephyloやphylosignalなど)を実装する新しいパッケージの間で注目を集めています。
- geigerは、形質の進化と多様化を分析するための大規模なモデル・フィッティング・アプローチを実装しています。
- これは、離散的および連続的形質進化のさまざまなモデル(ブラウン運動、オーンシュタイン-ウーレンベック、パーゲル変換、傾向のあるモデルなど)を適合および比較するために最も一般的に使用されます。
- また、系統発生や、離散的および連続的な形質の進化をシミュレートするためにもよく使用されます。
- また、他のパッケージでよく使用されるいくつかの補助関数もあります。
- phytoolsは、系統樹や比較データの可視化(例えば、形態空間への投影)、操作(例えば、枝長の拡大縮小や変換、ヒントの追加、サブツリーの発見)、読み取りや書き込み、さらには推論を行うための系統樹比較分析を実行するための機能を絶えず増やしています。
タスク
タスクビュー内のパッケージは以下のタスクカテゴリの1つ以上に分類されます:
- R でのツリーの操作:系統データの処理、操作、視覚化に特化したパッケージ
- R でのツリーの構築:系統推論とツリー シミュレーション用のパッケージ
- 比較系統解析法:形質の進化や多様化を扱うものを含む、さまざまな比較系統解析手法を実行するためのパッケージ
- 他の分野の系統発生学:古生物学、群集生態学、生物地理学、遺伝学などの分野固有の系統解析を実行するように設計されたパッケージ
- その他の便利なパッケージとその他:分類学的マッチングなどの系統解析の実行に役立つパッケージ
R でツリーを操作する
ツリーを R に取り込む
- phylobaseとその軽量兄弟であるrnclは、Nexus Class Libraryを使用してNEXUS、Newick、およびその他のツリー形式を読み取ることができます。
- treebaseは、オンライン・ツリー・リポジトリTreeBASEからツリーを検索してロードできます。
- RNeXMLは、NeXML形式のメタデータの読み取り、書き込み、処理を行うことができます。
- TreeToolsは、apeでサポートされていないNexus形式の拡張子やMorphoBankからのメタデータを含む、TNT形式およびNEXUS形式の外部ファイルからツリーを読み取ることができます。
- ipsは、BEAST、MrBayes、およびその他の系統発生学プログラムからツリーをロードできます。 このパッケージは、BEASTまたはMrBayesの出力からのノード サポートおよびその他の値を解析するために使用できます。
- phylotateは、注釈を保持しながら、NEXUSおよびNewick形式でape互換のある系統樹を読み書きできます。
- phyext2は、simmap形式を含むさまざまなツリー形式を読み書きできます。
- rotlは、Open Tree of Lifeプロジェクトから合成ツリーと個々の研究ツリーを取り込むことができます。
- treeioは、Newick、Nexus、New Hampshire eXtended形式(NHX)、jplace、およびPhylip形式のツリーと、BEAST、EPA、HyPhy、MrBayes、PAML、PHYLDOG、pplacer、r8s、RAxML、およびRevBayesからのデータ出力を読み取ることができます。
- phylogramは、Newickファイルを樹状図オブジェクトに変換できます。
- dendextendは、そのような樹状図オブジェクトを操作できます。
- phytoolsは、単純なNewickおよびNexus形式でツリーを読み書きできるほか、エンコードされた個別文字を含む「simmap」ツリーも読み書きできます。
ツリー操作
- phylobaseは、ツリーを走査するための関数があります(たとえば、その子孫のうち2つだけで指定された特定のノードからすべての子孫を取得します)。
- geigerは、重複する分類群のセットに合わせてツリーとデータをプルーニングできます。ACDCを使用して分岐長スケーリングを実行するためにも使用できます。Pagel(1999)のラムダ、デルタ、カッパのパラメータ。オーンシュタイン・ウーレンベック・アルファ・パラメーター(ウルトラメトリック・ツリーのみ)。 絶滅した分類群の剪定にも使用できます。
- TreeToolsは、制約の適用を含め、ツリーの形状とバランスを定量化および操作する機能があります。 樹木の系統情報内容を測定すること。
- Rogueは、ワイルドカード分類群を識別し、より有益な要約ツリーを生成します。
- tidytreeは、ツリー オブジェクトをTidyデータ フレームに変換でき、ツリー データを操作するための他のTidyアプローチも備えています。
- evobiRは、名前のあいまい一致を行うことができます(多少の違いを許容するため)。
- SigTreeは、複数の比較の修正を可能にしながら、何らかの処理に応答するブランチを見つけます。
- dendextendは、ツリーの細分化、葉の追加など、樹状図を操作できます。
- apex (archived)は、複数の遺伝子DNAアライメントを処理できるため、apeやphangornでのツリー推論のための使用と分析が容易になります。
- aphidは。系統発生に基づいて配列に重み付けを行うことができ、複数の配列アラインメントを含むさまざまな目的で隠れマルコフ・モデル(HMM)を使用できます。
- phangornとTreeSearchは、ツリーの再配置(NNI、SPR、および TBR)を実行できます。
- paleotreeは、化石分類群で発生するサンプリング問題やより普遍的な変換に基づいて樹木を操作する機能があります。
- dendextendは、ツリーの細分化、葉の追加など、樹状図を操作できます。
- castorを使用すると、非常に大きな木(最大数百万の先端)を操作できます。
- phytoolsは、あらかじめ指定されたポイントで木をスライスしたり、木にランダムに分類群を追加したり、属に種を追加したり、1つの先端を木に結合したり、2つの木を一緒に結合したり、クリック可能なインターフェイスを使用して木でクレードを折りたたんだり、中間点ルーティングを実行したり、ユーザーが指定した離散文字レジームを木にペイントしてさまざまな方法で「simmap」オブジェクトを作成したり、マッピングされた文字を持つ木を分岐していないノードを持つ単純な「phylo」オブジェクトに変換したり、ルートエッジを分岐していない1つのノードに変換したりすることができます。
ツリーの可視化
- ape、adephylo、phylobase、phytools、ouch、dendextendには、ツリーをプロットするための関数があります。これらのいくつかには、何らかの基準(祖先の状態、ツリー構造など)に基づいて枝または分類群の色付けを行うオプションがあります。さらに、phytoolsは、比較データをツリーの先端にプロットしたり、比較分析の結果をグラフ化したり、共系統をプロットしたりするための実質的な機能があります。
- paleoPhyloとpaleotreeは、古生物系統図の描画に特化しています。
- viperを使用すると、分岐サポート、HPD間隔などを使用して系統発生に注釈を付けることができます。
- 人気のあるR視覚化パッケージggplot2は、系統発生を視覚化するためにggtreeおよびggtreeExtraによって拡張でき、deeptimeを使用して地質学的タイムスケールを追加できます。
- strapを使用すると、層序範囲とともに地質学的タイムスケールを系統発生に追加できます。
- idendr0を使用すると、ツリーを(樹状図として)インタラクティブに探索できます。
- phylocanvasは、phylocanvas JavaScriptライブラリを使用して系統樹の埋め込みを可能にする「htmlwidgets」用のウィジェットです。
- ggmullerを使用すると、周波数ダイナミクスとともに系統発生をプロットできます。
- RPANDAを使用して、系統発生のスペクトル密度と固有値をプロットできます。
- diversitreeは、「plot2.phylo()」と呼ばれる未エクスポート関数があり、これを使用すると、特殊なツリーの非常に軽量なPDF出力を生成できます(diversitree:::plot2.phylo()経由で呼び出すことができます)。
ツリーの比較
- distory、TreeDist、Quartet、TBRDist、phangorn、およびphytoolsは、ツリー間の距離を計算できます。
- TreeDistとtreespaceは、ツリー セット(「ツリー スペース」)の低次元マッピングをプロットして評価できます。
- apeは、木と木の距離を計算し、関連する先端間のリンクを持つ2つの木を示すプロットを作成することもできます。
- dendextendは、樹状図を比較する複数のメジャーを評価できます。
Rのツリービルディング
系統発生的推論
- phangornは、距離(UPGMA など)、節約、尤度を使用して木を推定できます。
- TreeSearchは、Brazeauら(2019)は適用できないデータを修正し、結果を詳細に分析するためのグラフィカル・ユーザー・インターフェイスが含まれています。
- phyclustは、シーケンスをクラスター化できます。
- phytoolsは、MRPスーパーツリー推定と最小二乗法を使用してツリーを構築できます。
- phylotoolsは、他のソフトウェアでの分析用に超行列を構築できます。
- EvoPhyloを使用すると、MrBayesおよびBEAST2で実行されるベイズ系統解析の自動化された形態学的文字分割を実行できます。このような分析から出力されるマクロ進化パラメータの分析にも使用できます。
- fastreeRは、距離の計算、系統樹の構築、またはVCFまたはFASTAファイルのサンプル間の階層的クラスタリングの実行に使用できます。
- rphenoscateは、正式な文字階層と対応する比率行列を構築することにより、親の形質に依存する形態学的文字などの「適用できない」文字の分析を容易にします(Tarasov 2023)。
発散時間
- apeは、ノンパラメトリック・レート・スムージング(NPRS)とペナルティ付き尤度を実装します。
- geigerは、指定された標準ツリーに一致するようにソース・ツリーを拡張する合同化を行うことができます。
- cladedateは、化石記録から経験的なキャリブレーション情報を生成します。
- treedaterは、さまざまな時計モデル、信頼性を評価する方法、外れ値の検出を実装します。
- phangornは、配列から直接厳密な時計モデルを使用して、超測定的かつ最新の系統発生を推定できます。
- bpprは、プログラムBPPから系統発生を校正します。 チュートリアルはhttps://dosreislab.github.io/2018/08/31/bppr.htmlで利用できます。
- mcmc3rは、PAMLスイートからのMCMCtreeを使用して、発散時間推定の周辺尤度を計算します。 また、周辺尤度計算における誤差推定のためのブロック・ブートストラップも計算します。
ツリー・シミュレーション
- TreeSimを使用すると、さまざまな制約を伴う定率の誕生と死亡を使用して樹木をシミュレートできます。
- phytoolsは、連続時間と離散時間の両方で、さまざまな制約を持つ誕生-死亡ツリーをシミュレートできます。
- geigerを使用すると、樹木の誕生と消滅のプロセスをシミュレートできます。
- paleotreeは、化石の堆積、サンプリング、そこから生じる樹木、および観察された化石分類群に基づいて条件付けされた樹木をシミュレートできます。
- FossilSimを使用すると、保存とサンプリングの機構モデルに基づいて既存の系統樹上の化石データをシミュレートできます。
- TESSは、時間依存の種分化および/または大量絶滅を含む絶滅速度を伴う樹木をシミュレートできます。
- paleobuddyは、環境依存を含む、ユーザー定義の多様化ダイナミクスを幅広くシミュレートする柔軟なインターフェイスを提供します。
- simclockは、リラックスしたクロック・モデルの幾何学的なブラウン運動(相関速度)および独立した対数正規速度に基づいて、サイトごとの置換数で枝の長さをもつツリーをシミュレートします。
系統発生学的比較方法
祖先の状態の再建
- ouchは、ブラウン運動またはオーンシュタイン・ウーレンベック・モデルの下でルート祖先文字の状態を再構築するために使用できますが、内部ノードでの祖先の状態はそうではありません。
- markophylo (archived)は、制約付き置換率、サイト間のレート分割、ブランチ固有のレート、サンプリング バイアス、および非定常ルート確率を組み込むことができるモデルを使用して、離散文字タイプの広範なセットを適合させることができます。
- phytoolsは、進化的量的遺伝学からの閾値モデルや確率的文字マッピングなど、複数のモデルの下で連続的および離散的文字の祖先的文字推定を行うことができます。
- Rphyloparsは、種ごとに複数の観察が行われたデータセットや欠損データを含むデータセットの祖先状態の再構成を実行できます。
- TreeSearchは、適用できないデータを許容して、節約の下で文字のマッピングを実行できます。
- castorは、非常に大きなツリー上で連続文字または離散文字を再構築するために使用できます。
特性の進化
- ape、picante、またはcaperを使用して、連続文字の独立したコントラストを計算できます。
- caperは、ブランチ・アルゴリズムとクランチ・アルゴリズムも実装します。
- geigerは、不均等なレートや特定の瞬間に変化するレートのモデル、Pagelの変換など、離散形質進化の分析を実行できます。
- phytoolsは、キャラクターの個別進化と連続進化の両方に対して複数のモデルを適合させることができます。たとえば、phytoolsは、ユーザーによって固定されたレジームまたはデータ自体から推定されたレジームとして指定されたレートの不均一性を使用して、または使用せずにブラウン・モデルを適合します。phytoolsは、拡張 Mkモデル、レジーム・シフトを伴う異種Mkモデル、多型形質進化モデル、隠れレート モデル、閾値モデルなど、さまざまな離散的性格進化モデルを適合させるために使用することもできます。
- geiger、paleotree、motmotは、ブラウン運動モデルを当てはめることができます。
- RBrownieは、複数レートのブラウン運動モデルに適合できます。
- geigerとOUwieを使用して、ブラウン運動からの逸脱を調査できます。
- mvMORPHは、ブラウン運動、アーリー バースト、ACDC、OU、およびシフト モデルを単変量または多変量データに適合させることができます。
- geiger、motmot、ouch、surface、およびOUwieを使用してOrnstein-Uhlenbeck(OU)モデルを当てはめることができます。
- motmotは、特定の時間にレートまたはモードが変化する連続モデルを当てはめることができます。
- Rphyloparsは、種ごとに複数の観測値や欠損データがあるデータセットに、上記のような連続モデルを当てはめることができます。
- geigerは、系統発生学的コンテキストでANOVAとMANOVAを実装します。
- ape、PHYLOGR、caper、およびmotmotは、従来のGLSメソッド(sensu GrafenまたはMartins)を実装しています。
- apeは、系統発生的自己回帰を計算できます(sensu Cheverudら)。
- apeとadephyloは、系統発生的自己相関を計算するために使用できます(Moran’s I)。
- MCMCglmmは、GLMMを使用して特性間の相関関係を評価するために使用できます。
- phylolmは、高速アルゴリズムを使用して系統発生的線形回帰モデルと系統発生的ロジスティック回帰モデルを適合させることができるため、大きなツリーに適しています。
- brmsは、連続形質と離散形質の間の相関関係を調べることができ、種ごとに複数の測定値を組み込むことができます。
- metaforは、系統発生構造を考慮したメタ分析を実行できます。
- pmcは、モンテカルロ手法を使用して、いくつかの特性モデル(geigerおよびouchから)のモデルの適切性を評価します。
- phyregは、Grafen(1989)の系統発生的回帰を実装します。
- geomorphは、系統発生的なコンテキストで幾何学的形態計測分析を行うことができます。
- dispRityは、経時的な視差を計算し、その他の視差関連の分析を実行できます。
- MPSEMは、系統発生固有ベクトル・マップを使用して、関連種からの情報に基づいて1つの種の特徴を予測できます。
- convevolとwindexは、どちらも系統発生上の収束進化をテストできます。
- Claddisは、個別の文字データから形態学的多様性と系統樹上の進化のテンポを測定できます。
特性シミュレーション
- ouch、geiger、ape、picante、OUwie、caper、phytoolsは、ブラウン運動を使用して連続形質をシミュレートするために使用できます。
- ouchとOUwieは、Hansenモデル(OUの形式)を使用して連続形質をシミュレートするために使用できます。
- geigerは、特殊モデルを使用して連続形質をシミュレートでき、離散形質は連続時間マルコフ・モデル(速度が時間とともに変化するモデルを含む)を使用してシミュレートできます。
- phangornは、DNAまたはアミノ酸をシミュレートできます。
- phytoolsは、複数のモデルの下で個別のキャラクターの進化をシミュレートできます。
- phylolmは、ツリーに沿って連続形質またはバイナリ形質をシミュレートできます。
- Rphyloparsは、観測値が欠落しているデータをシミュレートできます。
多角化分析
- apeとphytoolsは、現存種のみがある場合の単純な出生死亡モデル(sensu Neeら1994)、生存モデル、および適合度検定(多様化モデルの検定に適用される)を当てはめることができます。
- TESSは、大量絶滅を含む時間依存の多様化を伴うモデルの下で樹木の尤度を計算できます。
- geigerは、正味多様化率を計算できます(sensu MagellonとSanderson)。
- diversitreeは、BiSSEメソッド(Maddisonら1997)とその後の改良版(FitzJohnら2009)を実装しています。
- hisseは、HiSSE(Beaulieu and O’Meara 2016)、GeoHiSSE(Caetanoら2018)、MuHiSSE(Nakovら2019)、MiSSE(trait-independent)など、さまざまな隠れ状態多様化モデルを実装しています。
- caperは、マクロカイック・テストを実行して、多様性に対する形質の影響を評価できます。
- apTreeshapeは、差分多様化のテストもあります(descriptionを参照)。
- DDDは、多様性に依存する誕生と死亡のプロセスに基づいた最尤法を実装して、種分化または絶滅が多様性に依存するかどうかをテストするとともに、重要な革新を特定し、密度に依存するプロセスをシミュレートします。
- PBDは、長期にわたる種分化モデルの下で樹木の尤度を計算できます。
- phyloTopは、樹形を調査する機能があり、感染症樹木に特化した機能やデータセットを備えています。
- RPANDAは、時間依存モデルや環境依存モデルなど、さまざまな多様化モデルを系統発生に適合させることができます。
- picanteは、「均等分割」(ES)尺度を含む、さまざまな進化的区別性尺度を計算するために使用できます。
- castorは、樹木から識別可能な多様化率パラメーター(種分化の抽出率など)を推定できます。
- secsseは、複数状態の観察された特性と隠れた特性を備えた多様化モデルを適合させることができます。
- phytoolsは、系統経時(LTT)プロットを計算して視覚化し、PybusとHarvey(2000)のガンマ統計量を計算できます。
- CRABSは、一致する系統発生的な誕生と死亡のモデルを探索するためのツールを備えています(Louca and Pennell 2020を参照)。
特定の分野における系統発生学
形態計測学
- geomorphとRRPPは、多変量表現型の進化傾向を評価するために使用できます。利用可能な方法には、系統発生の線形モデル(系統分散分析/回帰など)、系統発生の部分最小二乗法、表現型の進化速度の比較、系統発生の統合、および系統発生のモジュール性が含まれます。さらに、序列化アプローチには、系統発生学的PCAと系統発生的に整列した成分分析(PACA)の両方が含まれます。
- mcmc3rは、ブロンウン運動下での分岐長の推定に行列収縮を使用して特性間の相関を除去し、最後にPAMLスイートからのMCMCtreeでの発散時間推定を行います。詳細なチュートリアルはhttps://github.com/sabifo4/morphoにあります。
時系列と古生物学
- paleoTSは、系統進化(ランダム・ウォークまたはスタシス・モデルに基づく)モデルのフィッティングと比較(モデル・テスト・アプローチを使用)のための尤度ベースのフレームワークを使用して、古生物学の時系列データを分析できます。
- strapは、系統樹の層序分析を行うことができます。
- fbdRは、系統樹と化石の出現データから多様化率を推定できます。
- Rは、汎用時系列モデリングのための他の豊富なオプションを提供しており、その多くはTimeSeriesタスク ビューにリストされています。
群集と微生物の生態
- picante、vegan、SYNCSA、phylotools、PCPS、caper、DAMOCLES、およびphyloregionは、系統発生学と群集生態学を使用するためのいくつかのツールを統合します。
- HMPTreesとGUniFracは、微生物群集を比較するためのツールを提供します。
- betapartは、ペアごとの相違点(距離行列)と複数サイトの相違点を計算し、分類学的(発生率と存在量に基づく)、機能的および系統学的ベータ多様性の代謝回転と入れ子性の結果として生じる要素を分離できます。
- phyloregionは、betapartを拡張して、疎なコミュニティ行列を許可し、より大きなデータセットを可能にします。
- adivは、種、機能的および系統的多様性、アルファ、ベータ、ガンマの多様性を含む生物多様性のさまざまな指標を計算できます。
- entropartは、Tsallisエントロピーに基づいて多様性を測定および分割できるほか、アルファ、ベータ、ガンマの多様性を計算できます。
- metacoderは、メタバーコーディングなどの最新の高スループット・シーケンスから生成されたものなど、大規模な分類データ セットを処理するための関数を提供します。
- phyloseqは、マイクロバイオーム調査データのインポート、保存、分析、およびグラフィック表示を容易にする一連のクラスとツールを提供します。
気候モデリング
- phyloclimは、系統気候モデリングのためのいくつかのツールを統合します。
系統地理と生物地理
- diversitreeは、2つの領域に基づいた多様化分析のためのGeoSSEメソッドを実装しています。
- Herodotoolsは、生物多様性の空間パターンの調査、祖先地域の再構成の実行、進化領域の分類の実行など、さまざまな生物地理学的マクロ進化分析を実行できます。
- epm(EcoPhyloMapper)を使用すると、地理全体にわたるさまざまな形態学的および系統学的群集指標を計算できます。
- BioGeoBEARSは、歴史的な生物地理学(系統発生上の祖先の地理的範囲)と範囲進化のさまざまなモデルの比較の両方の確率的推論が可能になります。
疫学
系統発生疫学を含む疫学に役立つパッケージの詳細については、Epidemiologyタスク ビューを参照してください。
オミクス
- aphylo (archived)は、系統樹における遺伝子機能の注釈を分析および予測するための節約的な進化モデルを実装しています。
- CALANGOは、量的/ランク変数に関連付けられたアノテーション用語(Pfam ID、GO用語、スーパーファミリーなど)を検索するために使用できます。
- TreeExpは、系統発生学的文脈における遺伝子発現の比較分析を実行できます。
- perfectphyloRは、完全な系統発生(配列を再帰的に分割するルート付き二分木)を構築して、配列データの祖先のパターンについての洞察を提供できます。
- 他の便利なパッケージの詳細については、Omicsタスク ビューを参照してください。
遺伝子系統樹と種の区切り
- splitsは、遺伝子ツリーを使用して、GMYC(Generalized Mixed Yule Coalescent)に基づいて種の限界を推測します。
- treeduckenは、誕生と死亡のプロセスおよび系統間の伝達を使用して、入れ子になった系統樹(種ツリー内の遺伝子ツリー、宿主ツリー内の共生生物ツリー)をシミュレートします。
- P2C2M.GMYCは、GMYCモデルでのモデル違反を識別できます。
- bpprは、BPPを使用して競合種の木を比較するためのモデル選択を行うための制御ファイルを準備できます。チュートリアルは、https://dosreislab.github.io/2018/08/31/bppr.htmlで利用できます。
その他の便利なパッケージと雑多なもの
タクソノミ
- taxizeは、種名の検証、分類階層の取得、名前のスペルの検証など、分類タスクのために一連のWeb APIと対話できます。
- evobiRは、より高い分類レベルでのツリーの作成、NCBIまたはITISからの分類ツリーのダウンロード、およびその他のさまざまな機能(文字進化のシミュレーション、D統計の計算など)が含まれています。
他のプログラムとの相互作用
- apeは、さまざまな関数を通じてPhyML、Clustal、T-Coffee、およびMuscleを呼び出すことができます。
- geigerは、congruify関数を通じてPATHd8を呼び出すことができます。
- ipsは、配列アラインメント、配列アラインメントのマスキング、系統発生と祖先形質の状態の推定のためのいくつかの系統発生ソフトウェア(MrBayes、Beast、RAxML、PartitionFinder、MAFFTなど)をラップしており、R内から簡単に使用できるようにします。
- beastierは、BEAST2を呼び出して系統解析を実行できます。
- Rphylipは、倹約、尤度、距離に基づくツリー推論、ブートストラップ、文字進化などのための幅広いプログラムであるPHYLIPをラップしています。
- BoSSAは、さまざまなツールからの情報を使用して、クエリ・シーケンスを参照ツリーに配置できます。
- BAMMtoolsは、BAMMプログラムへのインターフェイスであり、レートの変化の視覚化、多様化モデルの比較、その他の機能を可能にします。
- Revticulateは、R内からRevBayesと対話することができます。
- RevGadgetsは、RevBayesによって生成された出力を処理できます。
- bpprは、BPPを使用して競合種の木を比較するためのモデル選択を行うための制御ファイルを準備できます。チュートリアルは、https://dosreislab.github.io/2018/08/31/bppr.htmlで利用できます。
- mcmc3rは、PAMLスイートからMCMCtreeを使用して発散時間推定を実行するための制御ファイルを準備できます。また、MCMCtreeでの発散時間推定で連続形質モデルを使用するために、Phylip形式で形態学的アライメントを生成します。
参考文献
- Beaulieu, J.M. and O’Meara, B.C., 2016. 形質依存的種分化と絶滅のモデルにおける隠れた多様化シフトの検出。Systematic Biology, 65(4): 583-601. doi:10.1093/sysbio/syw022.
- Borregaard, M.K., Rahbek, C., Fjeldsaa, J., Parra, J.L., Whittaker, R.J. and Graham, C.H. 2014. ノードに基づく種の分布分析。doi:10.1111/2041-210X.12283.
- Brazeau, M.D., Guillerme, T. and Smith, M.R. 2019. 適用不可能なデータを用いた形態学的系統解析のアルゴリズム。Systematic Biology, 68:619-631.doi:10.1093/sysbio/syy083
- バトラーM.A.、キングA.A. 2004系統的比較分析: 適応進化のモデリングアプローチ。アメリカン・ナチュラリスト 164, 683-695. doi:10.1086/426002
- カエターノ、DS、BC オメーラとJ.M. ボーリュー。 2018. 隠れ状態モデルは、生物地理モデルを含む状態依存の多様化アプローチを改善します。進化論、72:2308-2324。doi:10.1111/evo.13602
- Cheverud J.M., Dow M.M., Leutenegger W. 1985 比較分析における系統的制約の定量的評価: 霊長類における体重の性的二型性。Evolution 39, 1335-1351. doi:10.1111/j.1558-5646.1985.tb05699.x
- FitzJohn R.G., Maddison W.P., and Otto S.P. 2009. 不完全に分解された系統樹から形質依存的種分化率と絶滅率を推定する。doi:10.1093/sysbio/syp067
- ガーランド T., ハーヴェイ P.H., アイヴス A.R. 1992 系統的に独立した対比を用いた比較データの解析手順。系統生物学 41, 18-32. doi:10.1093/sysbio/41.1.18
- ハンセン T.F. 1997. 安定化選択と適応の比較分析。Evolution 51: 1341-1351. doi:10.1111/j.1558-5646.1997.tb01457.x
- Louca, S. and Pennell, M. W. 2020. 現存するタイムツリーは、無数の多様化の歴史と矛盾しない。Nature, 580(7804), 502-505. doi:10.1038/s41586-020-2176-1
- Maddison W.P., Midford P.E., and Otto S.P. 2007. 種分化と絶滅に及ぼす二値的性格の影響の推定。Systematic Biology 56: 701-710. doi:10.1080/10635150701607033
- Magallon S., Sanderson, M.J. 2001. 被子植物群における絶対多様化率。Evolution 55(9):1762-1780. doi:10.1111/j.0014-3820.2001.tb00826.x
- このような研究成果をもとに、多様化率の変動に対応したスーパーツリーを構築する。In Bininda-Emonds ORP (ed) Phylogenetic Supertrees: 情報を組み合わせて生命の樹を明らかにする, Kluwer Academic pgs 487-533. doi:10.1007/978-1-4020-2330-9_23
- Nakov, T., Beaulieu, J.M., and Alverson, A.J. 2019. 海洋環境よりも淡水環境の方が珪藻の多様化とターンオーバーが早い。Evolution, 73: 2497-2511. doi:10.1111/evo.13832
- Nee S., May R.M., Harvey P.H. 1994. 再構築された進化過程。ロンドン王立協会紀要シリーズB生物科学344: 305-311. doi:10.1098/rstb.1994.0068
- Pagel M. 1999年。生物進化の歴史的パターンを推測する。Nature 401, 877-884. doi:10.1038/44766
- Pybus O.G., Harvey P.H. 2000. 不完全な分子系統を用いたマクロ進化モデルの検証。英国王立協会紀要シリーズB生物科学267, 2267-2272. doi:10.1098/rspb.2000.1278
- Tarasov, S. 2023. 適用不可能な形態学的特徴に対する新しい系統発生マルコフモデル。系統生物学, syad005. doi:10.1093/sysbio/syad005