CRAN Task View: Statistical Geneticsの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載した。

Maintainer: Giovanni Montana
Contact: g.montana at imperial.ac.uk
Version: 2021-11-09
URL: https://CRAN.R-project.org/view=Genetics

過去数年にわたって遺伝子解析の分野において大きな進歩がなされてきた。広く利用可能なデータベースで数百万の一塩基多型(SNP)が利用可能であり、コストを削減しスループットを向上させるSNP遺伝子型決定技術の大きな進歩により、複雑な疾患の遺伝的根拠を解明することを目的とした多数の研究が可能になります。このタスクビューの焦点は、遺伝的データの分析および関連集団遺伝学研究のための統計的方法およびアルゴリズムを実装するRパッケージにある。

多くのRパッケージがすでに利用可能であり、近い将来には多くのパッケージが開発される可能性が最も高い。ご意見や提案をタスクビューのメンテナーにお送りください。

  • 集団遺伝学:
    • geneticsは、遺伝子型およびハプロタイプデータを表すためのクラスおよび方法を実装し、集団遺伝解析(例えば、ハーディーワインバーグおよび連鎖不平衡の推定および試験など)のためのいくつかの機能を有すます。
    • gapは、いくつかの集団遺伝学関数を実装しています。
    • hwdeは、遺伝子型不均衡のモデルに適合している。
    • HardyWeinbergは、三元プロット(デインテネッティ図としても知られている)を介して不均衡をグラフ表示しています。
    • Biodemは、Biodemographical analysisの機能を提供します。Fst()は、条件付き親族行列からFstを計算します。
    • adegenetは、多変量統計、グラフィック、空間統計を使って集団構造を分析するための多くの異なる方法を実装しています。
    • hierfstatは、階層内の任意の数のレベルを有する半数体または二倍体遺伝データからの階層的F-統計量の推定を可能にする。
  • 系統学:
    • Phylogeneticsビューは、より詳細な情報を持っている、最も重要なパッケージもここで言及されています。
    • apeは、系統発生と進化解析を行うことができます。
    • ouchは、系統学的比較の仮説のためオーンスタイン – ウーレンベックモデルが用意されています。
    • phangornは、最尤、最大節約、距離方法やアダマールコンジュゲーションを使用して系統樹とネットワークを推定します。
  • リンケージ:
    • R内からパラメトリックまたはノンパラメトリックなリンケージ解析を実行するネイティブパッケージはほとんどありません。外部パッケージを使用して計算を実行する必要があります。しかし、これらのスタンドアロンプログラムとのインタフェースを容易にし、結果をさらなる分析と提示のために使用する多くの付随するRパッケージがあります。
    • ibdregは、回帰モデリングによる共変量との遺伝的連鎖をテストするために、外部から計算された関連ペアについて、降下(IBD)非パラメトリック・リンケージ(NPL)統計を使用します。公式のRパッケージでは特に1つのソフトウェアスイートは特に言及する価値がありません。
    • PLINKは、Rserveを介してRベースのプラグインをサポートするゲノムワイドリンケージ解析のためのC ++プログラムであり、ユーザーはRの豊富な統計関数を分析に利用することができます。
  • QTLマッピング:
    • このカテゴリーのパッケージは、定量的形質の変動に寄与するマーカーを同定するための実験的交配の分析のための方法を開発する。
    • bqtlは、交雑交配および組換え近交系のための尤度に基づく方法とベイジアン法の両方を実装します。
    • qtlは、ゲノムワイドスキャンのための関数scanone()を含む、QTLマッピングのためのいくつかの関数とデータ構造を提供します。
    • wgaimは、完全なリンケージマップからのQTL間隔のモデリングと要約のための関数を含めることにより、qtlに基づいて構築されます。
  • アソシエーション:
    • このカテゴリのパッケージは、個々の遺伝子マーカーと表現型との間の関連性をテストする統計的方法を提供します。
    • gapは、集団データと家族データの両方の遺伝子データ解析のためのパッケージです。それは、サンプルサイズの計算、家族性疾患集団の確率、親族計算、および連鎖分析および関連分析のためのいくつかの試験のための関数を含む。他の機能の中で、genecounting()は遺伝子型データからハプロタイプ頻度を推定し、gcontrol()は関連研究のためのベイジアンゲノム制御統計量を実装します。
    • 家族データの場合、tdthapは、拡張マーカーハプロタイプのための伝達/不平衡試験(TDT)の実装を提供します。
  • 連鎖不平衡とハプロタイプマッピング:
    • いくつかのパッケージは、関連のないハプロタイプを有する無関係な個体についてのハプロタイプ推定を提供し(GLMフレームワークの下での推定ハプロタイプと表現型(共変量を含む)の間の関連性の試験を可能にします。
    • hapassocは、GLMsにおけるハプロタイプと形質関連の可能性の推論を実行します。
    • tdthapは、拡張マーカーハプロタイプのための送信/不均衡テストを実装しています。
  • ゲノムワイド関連研究(GWAS):
    • ハイスループットジェノタイピング技術の最近の技術の進歩により全ゲノム関連研究を実施する可能性は今や実現可能な戦略である。パッケージの数は、これらの大量のデータセットの分析を容易にするために利用可能です。
    • pbatRは、家族や人口ベースの家族と人口ベースの研究を行い、強力なPBATソフトウェアへのGUIを提供します。ソフトウェアは、しっかりとGWASに要する計算時間を短縮する、並列処理を利用するために実施されています。
    • snpMatrixは、クラスと、大規模なSNP関連解析のためのメソッドを実装します。
  • 多重検定:
    • バイオコンダクター上のパッケージのqvalueは、偽発見率を実装しています。main関数のqvalue()は、p値のリストからQ値を推定します。
    • バイオコンダクターのパッケージmulttestは、順列リサンプリングに基づく多数の試験手順といくつかのノンパラメトリックブートストラップを提供しています。
  • シーケンスデータのインポート:
    • 人口の遺伝的解析に有用であるmase、clustal、phylip、fastaとmsf形式で整列された配列のファイルを含む、さまざまなソースからの配列データをインポートするseqinrのユーティリティがあります。
    • シーケンスデータおよびバイオインフォマティクスのためのRを使用することに関心のあるユーザーも、BioConductorのプロジェクトと呼ばれている。
R言語 CRAN Task View:統計遺伝学

R言語 CRAN Task View:統計遺伝学」への1件のフィードバック

コメントは受け付けていません。