macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

ショートリードから全ゲノム系統樹の自動再構築を行う REALPHY

 

 微生物の進化動態の研究は、手頃な価格のハイスループットシーケンス技術の利用により、一度の研究で何百もの関連する分類群の全ゲノム配列の解読が可能となり、大きく変貌を遂げてきている。一般に、これらの分類群の系統樹を再構築することは、あらゆる進化解析において重要なステップである。最近の多くの研究では、すべての分類群についてゲノムアセンブリを構築し、アノテーションを施し、オルソログ遺伝子をアラインする代わりに、1)生のシーケンスリードを単一の参照配列に直接マッピングし、2)一塩基多型(SNP)を抽出し、3)アラインしたSNP位置から最尤法を使って系統樹を推測している。しかし、このような方法を用いて配列から系統樹を再構成する場合、非多形位置の除外と単一の参照ゲノムへのアラインメントの両方が系統樹再構成に系統的なバイアスとエラーをもたらすことを示す。これらの問題に対処するため、著者らは複数のリファレンス配列へのマッピングによるアラインメントを組み合わせる新しい方法を開発し、これにより再構成された系統樹からバイアスをうまく取り除くことができることを示した。この方法をREALPHY(Reference sequence Alignment-based Phylogeny builder)と名付けたウェブサーバーとして実装し、生のシーケンスリードから系統樹の再構成を完全に自動化することに成功した。

 

 

webサービス

https://realphy.unibas.ch/realphy/にアクセスする。

f:id:kazumaxneo:20220207230821p:plain

メールアドレス、プロジェクト名を記入する。

f:id:kazumaxneo:20220207232513p:plain

Advanved optionはマッピングパラメータについて。最近のシークエンシングでは50-bpは少ないと思われる。データに合わせて変更が必要。

 

fasta形式のリファレンスゲノム配列とショートリードを指定後、start uploadボタンをクリックする。f:id:kazumaxneo:20220207232202p:plain

アップロードされ、そのまま解析がスタートする。

f:id:kazumaxneo:20220207235458p:plain

ランするには最低3サンプル必要なので注意する。

 

テストした時は結果が正しく出力されなかった。

引用

Automated Reconstruction of Whole-Genome Phylogenies from Short-Sequence Reads

Frederic Bertels, Olin K. Silander, Mikhail Pachkov, Paul B. Rainey,  Erik van Nimwegen

Mol Biol Evol. 2014 May; 31(5): 1077–1088