macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

分類学的情報の注釈付き系統樹を生成する TaxOnTree

 

 系統解析は、遺伝子/タンパク質/種の進化を解析し、説明するために広く用いられている手法であり、DNA/ゲノムの配列が決定されている種の増加に伴い、その恩恵を受けている。数百の生物種の塩基配列から系統樹を作成することは、日常的な作業と考えることができる。しかし、系統樹の可視化には、サンプリングされた遺伝子やタンパク質に関する関連情報(例えば、分類学)を整理し、アクセス可能な手段でもたらすことが課題となっている。ここでは、系統樹にサンプルの分類学的情報を取り込み、迅速にアクセスできる計算ツールTaxOnTreeを紹介する。TaxOnTreeは、NCBIまたはUniprotデータベースの遺伝子/タンパク質識別子を含むNewick形式の系統樹を入力とするが、タンパク質識別子、FASTAのタンパク質1個、タンパク質アクセッションのリスト、またはアラインされていないマルチFASTAファイルを入力とすることも可能である。ツリー以外の入力は、TaxOnTreeに実装された系統樹再構築パイプラインに送信される。ユーザーから提供されたツリーやパイプラインで生成されたツリーは、Nexus形式に変換され、ツリーを構成する各サンプルの分類学的情報が自動的にアノテーションされる。分類学的情報は、NCBIやUniprotのサーバ、またはローカルのMySQLデータベースからWebリクエストで取得され、ツリーノードにタグとしてアノテーションされる。最終的なツリーアーカイブNexus形式であり、FigTreeソフトウェアで開く必要がある。TaxOnTree は、オルソログおよびパラログの分類学的分布を迅速に確認することができる。分類学/系統学的なシナリオを手動でキュレーションしたり、相同配列をシード配列にリンクさせるツールと組み合わせて使用することができる。TaxOnTreeは、分類学の専門家でなくても、分類学的な視点で系統樹を観察できるよう、計算機的なサポートを提供する。TaxOnTree は、http://bioinfo.icb.ufmg.br/taxontree で利用できる。

 

SourceForge

 

webサービス

http://bioinfo.icb.ufmg.br/taxontree/にアクセスする。

 

系統解析したいタンパク質の識別子かタンパク質配列を入力する。


複数も可能。

 

タンパク質配列を指定する場合はBLASTのデータベースも指定する。デフォルトはUniProtになっている。


最後にsubmitをクリック。

 

クエリの種と他の種との間のLCA (Lowest Common Ancestor)が確認される。分類学上のランク(Family, Order, Class, etc)に従ってタンパク質が分類される。得られた分類情報に従って、系統樹に色が付けられる。

 

job IDが表示されるので記録しておく。

 

 

jobIDを指定して結果をダウンロードする。ツリーフォーマットは下の画像の形式から選べる。SVG形式でもダウンロードできる。



Linux版のFigtreeにNexus形式のツリーファイルを読み込んだ。

 

 

引用

TaxOnTree: a tool that generates trees annotated with taxonomic information
Tetsu Sakamoto,  J. Miguel Ortega

bioRxiv, Posted December 24, 2020

 

関連