macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

事前計算された植物の遺伝子ファミリーの系統樹 PhyloGenes

 

著者らは、シロイヌナズナや他のモデル生物から得られた遺伝子機能に関する知識を、他の植物種に正確かつ効率的に伝達できるようにすることを目指している。このような知識移転は、植物の系統における個々の遺伝子やゲノム全体の重複のために、植物においてはしばしば困難なことである。このような重複は、類似した配列を持ちながらも非常に発散性の高い機能を持つ関連遺伝子間の複雑な進化関係をもたらす。このような場合、機能推論には単純な配列類似度計算以上のものが必要となる。著者らは、植物遺伝子ファミリーの系統樹を事前に計算して表示するオンラインリソースPhyloGenes (phylogenes.org)を開発し、ファミリー内の個々の遺伝子の機能情報を実験的に検証した。40種の植物ゲノムと10種の非植物モデル生物を8,000以上の遺伝子ファミリーで表現している。種分化や複製などの進化イベントを遺伝子ツリー上に明示し、オルソログとパラログを区別できるようにしている。約6,000ファミリーには、実験的に検証されたGene Ontology (GO)の分子機能や生物学的プロセスの用語へのアノテーションが少なくとも1つ含まれている。PhyloGenesは、ツリー内の個々の遺伝子に関連する実験的に検証された遺伝子機能を表示することで、実験的に研究された遺伝子との進化的関係に基づいて、未解明の機能を持つ遺伝子の機能推論を、視覚的に追跡可能な方法で可能にしている。異なる機能を果たすように進化した遺伝子を含む多くのファミリーに対して、PhyloGenesは、実験的に特徴づけられていない遺伝子の最も可能性の高い機能を決定するための進化史の使用を容易にする。将来的には、植物遺伝子発現アトラスデータのような追加の遺伝子機能データセットを組み込むことで、このリソースをさらに充実させていく予定である。

 

 

 

help & Tutorial

https://conf.arabidopsis.org/display/PHGSUP

 

version3.0に含まれる植物種

f:id:kazumaxneo:20210221224650p:plain

 

webサービス

http://www.phylogenes.org/にアクセスする。

f:id:kazumaxneo:20210221215830p:plain

解説動画が用意されています。

 

 

遺伝子名やPANTHERのGene IDをタイプする。ここではチュートリアルで使用されているLOC107914949(Ammonium transporter)を中央のウィンドウ内か右上のウィンドウ内でタイプ。

f:id:kazumaxneo:20210221223257p:plain

 

 

結果が表示された。Eukaryotaの47 Organismsの227 genesがヒットしている。左がその遺伝子の系統樹で、右がリストになる。

f:id:kazumaxneo:20210221223416p:plain

検索した遺伝子はハイライト表示されている。

LEGENDにあるように、遺伝子ファミリーは、種分化、遺伝子重複、水平移動の過程でどのように進化してきたかを示す系統樹として表現されている。

f:id:kazumaxneo:20210221224619p:plain

 

 

系統樹と右の表は縦関係が固定されており、枝の右にあるリストが、その枝の情報になる。検索に使ったLOC107914949はGossypium hirsutum(綿)の遺伝子で、同じクレードに位置する遺伝子もGossypium hirsutumの遺伝子が中心になる。

f:id:kazumaxneo:20210221224021p:plain

系統樹が画面に収まりき去らない場合、上下左右にスクロールできるが、左右はドラッグで移動し、上下スクロールはマウスホイールで行う。マウスホイールで上下にスクロールした際は、系統樹と表がずれないようにどちらもスクロールされる。

 

表は横に長いため、4Kやウルトラワイドディスプレイでもないと1画面には収まりきらない。

f:id:kazumaxneo:20210221225648p:plain

 

他の実験のエビデンスがある遺伝子は試験管のマークがつく。identical protein

f:id:kazumaxneo:20210221225956p:plain

 

上の歯車マークをクリックすると表に表示する項目をカスタマイズできる。

f:id:kazumaxneo:20210221230038p:plain

 

系統樹のノードをクリックするとcollapseする。元に戻すにはもう一度クリックする。

f:id:kazumaxneo:20210221224522p:plain

 

系統樹のマークをクリックすると結果をCSVでダウンロードしたりできる。

f:id:kazumaxneo:20210221230246p:plain



 

引用

PhyloGenes: An online phylogenetics and functional genomics resource for plant gene function inference
Peifen Zhang Tanya Z. Berardini Dustin Ebert Qian Li Huaiyu Mi Anushya Muruganujan Trilok Prithvi Leonore Reiser Swapnil Sawant Paul D. Thomas Eva Huala
Plant Direct. 2020 Dec; 4(12)