macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

真菌のgenomeとtranscriptomeのデータベース Fungi.guru

 

 Fungi kingdomは真核生物の従属栄養生物で構成されており、生態系のバランスを整える役割を担い、分解者として大きな役割を果たしている。また、真菌は、抗生物質や薬理学的な性質を持つ二次代謝物を多種多様に産生している。しかし、真菌の遺伝子機能に関する知識が不足しているため、真菌を私たちのニーズに合わせて調整したり、真菌の代謝多様性を活用したりすることができない。これを解決するために、著者らは最も広く研究されている19の真菌のゲノムと遺伝子発現データを収集し、保存されたパスウェイ、機能的遺伝子モジュール、遺伝子ファミリーの種間識別のためのツールを含むデータベース、fungi.guruを構築した。このデータベースは、Aspergillus fumigatusのグリオトキシンを産生する二次代謝経路、Coprinopsis cinereaセルロースの異化経路、Fusarium graminearumPyricularia oryzaeの保存されたDNA複製経路を同定することで、様々な生物学的プロセスに関与する遺伝子の分子機能、生物学的プロセス、細胞成分を明らかにすることができることを例示している。このデータベースは www.fungi.guru で利用可能である。

 

Tutorials

https://github.molgen.mpg.de/proost/CoNekT/blob/master/docs/tutorials/overview.md

Feature

https://fungi.sbs.ntu.edu.sg/features

 

webサービス

https://fungi.sbs.ntu.edu.sg にアクセスする。

f:id:kazumaxneo:20200818013014p:plain

 

exampleにあるEAL85149(nonribosomal brevianamide peptide synthase FtmA)を検索してみる。

出力

f:id:kazumaxneo:20200818015506p:plain

 利用できるtranscriptome条件でのTPM正規化された発現プロファイルが表示される。

f:id:kazumaxneo:20200920123001p:plain

 

値はその条件での最小、平均、最大TPMで表示される。

f:id:kazumaxneo:20200920123438p:plain

 

Perturbation specificity

特異性測定値(SPM)は0から1までの範囲で、各条件/組織について計算することができる。この値は、発現プロファイル全体に対する1つの条件/組織の寄与がどれだけ大きいかを示す。CoNekTデータベースでは、各条件/組織のSPMが計算され、最も高いものだけが保存される。任意のしきい値と組み合わせてSPMを使用して、条件/組織特異的な遺伝子を見つけることができる。SPMはTiSGeD(Pubmed)で使用されている。(helpより)

f:id:kazumaxneo:20200920183740p:plain

 

Co-expression

f:id:kazumaxneo:20200920123006p:plain


 共発現パートナーは、共発現ネットワークの直接の隣人を第1レベルのneighbor、「隣人の隣人」を第2レベルのneighborとみなしている。グラフでは、デフォルトでは第2レベルのneighborが表示されるが、オプションで第1レベルのみを表示することもできる。

f:id:kazumaxneo:20200920123844p:plain

 

 他にも様々な機能がある。Toolsから選択する。

f:id:kazumaxneo:20200920184507p:plain

 

Compare Profiles

同じ種の遺伝子間で発現プロファイルを比較できる。種を選択して遺伝子を記入する。ウィンドウ下の正規化のチェックはつけることが推奨されている(デフォルトではON)。

f:id:kazumaxneo:20200920191453p:plain

 

出力

デフォルトでは、プロファイルは各プロファイルの中で最も発現している遺伝子に対して正規化される。

f:id:kazumaxneo:20200920191702p:plain

f:id:kazumaxneo:20200920191700p:plain

 

 

ダウンロードボタンを押すと、プロットのデータをタブ区切りのテキストファイルでダウンロードできる。

 

Heatmap

発現プロファイルの比較は50遺伝子に制限されているが、ヒートマップは1つの種内、または種間でより大きな遺伝子のセットを比較できる。種名と遺伝子名を選ぶ。

f:id:kazumaxneo:20200920192146p:plain

 

作成したいヒートマップのタイプに応じて、異なる正規化、または正規化なしオプションが利用できる。

 

出力

青色のセルは、遺伝子の発現が平均以下であるサンプルを示し、赤色のセルは、サンプル中で遺伝子が平均以上に発現していることを示す。濃い灰色のセルは、生の発現がゼロ(対数変換できない)を示す。白のセルは平均値を表す。(helpより)

f:id:kazumaxneo:20200920192412p:plain

 

Comparativeヒートマップでは、複数の種間の比較が可能。ただし、特定の条件セットのみを対象としている。

 

Compare Specificity

どの遺伝子が種や条件で特異的に発現していて、異なる種や条件で共通するホモログを持っているかどうかを調べることができる。

共通した発現プロファイルをもつ遺伝子を探すため、種名、条件を選択する。SPM (Specificity Metric) スライダーを調整することで感度は変更可能。

f:id:kazumaxneo:20200920202917p:plain

種間で発現が保存されている遺伝子をピックアップするだけでなく、重複後に機能が変化した遺伝子を検出することができる。

 

出力

f:id:kazumaxneo:20200920205032p:plain

 

intersectionは1つのみ。

f:id:kazumaxneo:20200920205239p:plain

OrthoFinder

f:id:kazumaxneo:20200920205815p:plain

Enriched Clusters

特定のGOに富む共発現クラスタを探す。

f:id:kazumaxneo:20200920210310p:plain

出力

f:id:kazumaxneo:20200920210332p:plain

f:id:kazumaxneo:20200920210350p:plain

 

f:id:kazumaxneo:20200920210435p:plain

 

他にBLASTサーチ機能がある。クエリの配列と相同性のあるfungi.guruの遺伝子を見つけることができる。

f:id:kazumaxneo:20200920193326p:plain

 

引用

Fungi.guru: comparative genomic and transcriptomic database for the Fungi kingdom

Jolyn Jia Jia Lim, Jace Koh, Jia Rong Moo, Erielle Marie Fajardo Villanueva, Dhira Anindya Putri, Yuen Shan Lim, Wei Song Seetoh, Sriya Mulupuri, Janice Wan Zhen Ng, Nhi Le Uyen Nguyen, Rinta Reji, Margaret Xuan Zhao, Tong Ling Chan, Edbert Edric Rodrigues, Ryan Kairon, Natasha Cassandra Chee, Ann Don Low, Zoe Chen Hui Xin, Shan Chun Lim, Vanessa Lunardi, Fong Tuck Choy, Cherlyn Xin’Er Chua, Kenny Koh Ting Sween, Jonathan Wei Xiong Ng, Marek Mutwil

bioRxiv, Posted June 30, 2020

 

追記

Fungi.guru: Comparative genomic and transcriptomic resource for the fungi kingdom

Jolyn Jia Jia Lim, Jace Koh, Jia Rong Moo, Erielle Marie Fajardo Villanueva, Dhira Anindya Putri, Yuen Shan Lim, Wei Song Seetoh, Sriya Mulupuri, Janice Wan Zhen Ng, Nhi Le Uyen Nguyen, Rinta Reji, Herman Foo, Margaret Xuan Zhao, Tong Ling Chan, Edbert Edric Rodrigues, Ryanjit Singh Kairon, Ker Min Hee, Natasha Cassandra Chee, Ann Don Low, Zoe Hui Xin Chen, Shan Chun Lim, Vanessa Lunardi, Tuck Choy Fong, Cherlyn Xin'Er Chua, Kenny Ting Sween Koh, Irene Julca, Riccardo Delli-Ponti, Jonathan Wei Xiong Ng, Marek Mutwil

Comput Struct Biotechnol J. 2020 Nov 20:18:3788-3795.