macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

真菌の遺伝子発現とオルタナティブスプライシングを探索するプラットフォーム FungiExp

 

 真菌類は、多様な生態的ニッチを持つ真核生物の大規模かつ異質なグループを形成している。真菌の重要性は、真菌のライフスタイルや環境への適応性についての理解が限られていることと対照的である。この10年間で、ハイスループット配列決定技術により、膨大なRNA-sequencing(RNA-seq)データが生み出された。しかし、菌類学者にとって、真菌の遺伝子発現やオルタナティブスプライシングを簡便に調べることができる包括的なデータベースは存在しない。そこで本著者らは、220種の真菌由来の35 821個のRNA-seqサンプルと、遺伝子発現およびオルタナティブスプライシングプロファイルを含むオンラインデータベース、FungiExpを開発した。このデータベースでは、収集したRNA-seqサンプルにおける遺伝子発現とオルタナティブスプライシングを照会し、可視化することができる。さらに、FungiExpには、差分/特異的、共発現ネットワーク、異種間保存遺伝子発現解析などのオンライン解析ツールが含まれている。これらのツールを通じて、ユーザーは公開されているRNA-seqデータを再解析することで新たな知見を得たり、個人データをアップロードして公開されているRNA-seqデータと共同解析することができる。FungiExpはhttps://bioinfo.njau.edu.cn/fungiExpで自由に利用できる。

特徴(HPより)

  • アノテーションの改善 遺伝子モデルを改良し、特に非モデル種について、より多くの代替アイソフォームを提供する。さらに、参照ゲノムアノテーションにはない代替スプライシングイベントのアノテーションも含まれている。

  • サンプルキュレーション 株、遺伝子型、組織、発生、treatmentなどのサンプル情報は、遺伝子発現やオルタナティブスプライシングの変化に関連する生物学的意義を探求するために手動でキュレーションしている。

  • 遺伝子発現やオルタナティブスプライシングを、遺伝子識別子、シンボル、遺伝子オントロジー、ファミリー、KEGGパスウェイなどの機能語彙、および遺伝子配列の類似性から検索することができる。

  • 発現解析生物学的意義のある遺伝子や代替スプライシングイベントを検索するために、差分、特異性、共発現、異種発現、解析が実装されている。

  • 高いカスタマイズ性 遺伝子発現や代替スプライシングのプロファイルを推定するために、ユーザーは自由に異なるメトリクスを指定でき、差分/特異的発現やエンリッチメント解析において異なる方法を選択できる。

  • 豊富な図表と外部リンク 検索結果や解析結果を要約するための豊富な図表を提供している。また、EnsemblNCBI、Pfam、GO、KEGG、UniProt、Pubmed、SRA、GEOなどの外部重要リソースへのリンクも提供している。

  • FungiExpに寄託されたすべてのデータは、ローカルで分析するためにダウンロードできる。

 

help

https://bioinfo.njau.edu.cn/fungiExp/help.html

FAQ

https://bioinfo.njau.edu.cn/fungiExp/faq.html

 

 

webサービス

FungiExp-Homeにアクセスする。

220種類の菌類から、35,821以上のRNA-seqサンプルを一律に処理したものを収録している。Neurospora crassaをクリックした。

 

検索画面にジャンプする。遺伝子ID、遺伝子シンボル、タンパク質ファミリー名、GO term、KEGG pathway、などで検索できる。

 

遺伝子IDで検索した。ヒットした遺伝子は表に提示される。

遺伝子シンボルはEnsembl Fungiにリンクしている。タンパク質ファミリーはinterproにリンクしている。GOのIDはAmiGO2にリンクしている。KEGG IDはKEGGにリンクしている。右端の虫眼鏡マークをクリックすると発現パターンを調査できる。

 

遺伝子発現の分析結果はいくつかのセクションに分けて示される。遺伝子の基本情報は、ゲノム位置、遺伝子シンボル、遺伝子オルソロジー、Pfam、GO、KEGGパスウェイのような様々な機能アノテーションを含み、外部データベースへのリンクとともにページの上部に表示される。

ゲノムブラウザが組み込まれているので、ユーザーは遺伝子、転写産物、代替スプライシングをゲノム上で探索する事ができる。

 

Orthogroupをクリックするとユーザーがポップアップページを開いて、他の生物種におけるオルソログ遺伝子発現を探索できる。

これは他のデータベースにはない重要な機能として、マニュアルでも強調して説明されている。

 

続いて、遺伝子によっては機能構造グラフが表示され、Pfamドメインの位置が図示される(マニュアルに図あり)。

 

さらに、サンプル間の遺伝子発現またはオルタナティブスプライシングインタラクティブなバーチャートで表示される。関連する転写産物とオルタナティブスプライシングの表も提供される。

各バーはバーチャート内の実験グループを表し、さらに拡張して同じ処理グループ間(Replicates)の発現の多様性を示すことができる。

 

1つクリックすると展開された。このバーチャートは3つのReplicatesからなることが分かる。元に戻るには右端のback to~をクリックする。

 

バーチャート上のメニューをクリックすることで実験を選択できる。

多くの研究データが収録されていることが分かる。

 

実験を変えるとバーチャートが切り替わった。

 

Blastタブでは相同な遺伝子を探索できる。

 

出力例

2つの遺伝子がヒットしている。

 

 

ComaprisonタブではDEGの解析を行える。複数の研究データを使って比較できるようになっている。

遺伝子発現全体の比較にはDESeq2とedgeRが用いられ、代替スプライシングの比較にはrMATSに実装された統計モデルが用いられる。

https://bioinfo.njau.edu.cn/fungiExp/help.html

試してみる。RNA seq: paired、Data Source: ANY、Read length ≥ 100、Bases ≥ 1GB、検索すると207のstudyがヒットした。

 

表の右側の列で、分析したいControlとTreatmentの研究を選択する。

選択された研究は下のGroup settingに追加される。

 

下にスクロールし、ソフトウエアやパラメータを決める。

DESeq2、Fold change ≥2、Q-Value ≤ 0.01、Count per milionの閾値 > 1、batch effect: study、TPM、とした。

 

GO termとPathwayはEnricher、Q-Value ≤ 0.01とした。

 

名前とメールアドレスを書いてRequestをクリックするとジョブが追加される。

 

実際にジョブをサブミットするには、指定したメールアドレスに届くメール内から、サブミットクリックする必要がある。

 

example dataの結果

https://bioinfo.njau.edu.cn/fungiExp/show.compare.rlt.php?searchId=compare&taxonId=5518

この下にはオルタナティブスプライシングの分析結果も同じように表示されている。

 

Specificity Expression Analysis、Coexpression Network Analysis、Cross-specific comparison gene expressionも同様の手順で利用できる。

 

  • Specificity Expression Analysis;実験条件(組織、発生段階、ストレス処理)に応じて複数のグループを設定し、特異的に発現する遺伝子やスプライシングされた遺伝子を特定する。差分発現解析と同様に、遺伝子全体の発現を比較するためにDESeq2とedgeRも使用し、オルタナティブスプライシングの比較にはrMATSに実装されている統計モデルを使用する。
  • Coexpression Network Analysis;WGCNA(Weighted gene co-expression network analysis)は、ネットワーク構築、モジュール検出、遺伝子選択、トポロジー計算、可視化、外部ソフトウェアとの連携などの機能を備えたデータマイニング手法として広く利用されている。本プラットフォームでは、WGCNAを使って相関性の高い遺伝子のクラスター(モジュール)の発見、module eigengene(モジュール固有遺伝子)やモジュール内ハブ遺伝子を用いたクラスターの要約、モジュール同士や外部サンプル形質との関連付け(eigengeneネットワーク手法による)、モジュールメンバーシップ指標の算出を行う。
  • Cross-specific comparison gene expression;このプラットフォームでは、オーソログ遺伝子の発現プロファイルの保存性や多様性を探ることができる。まずユーザーは2つの種について複数の同一グループを設定する。それによって種内および種間におけるオルソログ遺伝子の発現相関係数を計算し、オルソログ遺伝子の発現プロファイルの保存性を知ることができる。次に、発現量の異なる1:1オルソログ遺伝子をリストアップし、2群間比較における発現の整合性を知ることができる。最後に、オルソログ遺伝子の系統樹が構築され、発現プロファイルと分子系統的関係を同時に調べることができる。

 

ユーザーのRNAseqデータも追加して解析することができる。そのためには、Co-analysisのタブの説明に従って発現カウントテーブルと代替スプライシングプロファイルを作成する必要がある。

https://bioinfo.njau.edu.cn/fungiExp/conversion.php?taxonId=5518

 

引用

FungiExp: a user-friendly database and analysis platform for exploring fungal gene expression and alternative splicing 
Jinding Liu, Yaru Zhang, Yapin Shi, Yiqing Zheng, Yali Zhu, Zhuoran Guan, Danyu Shen, Daolong Dou
Bioinformatics, Volume 39, Issue 1, January 2023

 

参考

What are eigengenes and gene modules?

https://www.quora.com/What-are-eigengenes-and-gene-modules