macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

de novo transcriptomeの系統解析と機能解析を行うwebツール TRAPID 2.0

 

 ハイスループットシーケンシングの進歩は、RNA-Seqトランスクリプトームデータの膨大な増加をもたらした。しかし、特定の組織、状態、単細胞生物、微生物群集での迅速な遺伝子発現プロファイリングが期待されているが、新たな計算上の課題もある。リファレンスゲノムの利用可能性が限られているため、de novo アセンブル(メタ)トランスクリプトームは、これまでに明らかにされていなかった生物の遺伝子レパートリーを調べるための一般的なツールとして浮上してきた。しかし、その可能性にもかかわらず、これらのデータセットには断片的な配列や汚染された配列が含まれていることが多く、その解析は困難な状況にある。これらの課題を軽減するために、著者らはTRAPID 2.0を開発した。TRAPID 2.0は、アセンブルされたトランスクリプトームデータを高速かつ効率的に処理するためのウェブアプリケーションである。最初の処理段階では、入力データの全体的な特徴付けを行い、各トランスクリプトに構造情報、機能情報、分類学的情報からなる数層のアノテーションを提供する。探索段階では、ウェブアプリケーションから下流の解析を行うことができる。また、その結果をもとに、遺伝子空間の完全性の評価、トランスクリプトサブセットの機能解析と比較、進化的な文脈でのトランスクリプトの研究などが可能になっている。また、同様のツールとの比較により、TRAPIDの特徴を明らかにしている。TRAPID 2.0で行われた解析は、インタラクティブなデータの可視化によって補完され、珪藻群集のメタトランスクリプトームで実証されたように、新たな生物学的洞察の抽出を容易にする。

 

 

webサービス

ADD NEW EEXPERIMENTをクリック

f:id:kazumaxneo:20201025135519p:plain

データベースを選択

f:id:kazumaxneo:20201025135520p:plain

 

De novoアセンブリして得たfasta.gzファイルを選択(上限32MB)

f:id:kazumaxneo:20201025140307p:plain

ステータスがUPLOADになったらinitilal preprocessingを開始する。ボタンをクリック。

f:id:kazumaxneo:20201025141735p:plain

条件を確認してpreprocessingを開始する。下のボタンをクリック。

f:id:kazumaxneo:20201025141925p:plain

ステータスがpreprocessingに変わった。

f:id:kazumaxneo:20201025141926p:plain

終わると各機能解析ができるようになる。試した時はすぐにランが終わった。

出力を見ていく。

f:id:kazumaxneo:20201025183331p:plain

Gene families

f:id:kazumaxneo:20201025183339p:plainRNA families

f:id:kazumaxneo:20201025183401p:plain

Core GF  completeness

種を選んで実行する。

f:id:kazumaxneo:20201025183533p:plain

 

Subset functional enrichment

f:id:kazumaxneo:20201025183619p:plain

f:id:kazumaxneo:20201025183624p:plain

Go Gene family intersection

f:id:kazumaxneo:20201025183914p:plain

f:id:kazumaxneo:20201025183918p:plain

 

exportから結果は出力できる。

f:id:kazumaxneo:20201025183312p:plain


パイプラインの流れについては査読前論文の図1を確認してください。

引用

TRAPID 2.0: a web application for taxonomic and functional analysis of de novo transcriptomes

François Bucchini, Andrea Del Cortona, Łukasz Kreft, Alexander Botzki, Michiel Van Bel, Klaas Vandepoele

bioRxiv, Posted October 21, 2020