ヒトの腸内細菌は、多くの疾患と関連している。全ゲノムショットガンメタゲノミクスにより、膨大な量の腸内細菌データが蓄積されている。しかし、この膨大なデータセットを探索するためのキュレーションされた統合プラットフォームはほとんどない。データ生成の進歩は、公開データの解析、可視化、再利用を試みる研究者に新たな課題を投げかけている。
GutMeta (human GUT whole-genome shotgun METAgenomics data analysis platform) は、精選されたデータベース、解析、可視化を統合したワンストップのオンラインヒトガットメタゲノム研究プラットフォームである。まず、メタゲノム解析の分類プロファイリングとメタデータを含むHuman Gut Metagenomics Database (HGMD)を構築した。HGMDは、全メタゲノムショットガン(WMGS)シーケンスデータで公開されたヒト腸内細菌群のサンプルを収集し、各サンプルに対してMetaPhlan3を用いた分類学を一貫して実行した。関連する様々なメタデータ情報をキュレーションし、表現型はMeSH IDに準じている。現時点では、HGMDには65の疾患に関連する91プロジェクトからの20,898サンプルが収録されている。内蔵されたツールにより、ユーザーはキーワードでサンプルを探索することができる。第二に、GutMetaは、コミュニティ多様性計算、差分検定、次元削減、疾患分類器構築など、ユーザーフレンドリーなメタゲノム解析モジュールを研究者に提供する。そして、GutMetaは対応するインタラクティブな可視化を提供し、Scalable Vector Graphics (SVG) としてダウンロードでき、高品質の画像を提供する。さらに、GutMetaは、高度な調査のためのマルチレベルの分類法の概要のための2つの追加ビジュアライゼーションを提供する。また、GutMetaは、属性調整、再カラーリング、並べ替え、およびドラッグアンドドロップなどのオンライン編集をサポートしする。第三に、GutMetaは、標準的なプロファイルのアップロードと、オンラインでカスタマイズされた解析と可視化のための組み込みHGMDデータインポートを含む、メタゲノム解析ワークスペースの構築においてユーザーをサポートする。
GutMetaは、入力データから下流の解析および可視化までの手順を標準化し、メタゲノム研究の再現性を向上させるためのソリューションを提供する。GutMetaは、ヒト腸管WMGSシーケンスデータ、9つのオンラインバイオインフォマティクス解析およびデータ可視化モジュール/パイプライン、およびカスタマイズワークスペースを統合したフリーアクセス解析プラットフォームである。https://GutMeta.deepomics.org で利用できる。
Tutorial
https://gutmeta.deepomics.org/docs
https://gutmeta.deepomics.org/にアクセスする。
Database
解析済みのデータを閲覧・分析できる。
Projects Information
1つ選んでみた。
サンプル1つの結果を見てみる。表右端のshowをクリック。
図の菌名をクリックするとNCBI taxonomyにジャンプする。
今度はanalyseタブを見てみる。これは、自分のデータやDBの既存のデータを分析する機能を持つ。そのために、上の表の画像・上部分にある”Create new dataset”を選択し、データベース名を指定する。下に示したのは表の上部分の画像;青く囲った部分がCreate new dataset。
するとExport Datasetで指定したDB名を選択してexportできるようになる。
ここでは"food"を選択。searched sampleを選択。
my dataに読み込まれた。
analyseタブ
左上のDimension reductionを選んだ。
Dimension reduction
ローカルからファイルをアップロードするか作成したデータセットを選択する。先ほど作成したfoodが選べるようになっている。分析するにはメタデータも用意する必要がある。
ここではデモデータを選んでみる(実際に解析が行われる)。
Submitをクリックする。
ジョブの一覧に追加された。結果が出るまでしばらく時間がかかる。
解析済みのデモデータも用意されている。
Demo queryを選択
1つ選ぶ。
Overview
Overview は、サンプルプロファイリングバープロット、アバンダンス分布ヒートマップ、有意差タクソノミーボックスプロット、メタデータヒートマップを1つのダイアグラムに統合したもの。これらの組み合わせにより、分類学とメタデータの相関関係が明確になる(マニュアルより)。
Alpha diversity
Dimention reduction
Enterotype
Taxonomy Tree
Classifier
Differential testing
All-in-oneではすべての分析が実行されており、右上から分析項目を選べる。
トップページをスクロールして一番下にあるGet Startedを選ぶと自分のデータを分析できる。
ファイルをアップロードする。
使用するにはプロファイリングテーブルファイルとメタデータファイルが必要。Download Data ボタンをクリックすると、公式の入力ファイルを確認できる。
1,メタデータ (TSVファイル)
最初の列はサンプル名とする。メタデータで指定する属性は、色、形、端に表示されるプロットなどで使用される。
メタデータには連続変数(例:年齢)、離散変数(例:性別)を指定することができる。
2,プロファイリングテーブル (TSVファイル)
可視化したいプロファイリングテーブルには、メタデータファイルに記載されているサンプルと全く同じものが含まれている必要がある。各サンプルの合計が100になるようにする。入力には20以上のタクソノミーを含めないことが推奨されている。
チュートリアルで書かれているが、入力のプロファイルデータはbioBakery Workflowsで分析することが推奨されている。
引用
GutMeta: online microbiome analysis and interactive visualization with build-in curated human gut microbiome database
Yiqi Jiang, Yanfei Wang, Lijia Che, Qian Zhou, Shuaicheng Li
bioRxiv, Posted September 27, 2022.