macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

包括的な高品質MAGのデータベース MAGdb

 

 微生物群集のメタゲノム解析は、メタゲノムアセンブリゲノム(MAG)の再構築により、種間および種内の遺伝的多様性が非常に高いレベルで存在することを明らかにした。MAGデータベース(MAGdb)は、臨床、環境、動物のカテゴリーにまたがる74の代表的な研究論文という印象的なコレクションを誇り、メタゲノムシーケンスの13,702のペアエンドランアクセッションと、手作業でキュレーションされたメタデータを含む99,672の高品質MAGで構成されている。MAGdbは、ユーザーがMAGとそれに対応するメタデータ情報を閲覧、検索、ダウンロードできるユーザーフレンドリーなインターフェースを提供している。これは、潜在的な新規微生物系統の発見や生態学的役割の理解において、研究者にとって貴重なリソースとなる。MAGdbはhttps://magdb.nanhulab.ac.cn/で公開されている。

help

https://magdb.nanhulab.ac.cn/help

Github

 

webサービス

 https://magdb.nanhulab.ac.cn/にアクセスする。

 

MAGdbは「Rawdata」「MAG」「Download」の3つのモジュールで構成されている。

 

Rawdataタブ

収集されている3つのカテゴリの全論文とキュレーションされたメタデータを閲覧できる。特定のMAGに関する論文に関心がある場合に利用することが想定されている。

左上から3つのカテゴリーを変更できる。

 

リストの右端にあるsampleボタンからは、そのプロジェクトの各fastqの品質チェックレポート(Multiqcで統合されたもの)を閲覧できる。

 

その隣の🔗マークからはそのプロジェクトの論文にジャンプできる。

 

右端のアイテムBOXマークのアイコンからは各サンプルのメタデータを閲覧できる。

 

MAGタブ

収集された全論文と、各論文の3項目における高品質MAG(HMAG)情報が含まれている。

リスト右側の数値はHMAGの数を表している。

 

リストの右端のHMAGをクリックすると、MAGの詳細な分析ページにジャンプする(テスト時は動作せず*1)。

本来は配列品質指標(完全性、汚染度、サイズ、コンティグ数、N50)および分類情報(分類レベルと割合)が可視化される。

 

右端のアイテムBOXマークのアイコンからは各MAG(bin)の簡単な統計量や分類結果を閲覧できる。

 

Downloadタブ

オリジナルデータのメタデータ、HMAG情報、およびHMAG配列をダウンロードできる。

 

ダウンロードするには、ユーザー登録してログインする必要がある。

 

複数まとめて入手することも可能となっている。

 

論文より

  • MAGdbは74の研究論文から13,702件の微生物メタゲノム配列サンプルを収集することに成功しており、5大陸66カ国をカバーしている。臨床、環境、動物のカテゴリーに分類すると、臨床サンプルが最大の割合(76.2%)を占め、次いで環境サンプル(12.04%)、動物サンプル(11.4%)が最も低い割合となっていた(論文図2a)。具体的には、臨床カテゴリーには29の出版物と10,439の実行アクセスが含まれ、環境カテゴリーには30の出版物と1703の実行アクセスが含まれ、動物カテゴリーには15の出版物と1560の実行アクセスが含まれていた(論文表1)。
  • MAGdbには現在、3つのカテゴリーに分類された合計99,672個のHMAG(high-quality MAGs)が収録されている。これらの HMAG はすべて、MIMAG *2基準の高品質レベル(完成度 90% 以上、汚染率 5% 未満)を満たしているか、それを上回っている。GTDB-Tkを用いて、これらのHMAGは分類学的に注釈付けられている。MAGdbカタログは、90の既知の門(細菌82、古細菌8)、196の既知の綱(細菌177、古細菌19)、501の既知の目(細菌474、古細菌27)、2753の既知の属(細菌2687、古細菌66)を網羅していた。

引用

MAGdb: a comprehensive high quality MAGs repository for exploring microbial metagenome-assemble genomes

Guo Ye, Hao Hong, Ting Li, Jin Li, Jia-Qi Wu, Shuai Jiang, Zhi-Tong Meng, He-Tian Yuan, Wen Xue, Ai-Ling Li, Tao Zhou, Ting-Ting Li & Tao Li 

Genome Biology volume 26, Article number: 276 (2025) 

 

関連

 

*1 windows11のchromeとedgeでテスト

*2 MIMAGの基準についてはリンク先論文の補足表を参照。MIMAGのHQ MAGはrRNAも含まれる必要があるなど(生命に必須なので)、ショートリードベースのMAGではかなり厳しい。

 

コメント

シーケンスリード数とHMAGの完全性または回収されたMAGの数との相関関係が補足図で分析されています。糞便サンプルでは回収されたHMAG数がシーケンスリード数の増加で増える傾向が観察された事など記載されています(; 最適なシーケンス戦略には微生物群集の複雑性を考慮すべき)。論文を読んでみてください。