macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

EMBL-EBIのMGnifyのアップデート

 

 MGnifyプラットフォーム(https://www.ebi.ac.uk/metagenomics)は、微生物由来の核酸配列のアセンブリ、解析、保存を容易にする。このプラットフォームでは、メタバーコード、メタトランススクリプトーム、メタゲノムなど、様々な環境由来のデータセットを対象とした約50万件の解析について、分類や機能アノテーションを利用することができる。過去3年間で、MGnifyは収録データセット数の増加だけでなく、ロングリード配列の解析など、提供される解析の幅も広がった。MGnifyのタンパク質データベースは、メタゲノム解析から予測される非冗長配列が24億個を超えるようになった。このコレクションはリレーショナルデータベースに整理され、ソースアセンブリやサンプルメタデータへのナビゲーションを通じてタンパク質のゲノムコンテキストを理解することが可能になり、大きな進歩を遂げた。MGnifyで既に提供されている機能的アノテーションをさらに拡張するために、著者らは深層学習ベースのアノテーション手法を適用した。また、MGnifyのアプリケーションプログラミングインターフェース(API)とウェブサイトの基盤技術をアップグレードし、Jupyter Lab環境を導入してMGnifyデータのダウンストリーム解析ができるようにした。

 

Documentation

https://docs.mgnify.org/en/latest/

Github(EBI-Metagenomics / genomes-pipeline Public)レポジトリは他にもあり。 

 

webサービス

https://www.ebi.ac.uk/metagenomics/ にアクセスする。

 

以前にも紹介していますので、ここでは更新されている部分について見ていきます。

 

Browse dataでは閲覧できるデータがかなり増えている。

Genomesタブでも利用できる大規模メタゲノムプロジェクトからのMAGが増えている。口腔、海、家畜や魚の腸内細菌など幅広い。

 

クリックすると利用可能なゲノムが表示される。Marine v1.0では1504個のゲノムについて閲覧できる。これらMAGsは上にリンクを張ったGIthubのパイプラインで解析して得られたものになる(興味があるなら下の画像のPilpeline v1.2.1のところをクリック)。パイプラインの詳細はこちらで説明されている。

 

 

Genomeをクリックすると詳細が表示される。基本的なゲノムの統計、COG、KEGG、などの分析結果になる。

 

KEGG class

 

EMBL-EBI MGnify | Jupyter Notebook Lab

https://shiny-portal.embl.de/shinyapps/app/06_mgnify-notebook-lab

 

引用

MGnify: the microbiome sequence data analysis resource in 2023 
Lorna Richardson, Ben Allen, Germana Baldi, Martin Beracochea, Maxwell L Bileschi, Tony Burdett, Josephine Burgin, Juan Caballero-Pérez, Guy Cochrane, Lucy J Colwell, Tom Curtis, Alejandra Escobar-Zepeda, Tatiana A Gurbich, Varsha Kale, Anton Korobeynikov, Shriya Raj, Alexander B Rogers, Ekaterina Sakharova, Santiago Sanchez, Darren J Wilkinson, Robert D Finn
Nucleic Acids Research, Published: 07 December 2022