macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

シークエンシングリードから直接分類学的プロファイリングを行う MetabuliのGUIアプリケーション(ノートPCでも動作)

 

MetabuliのGUIアプリがリリースされているので簡単に紹介します。

 

https://github.com/steineggerlab/Metabuli-App/releases/tag/v1.0.0

"これはMetabuli Appの最初のリリースで、これまでコマンドライン経由でのみ利用可能だったMetabuliメタゲノム分類ツールをデスクトップユーザーに提供する。このアプリにより、ユーザーは数回クリックするだけで分類学的プロファイリングを実行したり、過去のレポートをアップロードして素早く視覚化することができる。インタラクティブでカスタマイズ可能なサンキープロットとkronaチャートも含まれており、データの可視化と結果の探索が強化されている。また、特定の分類群に分類されたリードを抽出し、サンキー画像をダウンロードすることもできる。さらに、このアプリには過去10件のジョブ履歴が保存され、すばやくアクセスできるようになっている。"

 

 

インストール

M1 macstudioでテストした。

Platforms Supported

Github

https://github.com/steineggerlab/Metabuli-App/releasesよりダウンロードする。

 

実行方法

上に貼られている動画で使い方は説明されています。ここでは流れだけ簡単に確認します。

 

ダウンロード後、Applicationsにコピーして実行する。

 

セキュリティの関係で開けないという警告が出る場合、システム環境設定=>セキュリティで”ここまま開く”を選ぶ。

 

起動した。シングルエンドとペアエンドのショートリード、ロングリードを分析できる。

 

初回はデータベースをダウンロードする必要がある(MetabuliのDBをダウンロードしているならそれも使える)。

 

ダウンロードできるDB。目的に合わせて選ぶ。

 

ここでは以前MetabuliのサイトからダウンロードしたGTDB R214を指定した。出力と最大RAM使用量も指定する。

 

計算にはしばらく時間がかかる(M1 macstudioだと200MBx2のペアエンドfastqで15秒ほど)。

 

ここでは”LOAD SAMPLE DATA”の結果を見てみる。

rootから種までアサインされたリードの比率が示されている。

 

Sankey plot

 

Configure

 

図はHTMLや画像として保存できる。

 

Krona plot

 

右端のextract readsボタンからはその分類群のfastqを取り出して書き出すことが出来る。

 

 

  • Metabuliはユーザー指定のランダムアクセスメモリー(RAM)制限内で動作し、ストレージに保存さえできれば、あらゆるサイズのデータベースを使用できる。コマンドライン版では、8ギガバイトのRAMを搭載したM1 MacBook airのようなノートブックでも動作することがアナウンスされている。
  • MetabuliはRAM上にDBをロードしない。たくさんサンプルがあっても、DBのロード時間を気にすることなく何度も実行できる(直接教えていただきました)。

引用

Metabuli: sensitive and specific metagenomic classification via joint analysis of amino acid and DNA

Jaebeom Kim & Martin Steinegger

Nature Methods, Published: 20 May 2024

 

関連