DRAMをKBaseサイバーインフラストラクチャーに統合した kb_DRAM

　微生物ゲノムのアノテーションとは、DNA配列中の構造的・機能的エレメントを特定し、そのエレメントに生物学的情報を付加するプロセスである。DRAMは、純粋培養やメタゲノムから得られた細菌、古細菌、ウイルスのゲノムをアノテーションするために開発されたツールである。DRAMは、従来のアノテーションツールを超えて、複数の遺伝子アノテーションを機能的可能性のあるゲノムレベルに要約している。このような利点がある一方で、DRAMの欠点は、大規模な計算機資源を必要とするため、その利用が制限されることである。さらに、ゲノムアノテーションを必要とする下流の代謝モデリングツールとの統合もできなかった。このような制約を緩和するため、DRAMとそれに対応するウイルス性DRAM-vは、現在、自由にアクセスできるKBaseサイバーインフラストラクチャーに統合され、利用可能となっている。kb_DRAMを使えば、微生物やウイルスのゲノムからDRAMのアノテーションや機能要約をポイント＆クリックで作成したり、DRAM アノテーションからゲノムスケールの代謝モデルを作成することができる。
　kb_DRAMユーザーにとって、KBase上のkb_DRAMアプリは、https://narrative.kbase.us/#catalog/modules/kb_DRAM のカタログで見つけることができる。kb_DRAMユーザーには、すべてのドキュメントを含むチュートリアルワークフローがhttps://narrative.kbase.us/narrative/129480で、kb_DRAMの開発者向けには、https://github.com/shafferm/kb_DRAM でソフトウェアを提供している。

Tutorial

https://narrative.kbase.us/narrative/129480

Github

https://github.com/WrightonLabCSU/kb_DRAM

使い方

KBaseのDRAMにアクセスする。

https://kbase.us/applist/apps/kb_DRAM/run_kb_dram_annotate/release

Googleアカウントなどでログイン後、Launchボタンをクリックして立ち上げる。

立ち上がった。解析対象のゲノム配列を準備する。

メタゲノムのbin配列や単離ゲノムアセンブリ、メタゲノムアセンブリを読み込む。importタグからは、ローカルのファイルをアップロードして読み込める。

KBaseのアプリケーションで使用するためには、Addボタンで配列を登録後、importアプリケーションをランして配列をimportする必要がある。

データを読み込む方法について

https://docs.kbase.us/getting-started/narrative/add-data

読み込み後はDRAMで選択できるようになる。

ゲノムとパラメータ、名前などを入力後、Runをクリック。

複数ゲノムを含むビニング前のメタゲノムアセンブリなら"Is metagenome?"にチェックを付ける。

product.html

Y軸が解析されたゲノム、X軸がゲノムの持つ様々な推定される代謝機能を表している。

それぞれのファイルはダウンロードできる。

metabolism_summary.xlsx

MISC以外を見てみる。

carbon utilization

Transporters

Energy

Organic nitrogen

carbon utilization (Woodcroft)

rRNA

tRNA

product.tsv

ゲノムごとに、横方向にDRAMのターゲットとしているproductが生じるかどうかがまとめられる。

可能なのかどうか不明ですが、複数ゲノムを指定する方法がわかりませんでした。もし分かる方がいらっしゃったら教えて下さい。

引用
kb_DRAM: annotation and metabolic profiling of genomes with DRAM in KBase
Michael Shaffer, Mikayla A Borton, Ben Bolduc, José P Faria, Rory M Flynn, Parsa Ghadermazi, Janaka N Edirisinghe, Elisha M Wood-Charlson, Christopher S Miller, Siu Hung Joshua Chan, Matthew B Sullivan, Christopher S Henry, Kelly C Wrighton

Bioinformatics, Volume 39, Issue 4, April 2023

DRAM

https://kazumaxneo.hatenablog.com/entry/2022/02/10/000615