微生物ゲノムのアノテーションとは、DNA配列中の構造的・機能的エレメントを特定し、そのエレメントに生物学的情報を付加するプロセスである。DRAMは、純粋培養やメタゲノムから得られた細菌、古細菌、ウイルスのゲノムをアノテーションするために開発されたツールである。DRAMは、従来のアノテーションツールを超えて、複数の遺伝子アノテーションを機能的可能性のあるゲノムレベルに要約している。このような利点がある一方で、DRAMの欠点は、大規模な計算機資源を必要とするため、その利用が制限されることである。さらに、ゲノムアノテーションを必要とする下流の代謝モデリングツールとの統合もできなかった。このような制約を緩和するため、DRAMとそれに対応するウイルス性DRAM-vは、現在、自由にアクセスできるKBaseサイバーインフラストラクチャーに統合され、利用可能となっている。kb_DRAMを使えば、微生物やウイルスのゲノムからDRAMのアノテーションや機能要約をポイント&クリックで作成したり、DRAMアノテーションからゲノムスケールの代謝モデルを作成することができる。
kb_DRAMユーザーにとって、KBase上のkb_DRAMアプリは、https://narrative.kbase.us/#catalog/modules/kb_DRAM のカタログで見つけることができる。kb_DRAMユーザーには、すべてのドキュメントを含むチュートリアルワークフローがhttps://narrative.kbase.us/narrative/129480で、kb_DRAMの開発者向けには、https://github.com/shafferm/kb_DRAM でソフトウェアを提供している。
Tutorial
https://narrative.kbase.us/narrative/129480
https://github.com/WrightonLabCSU/kb_DRAM
使い方
KBaseのDRAMにアクセスする。
https://kbase.us/applist/apps/kb_DRAM/run_kb_dram_annotate/release
Googleアカウントなどでログイン後、Launchボタンをクリックして立ち上げる。
立ち上がった。解析対象のゲノム配列を準備する。
メタゲノムのbin配列や単離ゲノムアセンブリ、メタゲノムアセンブリを読み込む。importタグからは、ローカルのファイルをアップロードして読み込める。
KBaseのアプリケーションで使用するためには、Addボタンで配列を登録後、importアプリケーションをランして配列をimportする必要がある。
データを読み込む方法について
https://docs.kbase.us/getting-started/narrative/add-data
読み込み後はDRAMで選択できるようになる。
ゲノムとパラメータ、名前などを入力後、Runをクリック。
複数ゲノムを含むビニング前のメタゲノムアセンブリなら"Is metagenome?"にチェックを付ける。
product.html
Y軸が解析されたゲノム、X軸がゲノムの持つ様々な推定される代謝機能を表している。
それぞれのファイルはダウンロードできる。
metabolism_summary.xlsx
MISC以外を見てみる。
carbon utilization
Transporters
Energy
Organic nitrogen
carbon utilization (Woodcroft)
rRNA
tRNA
product.tsv
ゲノムごとに、横方向にDRAMのターゲットとしているproductが生じるかどうかがまとめられる。
可能なのかどうか不明ですが、複数ゲノムを指定する方法がわかりませんでした。もし分かる方がいらっしゃったら教えて下さい。
引用
kb_DRAM: annotation and metabolic profiling of genomes with DRAM in KBase
Michael Shaffer, Mikayla A Borton, Ben Bolduc, José P Faria, Rory M Flynn, Parsa Ghadermazi, Janaka N Edirisinghe, Elisha M Wood-Charlson, Christopher S Miller, Siu Hung Joshua Chan, Matthew B Sullivan, Christopher S Henry, Kelly C Wrighton
Bioinformatics, Volume 39, Issue 4, April 2023