2019 7/5文章修正
VizBinはメタゲノムデータをレファレンスに依存せずにbinnigする手法。テトラヌクレオタイド頻度情報を使いアセンブルデータを分類する。最終的に2次元のPCAプロットとしてビジュアル化してくれる。どこからどこまでを1つの生物として抽出するかは、人間が目で見て決定する。論文にはThe human eye-brain system for cluster identificationと書かれている。複雑なメタゲノムでは使いにくいが、比較的な単純な(low complexitiesな)メタゲノムデータであれば目で見て分類は可能であり、面白いツールである。
アプリはJAVAで構築されている。
公式ページ
Download appから本体をダウンロード可能。
Tutorial
Tutorial · claczny/VizBin Wiki · GitHub
テストデータ
実行方法
ビルド済みのjava実行ファイルが配布されている。これを叩いて起動する。
> java -jar VizBin-dist.jar
File to visualiseにcontigファイルを入力する。あらかじめメタゲノム用のアセンブラでcontigは作っておく必要がある。
計算用のthreadsを増やして計算を高速化することもできる。
↓
startをクリック。抽出されたkmerの数が表示される。
↓
しばらく待つ。
↓
結果が表示された。
↓
trackpad(2本指で上下にドラッグ)やマウスのホイールで拡大縮小が可能。
↓
クリックして領域を囲むと、囲った領域のプロットを全て含むfastaが出力可能。
↓
exportを選択。
↓
fataが出力される。選択を間違えた時は右クリック->Selection->clear selectionでやり直しできる。
contigのサイズ、GCなども読み込める。exampleは以下のようになっている。
最初にヘッダー行が必要である。coverage、length、label、isMarkerなどの名前が認識に必要。contigの順番はfastaの順番と合致している必要がある。
入力する時はadvanxed modeに切り替える。show advanxed optionsをクリック。
↓
aanotton fileの項目をクリック。
他にもいくつかのパラメータを変更可能である。詳細は公式マニュアルを参照(一番下に説明があります)。
引用
VizBin - an application for reference-independent visualization and human-augmented binning of metagenomic data
Cedric C Laczny, Tomasz Sternal, Valentin Plugaru, Piotr Gawron, Arash Atashpendar, Houry Hera Margossian, Sergio Coronado, Laurens van der Maaten, Nikos Vlassis, Paul Wilmes
Microbiome 2015 3:1