macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

メタゲノムデータをbinningして出力可能なGUIアプリ VizBin

VizBinはメタゲノムデータをレファレンスに依存せずにbinnigする手法。5-merの配列

をオリゴヌクレオチドの頻度として計算し、其の頻度からアセンブルデータを分類する。最終的に2次元のPCAプロットとしてビジュアル化してくれる。どこからどこまでを1つの生物として抽出するかは、人間が目で見て決定する。論文にはThe human eye-brain system for cluster identificationと書かれている。複雑なメタゲノムでは使いにくいが、比較的な単純な(low complexitiesな)メタゲノムデータであれば目で見て分類は可能であり、面白いツールである。

アプリはJAVAで構築されている。

 

公式ページ

Download appから本体をダウンロード可能。

f:id:kazumaxneo:20170903124624j:plain

Tutorial

Tutorial · claczny/VizBin Wiki · GitHub

テストデータ

example dataset AMFJ01

 

ラン

ビルド済みのjava実行ファイルが配布されている。これを叩いて起動する。

 

 

File to visualiseにcontigファイルを入力する。あらかじめメタゲノム用のアセンブラでcontigは作っておく必要がある。

f:id:kazumaxneo:20170902204406j:plain

計算用のthreadsを増やして計算を高速化することもできる。

 

startをクリック。抽出されたkmerの数が表示される。

f:id:kazumaxneo:20170902204541j:plain

 ↓

しばらく待つ。 

 ↓

結果が表示された。

f:id:kazumaxneo:20170902205020j:plain

 ↓

trackpad(2本指で上下にドラッグ)やマウスのホイールで拡大縮小が可能。

 ↓

クリックして領域を囲むと、囲った領域のプロットを全て含むfastaが出力可能。

f:id:kazumaxneo:20170902205302j:plain

  ↓

exportを選択。

f:id:kazumaxneo:20170903122240j:plain

  ↓

fataが出力される。選択を間違えた時は右クリック->Selection->clear selectionでやり直しできる。

 

 

contigのサイズ、GCなども読み込める。exampleは以下のようになっている。

f:id:kazumaxneo:20170903123909j:plain

最初にヘッダー行が必要である。coverage、length、label、isMarkerなどの名前が認識に必要。contigの順番はfastaの順番と合致している必要がある。

 

入力する時はadvanxed modeに切り替える。show advanxed optionsをクリック。

f:id:kazumaxneo:20170903130235j:plain

  ↓ 

aanotton fileの項目をクリック。

f:id:kazumaxneo:20170903130408j:plain

他にもいくつかのパラメータを変更可能である。詳細は公式マニュアルを参照(一番下に説明があります)。

 

 

引用

VizBin - an application for reference-independent visualization and human-augmented binning of metagenomic data

Cedric C Laczny, Tomasz Sternal, Valentin Plugaru, Piotr Gawron, Arash Atashpendar, Houry Hera Margossian, Sergio Coronado, Laurens van der Maaten, Nikos Vlassis and Paul Wilmes

Microbiome20153:1 https://doi.org/10.1186/s40168-014-0066-1