macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

メタゲノムデータをbinningして種を予測するMBBC

 

MBBCはメタゲノムをbinningする方法論。リード中のk-mer頻度とk-merカバレッジから分類とabundanceの見積もりを行う。2015年に論文が発表された。

 

マニュアル

http://eecs.ucf.edu/~xiaoman/MBBC/man1V1.html

 

インストール

ダウンロード


実行方法

GUIバージョンとターミナルで動かすCUIバージョンが提供されている。ここではGUI版の流れを説明する。

 

exampleデータを解析する。GUI-jarを開く。

f:id:kazumaxneo:20170908214731j:plain

 左上のopenをクリック

f:id:kazumaxneo:20170908214830j:plain

 

example/paired-end_reads/ba3mg8.fnaを選択(ペアードエンド)。

f:id:kazumaxneo:20170908214815j:plain

他のパラメータはdefaultのままにした。

 

Runボタンをクリックすると解析がスタートする。

f:id:kazumaxneo:20170908214942j:plain

 

数分で解析は終了する。fasta入力ディレクトリにba3mg8.fna_filtered_predictionsが出力される。

xneo$ cat /Users/kazumaxneo/Downloads/MBBC/MBBC_examples/paired-end_reads/ba3mg8.fna_filtered_predictions 

 

Predictions after EM algorithms: 

Predicted genome size: 1151747.76 1162868.69  

Predicted alpha: 28.55% 71.45%

Predicted lambda: 2.57 6.38

 

There are 2 species predicted.

 

Prediction after reads binning: 

Predicted genome size: 1049007.03 1204309.40  

Predicted alpha: 26.00% 74.00%

Predicted lambda: 2.57 6.38

uesaka-no-MacBook-Air-2:condetri-master kazumaxneo$

 

 

ツールに対しての感想

GUI実装されているが、シンプルなインターフェイスなので、アルゴリズムさえ構築されていればjavaのガワの作成は容易に感じる。統合開発環境に慣れた人なら1、2時間くらいで作れるんじゃないだろうか?もう少しこうゆうツールが出てきてもいいように思う。

 

引用

MBBC: an efficient approach for metagenomic binning based on clustering

Ying Wang, Haiyan Hu, Xiaoman Li

BMC Bioinformatics. 2015; 16: 36.