macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

トランスポゾン検出ツール6 Tangram

 Tangramはトランスポゾンの検出に特化した構造変化検出ツール。SV検出で用いられるread-pairとsplit-readのアルゴリズムを使い高感度にトランスポゾンを検出する。1000ゲノムでもmobile element検出ツールとして用いられた。トランスポゾン検出ツールは様々報告されているが、Tangramはsplit read情報とread pair情報を両方使い、1塩基の精度でトランスポゾン挿入位置を検出することが可能である。

  

インストール

github

依存

  • g++ 4.2.0 and above
  • zlib
  • pthread lib

 

ダウンロードしてビルドする。

git clone git://github.com/jiantao/Tangram.git 
cd src
make

 bin/にパスを通しておく。

 

 

実行方法

以下のフローでトランスポゾンを検出する。

 

f:id:kazumaxneo:20171017213212j:plain 

Gitのマニュアルより

 

MOSAIKでアライメントしたza tag付きのbamが必要。なければ、bamにZA -tagを付加する作業を最初に行う。fastaのindexがなければ、ここで自動作成される。

step1 ZA tagの付加。

tangram_bam -i input.bam -r ref.fa -o ZA-tagged.bam

 <@/&:MQ1:MQ2:SP_REF:NUM_MAP:CIGAR:MD>のようなTagがbamに付加される。詳細はGitのマニュアルを参考にしてください。

 

step2 bamのスキャン。

tangram_scan -in ZA-tagged.bam -dir output

 

step3 index。

tangram_index -ref -sp output/input.bam -out output/

 

step4 トランスポゾンの検出。

tangram_detect

 

step5 フィルタリング。

tangram_filter

 

作成中。

 

 

引用

Tangram: a comprehensive toolbox for mobile element insertion detection

Jiantao Wu, Wan-Ping Lee, Alistair Ward, Jerilyn A Walker, Miriam K Konkel, Mark A Batzer and Gabor T Marth

BMC Genomics 2014 15:795