macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

Tandem duplicationの検出テスト

 最後はtandem duplicationのテスト結果についてまとめる。

 

検証

逆位の場合と同じようにシミュレーションデータを使って検証した(read-pairは除く)。結果だけ箇条書きする。  

 

  • read-pair法のBreakdancerは100 bp以上のtandem duplicationを全て検出した。
  • Split-read法のPindelは10bp -10 kbのtandem duplicationを全て検出し、配列予測も正確だった。
  • Split-read法のBreseqは10 bpのサイズのみ100%検出した。
  • アセンブルのPlatypusは10bpのサイズのみ100%検出した。 アセンブルのFermikitとSvABAは10bp-10kbのtandem duplicationを全て検出した。ただし両方ともサイズを正しく検出できていなかった。
  • hybird法のScanindelは300bp以上の逆位を全く検出しなかった。 

 

f:id:kazumaxneo:20170525132256j:plain

 

まとめ

今回の検証では100bpのtandem duplicationの検出が限界で、リードより長くなってくるとアセンブリベースの手法の精度が損なわれる結果となった。挿入で良好な成績だったScanindelが長いサイズに対応できなかったのも、アセンブリが原因と考えられる。

反面、BreakdancerとPindelはリードより長いtandem duplicationについて高い検出率を示した。  逆位の検出の結論と同じになるが、複雑な構造変化の検出率を上げるには、複数手法の結果の整合性を取っていく必要があると考えられる。