最後はtandem duplicationのテスト結果についてまとめる。
検証
逆位の場合と同じようにシミュレーションデータを使って検証した(read-pairは除く)。結果だけ箇条書きする。
- read-pair法のBreakdancerは100 bp以上のtandem duplicationを全て検出した。
- Split-read法のPindelは10bp -10 kbのtandem duplicationを全て検出し、配列予測も正確だった。
- Split-read法のBreseqは10 bpのサイズのみ100%検出した。
- アセンブルのPlatypusは10bpのサイズのみ100%検出した。 アセンブルのFermikitとSvABAは10bp-10kbのtandem duplicationを全て検出した。ただし両方ともサイズを正しく検出できていなかった。
- hybird法のScanindelは300bp以上の逆位を全く検出しなかった。
まとめ
今回の検証では100bpのtandem duplicationの検出が限界で、リードより長くなってくるとアセンブリベースの手法の精度が損なわれる結果となった。挿入で良好な成績だったScanindelが長いサイズに対応できなかったのも、アセンブリが原因と考えられる。
反面、BreakdancerとPindelはリードより長いtandem duplicationについて高い検出率を示した。 逆位の検出の結論と同じになるが、複雑な構造変化の検出率を上げるには、複数手法の結果の整合性を取っていく必要があると考えられる。