macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

Inversionの検出テスト

・検証  

リアルデータでは既知の逆位変異がなかったので、シミュレーションデータだけ使って3手法のパフォーマンスを検証した。箇条書きで記す。

  • read-pair法のBreakdancerは、100 bp以上の逆位を100%検出した。
  • Split-read法のPindelは10bp -10 kbの逆位を100%検出し、配列予測も正確だった。
  • Split-read法のBreseqは100bp以下の挿入を100%検出したが、より大きなサイズだとsmall indelと間違えて検出した。
  • アセンブルのPlatypusは10bpのサイズのみ100%検出した。
  • アセンブルのFermikitとSvABAは10-100bpの逆位を100%検出した。より大きな逆位も検出したが、逆位の両端を2つのsmall indelと間違えて検出した。
  • hybird法のScanindelは逆位を全く検出しなかった。

 

以上のことから、検出可能なINversionのサイズを下表のようにまとめた。

f:id:kazumaxneo:20170525121856j:plain

 

・まとめ

 現状、アセンブリベースの手法では長い逆位を正しく検出することができない。また、ScanIndelは逆位を全く検出しなかったので、検出に対応していないと思われる。複雑な構造変化の検出率を上げるには、BreakdancerやPindelなどの手法で可能性がある部位を見積もって、アセンブリベースの手法の結果と整合性を取っていく必要があると考えられる。