ショートリードからの構造変化検出２, large Insertion

ショートリードを使った４つの手法による挿入の検出原理を簡潔に説明する。

・検出原理

次の図は挿入変異を４つの手法で捉える例を示している。

f:id:kazumaxneo:20170524122406j:plain

　Aのresd-count方法ではリードの増減がないので、挿入変異を検出することはできない。

　read-pair法 (B) ではリファレンスに極端に近接してアライメントされるペアを探すことで挿入を検出する。原理上、挿入のサイズが大きくなると検出が困難になってくる。例えばilluminaだと1kbpを超えてブリッジPCRがかかることはほとんどないと言われる。よって数百bpより長い挿入を検出することは難しい。

　Split-read法 (C) では、split-alignmentさせることで挿入の上を横断している相方リードを検出する。この場合、挿入を完全に横断してシーケンスされていることが前提なので、リード長のある割合以上の挿入を検出することはできなくなる。例えば初期の36-50bpリードでは、アライメントの正確性を担保するためにはリード長の15%程度の挿入が検出限界とされる。

　de novoアセンブル法 (D) では理屈上限界はない。ただしlocal de novoアセンブリのようなリードを限定する手法では大きな挿入を検出することは難しい。

挿入変異の検出をテストした結果はこちらになります。

--> 欠損の検出。

--> 逆位の検出。

--> tandem duplicationの検出。