macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

ショートリードからの構造変化検出4, Tandem duplication

 

 ・検出原理

 他にも構造変化の種類はあるが、4回目の今回で最後とする。図はTandem duplicationを 捉える例を示している。

 

f:id:kazumaxneo:20170524141255j:plain

 

Tandem duplicationは配列の挿入が起きているので、広義では挿入の1種と考えられる。ただし、1つ目の配列の隣に挿入されるため、ペアリードのマッピングが撹乱される。それをうまく捉える工夫がなされている。

 

 

・read-count法 (A) では、カバレッジが優位に増大している領域を探す。

・read-pair法 (B)では、異常な向き(--> -->、または<-- <--)にアライメントされ、かつインサートサイズがマイナス値になる(リードの位置関係が逆転している)部位を探す。大きなサイズのtandem duplicationも検出は可能だが、変異の正確なbreakpointや挿入された配列を捉えることはできない。

・Split-read法 (C) では、split-alignmentさせることで5'側と3'側の断片の位置関係が反対になるペア (5'側分割断片と3’側分割断片のポジションの差分がマイナスになる) が集まる領域を探す。  理論上は数kbのtandem duplicationも正確に検出可能。

de novoアセンブル法 (D) では配列を比較して検出する。

 

検証結果はこちら。

 

 --> 挿入の検出。 

--> 欠損の検出。 

--> 逆位の検出。