イルミナはmate pairシーケンスのキットも販売している。このプロトコルではNextraのトランスポゾンでタギングしたゲノムをセルフライゲーションさせて離れた配列を近づける。そのため中央にジャンクション配列が残る(図1 赤の配列)。NxTrimはそのジャンクション配列を除く専用のツールである。トリム領域が最小限のため、アセンブル精度が上がると主張されている。2015年に論文が発表された。
図1 ライブラリ作成手順 公式PDFマニュアルより(リンク)
インストール
brewで導入できる。
brew install NxTrim
ラン
Gitからサンプルfastqをダウンロードしてランする。
wget https://github.com/sequencing/NxTrim/tree/master/example/sample_R1.fastq.gz
wget https://github.com/sequencing/NxTrim/tree/master/example/sample_R2.fastq.gz
nxtrim -1 sample_R1.fastq.gz -2 sample_R2.fastq.gz -O sample
4つのファイルが出力される。説明を貼っておく。
- mp: read pairs that are large insert-size mate-pairs, both mates will be reverse-complemented by nxtrim (from RF to FR) unless --rf commandline option is used
- pe: read pairs that are short insert-size paired-end reads due to the junction adapter occurring early in a read
- se: single reads (reads having no R1 or R2 counterpart)
- unknown: a library of read-pairs that are mostly large-insert mate-pair, but possibly contain a small proportion of paired end contaminants
引用
NxTrim: optimized trimming of Illumina mate pair reads
Jared O’Connell, Ole Schulz-Trieglaff, Emma Carlson, Matthew M. Hims, Niall A. Gormley, Anthony J. Cox
Bioinformatics. 2015 Jun 15;31(12):2035-7