macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

Nextera Mate Pair protocolのジャンクションプライマー除去ツール NxTrim

 

イルミナはmate pairシーケンスのキットも販売している。このプロトコルではNextraのトランスポゾンでタギングしたゲノムをセルフライゲーションさせて離れた配列を近づける。そのため中央にジャンクション配列が残る(図1 赤の配列)。NxTrimはそのジャンクション配列を除く専用のツールである。トリム領域が最小限のため、アセンブル精度が上がると主張されている。2015年に論文が発表された。

 

f:id:kazumaxneo:20170825105709j:plain

図1 ライブラリ作成手順 公式PDFマニュアルより(リンク

 

 

インストール

brewで導入できる。

brew install NxTrim

 

 

ラン

Gitからサンプルfastqをダウンロードしてランする。

wget https://github.com/sequencing/NxTrim/tree/master/example/sample_R1.fastq.gz
wget https://github.com/sequencing/NxTrim/tree/master/example/sample_R2.fastq.gz
nxtrim -1 sample_R1.fastq.gz -2 sample_R2.fastq.gz -O sample

 4つのファイルが出力される。説明を貼っておく。

  • mp: read pairs that are large insert-size mate-pairs, both mates will be reverse-complemented by nxtrim (from RF to FR) unless --rf commandline option is used
  • pe: read pairs that are short insert-size paired-end reads due to the junction adapter occurring early in a read
  • se: single reads (reads having no R1 or R2 counterpart)
  • unknown: a library of read-pairs that are mostly large-insert mate-pair, but possibly contain a small proportion of paired end contaminants

  

 

引用

NxTrim: optimized trimming of Illumina mate pair reads

Jared O’Connell, Ole Schulz-Trieglaff, Emma Carlson, Matthew M. Hims, Niall A. Gormley, Anthony J. Cox

Bioinformatics. 2015 Jun 15;31(12):2035-7