macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

bowtie2を使ってアセンブルした配列を評価する

 

bowtie2はマッピング結果の要約統計を標準エラー出力として報告する。Trinityのwikiでは、これを利用してde novo transcriptome assemblyを評価する流れがまとめられている。

RNA Seq Read Representation by Trinity Assembly · trinityrnaseq/trinityrnaseq Wiki · GitHub

 

実行方法

1、indexing

bowtie2-build --threads ref.fasta bowtie2_index

 

2、Mapping

要約統計をstats.txtとして保存する。マッピング結果はここでは破棄する。アセンブリが非常に断片化している可能性を考慮してローカルアラインメントモードを使う。リードが完全にアラインメントされることを必要とするならend-to-endモード(bowtie1)を使う(マニュアル)。

bowtie2 -p 20 --sensitive-local --local -x bowtie2_index -1 reads_1.fq -2 reads_2.fq 2>stats.txt 1> /dev/null 
  •  --sensitive-local   -D 15 -R 2 -N 0 -L 20 -i S,1,0.75 (default)
  • --end-to-end entire read must align; no clipping (on)
       OR
  • --local   local alignment; ends might be soft clipped (off)
  • -p  number of alignment threads to launch (1)
  • --no-unal   suppress SAM records for unaligned reads

出力例

f:id:kazumaxneo:20211225000417p:plain

 

引用

Fast gapped-read alignment with Bowtie 2

Ben Langmead & Steven L Salzberg

Nat Methods. 2012 Mar 4;9(4):357-9

 

関連