macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

(Prokaryotes)ドラフトゲノムのポリッシングを行う Polypolish

 

Githubより

Polypolishはショートリードによるゲノムアセンブリを研磨するツールです。このカテゴリーの他のツールとは異なり、Polypolishは各リードが(単一の最適な位置ではなく)すべての可能な位置にアラインメントされたSAMファイルを使用します。これにより、他のアラインメントベースのポリッシャーでは修正できない繰り返し領域のエラーを修正することができます。

 

wiki

https://github.com/rrwick/Polypolish/wiki

 

 

ホモポリマーのエラー修正

https://github.com/rrwick/Polypolish/wiki/Alignment-trimming

 

インストール

Github

git clone https://github.com/rrwick/Polypolish.git
cd Polypolish
cargo build --release
cd target/release/

> ./polypolish

f:id:kazumaxneo:20210912202646p:plain

(version 0.4.3)

 

実行方法

1、ドラフトゲノムアセンブリfastaにショートリードをマッピングする。

bwa index draft.fasta
bwa mem -t 16 -a draft.fasta reads_1.fastq.gz > alignments_1.sam
bwa mem -t 16 -a draft.fasta reads_2.fastq.gz > alignments_2.sam

 

2、polypolishの実行

polypolish draft.fasta alignments_1.sam alignments_2.sam > polished.fasta

 動作は非常に高速。5-Mbの細菌ゲノムでテストすると10秒程度で終了した。

 

FAQも用意されていて、真核生物ゲノムに使えるのかなど書かれています。興味ある方はアクセスしてみて下さい。

引用

https://github.com/rrwick/Polypolish

 

関連