macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

(Prokaryotes)ドラフトゲノムのポリッシングを行う Polypolish

2021 10/21 論文引用

 

Githubより

Polypolishはショートリードによるゲノムアセンブリを研磨するツールです。このカテゴリーの他のツールとは異なり、Polypolishは各リードが(単一の最適な位置ではなく)すべての可能な位置にアラインメントされたSAMファイルを使用します。これにより、他のアラインメントベースのポリッシャーでは修正できない繰り返し領域のエラーを修正することができます。

 

wiki

https://github.com/rrwick/Polypolish/wiki

 

2024/01/17

 

 

 

ホモポリマーのエラー修正

https://github.com/rrwick/Polypolish/wiki/Alignment-trimming

 

インストール

Github

git clone https://github.com/rrwick/Polypolish.git
cd Polypolish
cargo build --release
cd target/release/

> ./polypolish

f:id:kazumaxneo:20210912202646p:plain

(version 0.4.3)

 

実行方法

1、ドラフトゲノムアセンブリfastaにショートリードをマッピングする。

bwa index draft.fasta
bwa mem -t 16 -a draft.fasta reads_1.fastq.gz > alignments_1.sam
bwa mem -t 16 -a draft.fasta reads_2.fastq.gz > alignments_2.sam

 

2、polypolishの実行

polypolish draft.fasta alignments_1.sam alignments_2.sam > polished.fasta

 動作は非常に高速。5-Mbの細菌ゲノムでテストすると10秒程度で終了した。

 

FAQも用意されていて、真核生物ゲノムに使えるのかなど書かれています。興味ある方はアクセスしてみて下さい。

引用

https://github.com/rrwick/Polypolish

 

2021 10/21

Polypolish: short-read polishing of long-read bacterial genome assemblies
Ryan R. Wick,  Kathryn E. Holt

bioRxiv, Posted October 16, 2021

 

関連