2021 10/21 論文引用
Githubより
Polypolishはショートリードによるゲノムアセンブリを研磨するツールです。このカテゴリーの他のツールとは異なり、Polypolishは各リードが(単一の最適な位置ではなく)すべての可能な位置にアラインメントされたSAMファイルを使用します。これにより、他のアラインメントベースのポリッシャーでは修正できない繰り返し領域のエラーを修正することができます。
https://github.com/rrwick/Polypolish/wiki
2024/01/17
I've released a new version of Polypolish, my short-read polisher for long-read bacterial genomes: https://t.co/6eWZuWsNkp
— Ryan Wick (@rrwick) 2024年1月17日
Polypolish is now 100% Rust for better performance and easier installation, and I've added --careful for when you REALLY don't want false positives.
When you align short reads to a long-read genome assembly in the 'normal' one-alignment-per-read manner, you often get no coverage over errors in repeats. This is because reads will preferentially align to other error-free instances of the repeat.
— Ryan Wick (@rrwick) October 18, 2021
(3/12) pic.twitter.com/30b2yII2uP
But greedily combining different short-read polishers achieved MUCH lower error counts than were possible with any single tool. Clearly Polypolish can fix errors that other tools cannot and vice-versa.
— Ryan Wick (@rrwick) October 18, 2021
(6/12) pic.twitter.com/shoM7mSKHX
I've just released (during #MicroSeq2021) a new short-read polishing tool for fixing errors in long-read bacterial genome assemblies: Polypolish!https://t.co/6eWZuWJQmp
— Ryan Wick (@rrwick) 2021年9月9日
(1/8) pic.twitter.com/2EvI6s6Wya
ホモポリマーのエラー修正
https://github.com/rrwick/Polypolish/wiki/Alignment-trimming
インストール
git clone https://github.com/rrwick/Polypolish.git
cd Polypolish
cargo build --release
cd target/release/
> ./polypolish
(version 0.4.3)
実行方法
1、ドラフトゲノムアセンブリのfastaにショートリードをマッピングする。
bwa index draft.fasta
bwa mem -t 16 -a draft.fasta reads_1.fastq.gz > alignments_1.sam
bwa mem -t 16 -a draft.fasta reads_2.fastq.gz > alignments_2.sam
2、polypolishの実行
polypolish draft.fasta alignments_1.sam alignments_2.sam > polished.fasta
動作は非常に高速。5-Mbの細菌ゲノムでテストすると10秒程度で終了した。
FAQも用意されていて、真核生物ゲノムに使えるのかなど書かれています。興味ある方はアクセスしてみて下さい。
引用
https://github.com/rrwick/Polypolish
2021 10/21
Polypolish: short-read polishing of long-read bacterial genome assemblies
Ryan R. Wick, Kathryn E. Holt
bioRxiv, Posted October 16, 2021
関連