レポジトリより
fraguracyは、フラグメント内のオーバーラップしたペアエンドリードを使用して、実際のエラーレートを計算する。エラーの位置と数、リード位置、リード方向(FまたはR)、塩基品質によるエラーの要約をファイルとして出力する。オーバーラップが必要なため、利用可能な塩基の割合が(潜在的に)少なくなるが、それでも以下のような用途に役立つ:
- サンプル内およびサンプル間のエラー率の評価
- ゲノム上のエラー率の高い部位を探す
- UMIまたはデュプレックスシーケンスにおける対立遺伝子割合(AF)のカットオフについて、データ駆動型でカットオフを見つける
インストール
リリースからバイナリをダウンロードしてテストした(ubuntu18)。
> ./fraguracy -h
read accuracy from fragment overlaps
Usage: fraguracy <COMMAND>
Commands:
combine-errors combine error bed files from extract
combine-counts combine counts.txt files from extract
extract error profile pair overlaps in bam/cram
help Print this message or the help of the given subcommand(s)
Options:
-h, --help Print help
実行方法
fastaファイルとペアエンドのリードのマッピング結果のbamファイルを指定する。bam.baiも存在している必要がある。
fraguracy extract --bin-size 1 --output-prefix outprefix --fasta assembly.fasta input.bam
指定したbinサイズでのエラー率を示したテキストファイルが出力される。
引用
GitHub - brentp/fraguracy: overlapping bases in read-pairs from a fragment indicate accuracy