macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

オーバーラップしたペアエンドリードを使用して実際のエラー率を計算する fraguracy

 

レポジトリより

 fraguracyは、フラグメント内のオーバーラップしたペアエンドリードを使用して、実際のエラーレートを計算する。エラーの位置と数、リード位置、リード方向(FまたはR)、塩基品質によるエラーの要約をファイルとして出力する。オーバーラップが必要なため、利用可能な塩基の割合が(潜在的に)少なくなるが、それでも以下のような用途に役立つ:

  • サンプル内およびサンプル間のエラー率の評価
  • ゲノム上のエラー率の高い部位を探す
  • UMIまたはデュプレックスシーケンスにおける対立遺伝子割合(AF)のカットオフについて、データ駆動型でカットオフを見つける

 

インストール

リリースからバイナリをダウンロードしてテストした(ubuntu18)。

Github

> ./fraguracy -h
read accuracy from fragment overlaps

Usage: fraguracy <COMMAND>

Commands:
  combine-errors  combine error bed files from extract
  combine-counts  combine counts.txt files from extract
  extract         error profile pair overlaps in bam/cram
  help            Print this message or the help of the given subcommand(s)

Options:
  -h, --help  Print help

 

実行方法

fastaファイルとペアエンドのリードのマッピング結果のbamファイルを指定する。bam.baiも存在している必要がある。

fraguracy extract --bin-size 1 --output-prefix outprefix --fasta assembly.fasta input.bam

指定したbinサイズでのエラー率を示したテキストファイルが出力される。

 

引用

GitHub - brentp/fraguracy: overlapping bases in read-pairs from a fragment indicate accuracy