macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

マッピングのローレンツ曲線を生成する bam-lorenz-coverage

 

Githubより

bam-lorenz-coverageはBAMファイルから直接ローレンツプロットやカバレッジプロットを簡単に作成できるフリーソフトです。また、テーブルをテキスト文書として出力することができるので、カスタムプロットを作成することも可能です。また、特定の領域のみを解析することも可能です。

 

インストール

condaで環境を作ってテストした(ubuntu18使用)。

Github

mamba create -n bam-lorenz-coverage python=3.8 -y
conda activate bam-lorenz-coverage

git clone https://github.com/yhoogstrate/bam-lorenz-coverage
cd bam-lorenz-coverage
python setup.py install

> bam-lorenz-coverage --help

$ bam-lorenz-coverage --help

Usage: bam-lorenz-coverage [OPTIONS] INPUT_ALIGNMENT_FILE

 

Options:

  --version                  Show the version and exit.

  -l, --lorenz-table TEXT    Output table Lorenz-curve (for stdout use: -)

  -c, --coverage-table TEXT  Output table Coverage-graph (for stdout use: -)

  -L, --lorenz-svg TEXT      Output figure Lorenz-curve (SVG).

  -C, --coverage-svg TEXT    Output figure Coverage-graph (SVG).

  -s, --stats TEXT           Output additional stats to text-file

  -r, --region TEXT          Scan depth only in selected region <chr:from-to>

                             (all positions: 1-based)

  -b, --bed-regions TEXT     Scan depth only in selected positions or regions

                             (BED file: start: 0-based & end: 1-based)

  --help                     Show this message and exit.

 

 

 

 

実行方法

RNA seqの)bamファイルを指定する。

bam-lorenz-coverage input.bam -L Lorenz.SVG -C Coverage.SVG -l Lorenz.table -c coverage.table

 

オプションを使う事で、ほかのカバレッジ曲線をプロットすることもできます。サンプル間のカバレッジの均一性を調べるために利用できます。

引用

Fusion transcripts and their genomic breakpoints in polyadenylated and ribosomal RNA–minus RNA sequencing data 
Youri Hoogstrate, Malgorzata A Komor, René Böttcher, Job van Riet, Harmen J G van de Werken, Stef van Lieshout, Ralf Hoffmann, Evert van den Broek, Anne S Bolijn, Natasja Dits, Daoud Sie, David van der Meer, Floor Pepers, Chris H Bangma, Geert J L H van Leenders, Marcel Smid, Pim J French, John W M Martens, Wilbert van Workum, Peter J van der Spek, Bart Janssen, Eric Caldenhoven, Christian Rausch, Mark de Jong, Andrew P Stubbs, Gerrit A Meijer, Remond J A Fijneman, Guido W Jenster
GigaScience, Volume 10, Issue 12, December 2021

 

 

参考

Tools to compute Lorenz curve of coverage uniformity