macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

joinx

 

Githubより

Joinxは、vcfファイルや.bedファイルに含まれるゲノムデータに対して演算(交差、差分など)を行うための軽量ツールである。また、いくつかの限定的な解析機能(コンコーダンスレポート)も提供する。joinxは、入力データが常にソートされていることを前提としている。これにより、効率的な方法で結果を計算することができる。

 

インストール

依存(ソースコードからのビルド)

  • gcc 4.4+ or clang 3.2+
  • cmake 2.8+

依存(ラン)

  • Python
  • Valgrind (optional, but recommended)

Github

#conda (link)
mamba install -c bioconda -y joinx

>joinx

$ joinxNo subcommand specified. Valid subcommands:

bed-merge - merge overlapping bed entries in a bed file check-ref - compare the reference column in a bed file against a fasta create-contigs - generate contigs from variant files find-homopolymers - find homopolymers of a minimum size or greater in fasta files intersect - intersect variant files ref-stats - compute statistics (#A/T bases, #C/G, #CpG bases) in regions taken from a .bed file sort - sort variant files vcf-annotate - annotate vcf files vcf-annotate-homopolymers - annotate small indels in homopolymer regions vcf-compare - compare genotypes in vcf files vcf-filter - filter vcf files vcf-merge - merge vcf files vcf-normalize-indels - normalize indels (by left-shifting) in vcf files vcf-remove-filtered-gt - remove filtered sample data from vcf files vcf-report - standard reporting on vcf files vcf-site-filter - filter vcf files using a per-site filter vcf2raw - convert vcf files to bed files wig2bed - convert wiggle files to bed files

> joinx vcf-report -h

 

$ joinx vcf-report -h

Command: vcf-report

 

Description:

standard reporting on vcf files

 

Options:

-h [ --help ] this message

-i [ --input-file ] arg (=-) input file (omit or use '-' for stdin)

-S [ --per-sample-file ] arg (=per_sample_report.txt)

per sample report output file

-s [ --per-site-file ] arg (=per_site_report.txt)

per site report output file

-I [ --info-fields-from-db ] arg info fields to use for determining if a

variant is known (default: none)

$ joinx vcf-site-filter -h

Command: vcf-site-filter

 

Description:

filter vcf files using a per-site filter

 

Options:

-h [ --help ] this message

-i [ --input-file ] arg (=-) input file (empty or - means stdin

-o [ --output-file ] arg (=-) output file (empty or - means stdout

-f [ --min-fail-filter ] arg (=1) minimum fraction of failed samples to fail 

a site

 

> joinx vcf2raw -h

 

$ joinx vcf2raw -h

Command: vcf2raw

 

Description:

convert vcf files to bed files

 

Options:

-h [ --help ] this message

-v [ --vcf ] arg input .vcf file (required)

-f [ --fasta ] arg reference sequence file (fasta format, required)

-o [ --output ] arg (=-) output .bed file (- or omit for stdout)

 

 

実行方法

joinx vcf-report

vcfのレポート出力

joinx vcf-report input.vcf

ポジションのレポートとサンプル間レポートがそれぞれ出力される。

 

joinx vcf-site-filter

vcf から3Fieldのbedファイルに変換

 joinx vcf2raw input.vcf --fasta ref.fasta

ポジションのレポートとサンプル間レポートがそれぞれ出力される。

 

 

引用

https://github.com/genome/joinx