macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

TSV形式のバリアントコールファイル(バリアントテーブル)をVCF形式に変換する tsv-vcf-converter

 

レポジトリより

このツールは、tsvリソースのリフトオーバーを容易にするために作成された。特殊文字はほとんど扱えず、あらゆるTSVファイルやVCFファイルを変換するのには適していないが、一般的なTSV形式のバリアントコール結果(indel、SVには対応しない)をVCF形式に変換できる。

 

インストール

依存

Github

#リリースからダウンロードする
java -jar tsv-vcf-converter.jar -h

> usage: java -jar tsv-vcf-converter.jar -i <arg> -m <arg> -o <arg> [-f]

usage: java -jar tsv-vcf-converter.jar -i <arg> -m <arg> -o <arg> [-f]

       [-d]

 -i,--input <arg>      .tsv input file containing at least a chromosome,

                       position, reference and alternative column.

 -m,--mappings <arg>   Mapping for position columns, comma separated

                       key=value; CHROM, POS, REF, ALT and optionally

                       STOP.

 -o,--output <arg>     Output file

 -f,--force            Override the output files if it already exists.

 -d,--debug            Enable debug mode (additional logging).

 

usage: java -jar tsv-vcf-converter.jar -v

 -v,--version   Print version.

 

 

 

テストラン

git clone https://github.com/molgenis/tsv-vcf-converter.git
cd tsv-vcf-converter-main/src/test/resources/

#run(入力の拡張子は.tsvである必要がある)
java -jar <path>/<to>/tsv-vcf-converter.jar -i example.tsv -m "CHROM=chromosome,POS=start,STOP=stop,REF=ref,ALT=alt" -o output.vcf
  • -i   .tsv input file containing at least a chromosome, position, reference and alternative column

  • -m     Mapping for position columns, comma separated key=value; CHROM, POS, REF, ALT and optionally STOP

  • -o    Output file

 

入力ファイル。最低でもCHROM, POS(start), REF, ALT、そして任意でSTOPの列はある必要がある。

出力ファイル

 

  • 空白は処理中に%sに一次的に変換されるため、%sを値として含むTSVファイルは予期しない結果をもたらす可能性がある。

引用

https://github.com/molgenis/tsv-vcf-converter