計算生物学では、生物学的データファイルの読み取りと理解が必要になる。SAM、VCF、GTF、PDB、FASTAなどの平文フォーマットには、データ構造の複雑さによって難読化された重要な情報が含まれていることが多い。bioSyntax (https://biosyntax.org/) は、vim、gedit、Sublime、VSCode、および less 用の生物学的シンタックスハイライトパッケージであり、自由に利用できる。
HP
Manual
HPより
bioSyntaxは、vim, less, gedit, sublimeとシームレスに統合し、ユーザーお気に入りの生物学的ファイルフォーマットを自動的に認識する。
インストール
付属のインストールスクリプトを使って導入した。
https://github.com/bioSyntax/bioSyntax.git
cd bioSyntax/
bash bioSyntax_INSTALL.sh
> bash bioSyntax_INSTALL.sh
ここではlessを選択。
yをタイプ。
インストール完了。
実行例
大規模データは、導入されたsam-less, vcf-less, xyz-less コマンドを使って、直接 less にパイプすることができる。
samファイルを閲覧。
samtools view -h NA12878_hg38.bam | sam-less
vcfファイルを閲覧。
gzip -dc dbSNP-common_all.vcf.gz | vcf-less
引用
bioSyntax: syntax highlighting for computational biology
Artem Babaian, Anicet Ebou, Alyssa Fegen, Ho Yin Kam, German E. Novakovsky, Jasper Wong, Dylan Aïssi & Li Yao
BMC Bioinformatics volume 19, Article number: 303 (2018)