macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

計算生物学のシンタックスハイライトパッケージ bioSyntax

 

 計算生物学では、生物学的データファイルの読み取りと理解が必要になる。SAM、VCF、GTF、PDBFASTAなどの平文フォーマットには、データ構造の複雑さによって難読化された重要な情報が含まれていることが多い。bioSyntax (https://biosyntax.org/) は、vim、gedit、SublimeVSCode、および less 用の生物学的シンタックスハイライトパッケージであり、自由に利用できる。

 

HP

https://biosyntax.org/

Manual

https://biosyntax.org/man

 

HPより

bioSyntaxは、vim, less, gedit, sublimeとシームレスに統合し、ユーザーお気に入りの生物学的ファイルフォーマットを自動的に認識する。

 

インストール

付属のインストールスクリプトを使って導入した。

GIthub

https://github.com/bioSyntax/bioSyntax.git
cd bioSyntax/
bash bioSyntax_INSTALL.sh

bash bioSyntax_INSTALL.sh

f:id:kazumaxneo:20210531235427p:plain

ここではlessを選択。

 

yをタイプ。

f:id:kazumaxneo:20210601000120p:plain

インストール完了。

f:id:kazumaxneo:20210601000209p:plain

 


実行例 

 大規模データは、導入されたsam-less, vcf-less, xyz-less コマンドを使って、直接 less にパイプすることができる。

samファイルを閲覧。

samtools view -h NA12878_hg38.bam | sam-less

f:id:kazumaxneo:20210601002831p:plain

 

vcfファイルを閲覧。

gzip -dc dbSNP-common_all.vcf.gz | vcf-less

f:id:kazumaxneo:20210601010111p:plain

 

引用

bioSyntax: syntax highlighting for computational biology
Artem Babaian, Anicet Ebou, Alyssa Fegen, Ho Yin Kam, German E. Novakovsky, Jasper Wong, Dylan Aïssi & Li Yao
BMC Bioinformatics volume 19, Article number: 303 (2018)