macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

format

pacbioのbamをfastqに変換する BAM2fastx

PacificBiosciences/bam2fastx Converting and demultiplexing of PacBio BAM files into gzipped fasta and fastq files. by @PacificBiosciences - Repository | DevHub.io BAM format specification for PacBio(5.1.0) https://pacbiofileformats.readt…

review article要約 SNPs callingビギナーズガイド

8/24 誤字修正 A beginners guide to SNP calling from high-throughput DNA-sequencing data (Andre ́ Altman et al., 2012)より ハイスループットDNAシークエンシング(HTS)は、ライフサイエンスにおいてますます重要になっている。その最も顕著な用途…

データに適した視覚化フォーマットにナビゲートし、その描画コードを教えてくれる From Data to Viz

2020 3/3 タイトル修正 From Data to Vizは、決定木(wiki)を使ってデータの可視化に適したフォーマットを教えてくれるwebサイト。 From data to Viz | Find the graphic you need 下記の決定木を使い、自分の所有しているデータタイプに適したフォーマット…

高速なロング/ショートリードアライナー minimap2

2018/12/21 ドラフトアセンブリ追記 2019 6/1 index追記、7/17追記、7/24 誤字修正、8/3 help更新 2020 1/19 追記、7/21 preset parameter追加 2021 1/17, 1/20 例追加、7/3 構成変更、10/9 新しい論文引用 2023/02/13 help更新, 07/06 追記 2024/02/15 分か…

BEDフォーマット

UCSCのゲノムブラウザーなどで使うフォーマット。最初の3列が必須で、オプションでさらに9列情報がつく場合がある。 最初の3列に記載する情報 クロモソームの名前(e.g., chr1) リードや遺伝子のスタートポジション(ポジションは1でなく0スタート) リー…

GTFとGFFフォーマット

2019 10/15追記 2020 10/13 リンク削除 GTF(General Transfer Format))はgeneのアノテーション専用のフォーマットと定義されている。それに対してGFF(General Feature Format)はtranscriptなどにも使えるよりジェネラルなフォーマットとなっている。この…

バリアントコール結果のVCFフォーマット

2018 10/25 追記 2019 8/9 コマンド追記 2020 10/14 vcflibのインストールコマンドを最後に追記 2021 5/15 誤字修正 次世代データからリファンレンスゲノムの変異検出を行うと、Variant Call Format(VCF)という形式で出力されることが多い。VCFの詳細はsam…