macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

summary

FASTA/FASTQ関係のツールまとめ

随時更新 情報が増えてきたので、これまで紹介してきたfasta、fastqの分析、変換(圧縮)、修復ツールをまとめておく。 アダプタートリミング trimming / preprocessing カテゴリー seqkit fastq / fastaの操作ツール seqkit seqkitに最近追加されたコマンド…

de novo transcriptome 解析のツールまとめ(主にde novo assemblerについて)

随時更新 2020 2/4 help更新 RNAの発現は分子によって大きな差があるため、どのようなデータセットでも万能なRNAのアセンブルツールというのは存在しない。そのため単一のアセンブルツールでアセンブルするより、複数のアセンブルツールでかつ複数のk-merサ…

De novoアセンブリ関連のツールまとめ(主にショートリード)

2020 3/8 整頓、help追記 随時更新 これまでNGSデータをアセンブル様々なアセンブルやツールが発表されてきた。例えばOMICs toolでヒットするツールは100を超える(https://omictools.com/genome-assembly-category)。全てを整理しきるのは難しいが、代表的…

sam/bam関係のツールまとめ

随時更新 2019 1/23 リンク修正 2020 4/17 samtoolsについてmultiqcと連携する例を追記 2020 4/18 help更新、インストール方法追加 samとbamのハンドリングに関するツールを紹介する。 追記 --2017-- 8/20 samblaster samblasterでduplicationリードにタグを…

Oxford Nanoporeリードのマッピング

7/10 LAST コマンドミス修正 bwa memとLASTがナノポア向けにチューニングされたとナノポア公式ページでアナウンスされている。 https://nanoporetech.com/publications/bwa-and-last-have-been-tuned-work-nanopore-reads bwa memはショートリード時代から1M…

バリアントコール結果のVCFフォーマット

2018 10/25 追記 2019 8/9 コマンド追記 2020 10/14 vcflibのインストールコマンドを最後に追記 次世代データからリファンレンスゲノムの変異検出を行うと、Variant Call Format(VCF)という形式で出力されることが多い。VCFの詳細はsamtoolsのVCFフォーマ…

small indelとSNV検出のワークフロー

随時更新 2019 11/24 condaインストール追記(v3.8) 2020 5/13 インストール追記 SNVやsmall indel検出については精度の高いワークフローがすでに確立されている。例えば下記のニューヨーク大のHP https://gencore.bio.nyu.edu/variant-calling-pipeline/ …

large indel(structural variations)の検出ツールまとめ

随時更新 2017 10/18 PindelとPlatypusのフローを修正。 2018 2/3 brew tap 修正 2018 8/8 freebayes、lumpyの誤りを修正。 2018 9/8 誤字修正。 2018 10/23 lumpyの流れを見やすく修正。 2019 6/13 インストール追記 2019 7/1 lumpy -svのdockerイメージリ…