macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

summary

De novo transcriptomeのアセンブリ評価やフィルタリングのツール

人の文章ばかり載せているので、たまには自分の言葉で書いてみる。 ハイスループットシークエンシングのコストは年々下がっているが、それでも高品質なゲノム配列の解読と遺伝子予測、機能的注釈を得るまでには多くの人、時間、そして資金が必要になる。この…

FASTA/FASTQ関係のツールまとめ

随時更新 情報が増えてきたので、これまで紹介してきたfasta、fastqの分析、変換(圧縮)、修復ツールをまとめておく。 アダプタートリミング trimming / preprocessing カテゴリー seqkit fastq / fastaの操作ツール seqkit seqkitに最近追加されたコマンド…

de novo transcriptome 解析のツールまとめ(主にde novo assemblerについて)

随時更新 2020 2/4 help更新 RNAの発現は分子によって大きな差があるため、どのようなデータセットでも万能なRNAのアセンブルツールというのは存在しない。そのため単一のアセンブルツールでアセンブルするより、複数のアセンブルツールでかつ複数のk-merサ…

De novoアセンブリ関連のツールまとめ(主にショートリード)

2020 3/8 整頓、help追記 随時更新 これまでNGSデータをアセンブル様々なアセンブルやツールが発表されてきた。例えばOMICs toolでヒットするツールは100を超える(https://omictools.com/genome-assembly-category)。全てを整理しきるのは難しいが、代表的…

sam/bam関係のツールまとめ

随時更新 2019 1/23 リンク修正 2020 4/17 samtoolsについてmultiqcと連携する例を追記 2020 4/18 help更新、インストール方法追加 samとbamのハンドリングに関するツールを紹介する。 追記 --2017-- 8/20 samblaster samblasterでduplicationリードにタグを…

Oxford Nanoporeリードのマッピング

7/10 LAST コマンドミス修正 bwa memとLASTがナノポア向けにチューニングされたとナノポア公式ページでアナウンスされている。 https://nanoporetech.com/publications/bwa-and-last-have-been-tuned-work-nanopore-reads bwa memはショートリード時代から1M…

バリアントコール結果のVCFフォーマット

2018 10/25 追記 2019 8/9 コマンド追記 2020 10/14 vcflibのインストールコマンドを最後に追記 2021 5/15 誤字修正 次世代データからリファンレンスゲノムの変異検出を行うと、Variant Call Format(VCF)という形式で出力されることが多い。VCFの詳細はsam…

small indelとSNV検出のワークフロー

随時更新 2019 11/24 condaインストール追記(v3.8) 2020 5/13 インストール追記 2021 4/24 GATKアーカイブのダウンロードリンク追加(archive) 2021 5/9 GATK for Microbesリンク追加 SNVやsmall indel検出については精度の高いワークフローがすでに確立…

large indel(structural variations)の検出ツールまとめ

随時更新 2017 PindelとPlatypusのフローを修正。 2018 brew tap 修正 ,reebayes、lumpyの誤りを修正。誤字修正。 lumpyの流れを見やすく修正。 2019インストール追記, lumpy -svのdockerイメージリンク追加, breseq dockerイメージの使用例追加, 誤字修正と…