summary
人の文章ばかり載せているので、たまには自分の言葉で書いてみる。 ハイスループットシークエンシングのコストは年々下がっているが、それでも高品質なゲノム配列の解読と遺伝子予測、機能的注釈を得るまでには多くの人、時間、そして資金が必要になる。この…
随時更新 情報が増えてきたので、これまで紹介してきたfasta、fastqの分析、変換(圧縮)、修復ツールをまとめておく。 アダプタートリミング trimming / preprocessing カテゴリー seqkit fastq / fastaの操作ツール seqkit seqkitに最近追加されたコマンド…
随時更新 2020 2/4 help更新 RNAの発現は分子によって大きな差があるため、どのようなデータセットでも万能なRNAのアセンブルツールというのは存在しない。そのため単一のアセンブルツールでアセンブルするより、複数のアセンブルツールでかつ複数のk-merサ…
2020 3/8 整頓、help追記 随時更新 これまでNGSデータをアセンブル様々なアセンブルやツールが発表されてきた。例えばOMICs toolでヒットするツールは100を超える(https://omictools.com/genome-assembly-category)。全てを整理しきるのは難しいが、代表的…
随時更新 2019 1/23 リンク修正 2020 4/17 samtoolsについてmultiqcと連携する例を追記 2020 4/18 help更新、インストール方法追加 samとbamのハンドリングに関するツールを紹介する。 追記 --2017-- 8/20 samblaster samblasterでduplicationリードにタグを…
7/10 LAST コマンドミス修正 bwa memとLASTがナノポア向けにチューニングされたとナノポア公式ページでアナウンスされている。 https://nanoporetech.com/publications/bwa-and-last-have-been-tuned-work-nanopore-reads bwa memはショートリード時代から1M…
2018 10/25 追記 2019 8/9 コマンド追記 2020 10/14 vcflibのインストールコマンドを最後に追記 次世代データからリファンレンスゲノムの変異検出を行うと、Variant Call Format(VCF)という形式で出力されることが多い。VCFの詳細はsamtoolsのVCFフォーマ…
随時更新 2019 11/24 condaインストール追記(v3.8) 2020 5/13 インストール追記 SNVやsmall indel検出については精度の高いワークフローがすでに確立されている。例えば下記のニューヨーク大のHP https://gencore.bio.nyu.edu/variant-calling-pipeline/ …
随時更新 2017 10/18 PindelとPlatypusのフローを修正。 2018 2/3 brew tap 修正 2018 8/8 freebayes、lumpyの誤りを修正。 2018 9/8 誤字修正。 2018 10/23 lumpyの流れを見やすく修正。 2019 6/13 インストール追記 2019 7/1 lumpy -svのdockerイメージリ…