macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

small indel

アセンブリのエラーやギャップ(NNN)を検出し、ポリッシュしたFASTAを出力するPilon

2018 8/31 タイトルと紹介文修正、11/5 タイトル修正 2019 1/11 追記、3/3ラストにnanopore long read追記、4/12 ラストにpacbio long read追記、6/12 リンク追記、6/27 merged.fq追記、7/15 追記、9/29 追記、10/28インストール追記 2021 2/28 関連論文追記…

bamに塩基置換やindel変異を起こすbamsurgeon

bamsurgeonはガンの原因となる体細胞突然変異をシミュレートするために構築されたbamに対する変異導入ツール。ユーザーが用意したリストを元にして、bamに不完全な変異や構造変化を引き起こす大きな変異を導入することができる。2015年にnature methodsに発…

VCFを管理、編集する VCFtools

2019 4/16 condaインストール 2019 12/9ビルド手順の誤り修正 2020 1/5 mergeの説明追加 2020 4/18 基本コマンド追記 2020 10/13 追記 20200 10/14 分かりにくい説明を修正 2021 2/17 dockerリンク追加 2021 5/16 ”変異”を”バリアント”に修正 2023/09/29 vcf…

リファレンスを変えて、変異株のゲノム配列を作る。

2019 8/3 リンク追加 2021 2/17 dockerhubリンク追加 変異のコール結果であるVCFファイルを元に変異株のゲノムを作りたいことが時々ある。そうゆう時は、gatkのFastaAlternateReferenceMakerが利用できる。 マニュアル gatkがない人はbrewで導入しておく。 b…

de novoアセンブルしてバリアントをコールするDISCOVAR

DISCOVARは2014年にNature geneticsに載ったバリアントを検出する方法論。シーケンスデータをアセンブルして、バリアントをコールする。ヒトゲノムの構造変化は90%ほどは既存のツールで検出可能だが、残りの構造変化(low-complexity sequenceやsegmental du…

バリアントのフィルタリングを行うSnpSift

2021 9/29 タイトル修正(変異 => バリアント), help追加 以前SnpEffというバリアントのアノテーションを行うことができるツールを紹介した(リンク)。このツールにはもう一つSnpSiftというツールが同梱されている。SnpSiftはバリアントコール結果のVCF…

ユーザー定義の変異を再現可能なfastqのシミュレーター NEAT-genReads

2017 8/29追記 2019 4/16 誤字修正 ゲノム解析の検証方法やベンチマーク方法の障害は、サンプルゲノムの突然変異の状況についての「根拠のある真実」がわかっていて完全に検証されている参照データセットがほとんどないことである。さらに、本物のヒトゲノム…

SNVやindel変異を再現できるfastqのシミュレーターwgsim

#標準出力修正 2021 7/11 condaインストール追記 2022/09/17 -hオプション修正 wgsimはfastqをシミュレートできるツールである。Wgsimは、SNPと挿入/欠失多型と二倍体ゲノムをシミュレートできる(シーケンスエラーを再現したり、diploidゲノムの多型を想定…

サンプル間で共通する変異と固有の変異を抽出する

2019 11/19 コマンドエラー修正(A、Bの比較なのにCの表記がある) 2020 10/20 インストール追記 以前ショートリードからindelとSNVを検出するワークフローを紹介した。 複数サンプルがある場合、上記のような方法でVCFファイルを出力した後、サンプル間で共…

small indelとSNV検出のワークフロー 準備編

2020 9/2 追記 インストール追記 2020 9/4 コメントいただいた部分を修正 この投稿はSNVとindel検出に必要なツールの準備編です。 実際の検出のワークフローは以下のエントリーを確認してください。 --準備するもの-- 解析に必要なソフト GATK BWA Picard Sa…

GATKでの変異のフィルタリング条件の分析

以前ニューヨーク大のindel検出のワークフローを紹介したが、その中で Haplotypercallerの検出結果のフィルタリングを以下のような条件で行なった。 java -jar GenomeAnalysisTK.jar -T VariantFiltration -R ref.fa -V raw_snps.vcf --filterExpression 'QD …

small indelとSNV検出のワークフロー

随時更新 2019 11/24 condaインストール追記(v3.8) 2020 5/13 インストール追記 2021 4/24 GATKアーカイブのダウンロードリンク追加(archive) 2021 5/9 GATK for Microbesリンク追加 SNVやsmall indel検出については精度の高いワークフローがすでに確立…

変異はどんな遺伝子に起きているのか? SnpEffを使ってバリアント検出結果のアノテーションを行う

2017 8/24追記 2019 4/24 インストール追記 2020 10/14 リンク追加 2021 5/9 インストール追記 2021 5/13 リンク追加 多くのindel検出ツールは変異のポジションしか出力しないため、その変異がどのようなアミノ酸変化を引き起こすか、サイレントなのかは別途…

Indel検出ツールまとめ

250bp x 2のペアリードでテストした時の結果をツールごとにまとめた。 インストール編はこちら Pindel Ye et al. (2009) split-read approaches. splitリード法はいくつか報告されているが、その中でおそらく最もよく知られたツール。原理はインストール編に…