macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

simulator

fastq のシミュレーター XS (リファンレスなし)

XSはIon Torrent、Roche-454、Illumina、SOLiDに対応したショートリードのシミュレータ。軽量で依存がないように設計されている。クラウドに向けて時間とメモリに応じていくつかの実行モードを備えている。リファンレスは使わない。塩基はランダム発生され、…

GCbiasを考慮したイルミナのシミュレーター ArtificialFastqGenerator

ArtificialFastqGeneratorはカバレッジGCバイアスを考慮可能なNGSリードのシミュレーター。イルミナのペアードエンドfastqに対応している。 比較表 Biostars https://www.biostars.org/p/124126/ ダウンロード javaの実行ファイルがダウンロードできる。 htt…

並列化で高速に動作するシミュレーター SlnC

SlnCは最も多い変異であるSNV、indel、CNVをシミュレートできるNGSのリードシミュレーションツール。マルチコアに対応しており、ARTのようなツールと比較して高速にカバレッジのディープなデータセットを発生させることができる。 ダウンロード 依存 GSL (ht…

シュードゲノムのシミューレーター Simulome

Simulomeは2017年に発表されたbacteria向けの遺伝子のシミュレートツールである。gene情報を与えることで、標準では一部の遺伝子に限定してシミュレートする。具体的には、遺伝子の長さの分布を調べ、その平均と標準偏差から遺伝子のサンプリングをお行い、…

リファレンス配列に点変異やSVを導入するEMBOSSのmsbar

2019 7/16 タイトル修正 EMBOSSパッケージのmsbarを使うと、リファレンスに変異を導入することができる。変異のシミュレーション実験などに使える機能である。 公式サイト http://emboss.sourceforge.net EMBOSS: msbar インストール embossはbrewで導入でき…

bamに塩基置換やindel変異を起こすbamsurgeon

bamsurgeonはガンの原因となる体細胞突然変異をシミュレートするために構築されたbamに対する変異導入ツール。ユーザーが用意したリストを元にして、bamに不完全な変異や構造変化を引き起こす大きな変異を導入することができる。2015年にnature methodsに発…

リファレンスを変えて、変異株のゲノム配列を作る。

2019 8/3 リンク追加 変異のコール結果であるVCFファイルを元に変異株のゲノムを作りたいことが時々ある。そうゆう時は、gatkのFastaAlternateReferenceMakerが利用できる。 マニュアル gatkがない人はbrewで導入しておく。 brew install gatk 実行方法 入力…

メタゲノムの簡単なシミュレートを行う BBMap

メタゲノムをシミュレートするには、ゲノムごとのインサートサイズや増幅biasなどを考慮する必要があり、厳密に行うと計算が複雑になる。また計算リソースも高度に要求される。そのためGPUを使ったシミュレーションツールなども登場している。それに加えて、…

ユーザー定義の変異を再現可能なfastqのシミュレーター NEAT-genReads

2017 8/29追記 2019 4/16 誤字修正 ゲノム解析の検証方法やベンチマーク方法の障害は、サンプルゲノムの突然変異の状況についての「根拠のある真実」がわかっていて完全に検証されている参照データセットがほとんどないことである。さらに、本物のヒトゲノム…

ONTリードのシミュレーター NanoSim

NanoSImは2017年に発表されたOxford nanoporeのロングリードのシミュレーター。ユーザーが指定したONTリードからプロファイルを作成し、それに基づいてロングリードを発生させることができる。 インストール 依存 minimap2 (Tested with version 2.10) LAST …

SNVやindel変異を再現できるfastqのシミュレーターwgsim

#標準出力修正 wgsimはfastqをシミュレートできるツールである。Wgsimは、SNPと挿入/欠失多型と二倍体ゲノムをシミュレートできる(シーケンスエラーを再現したり、diploidゲノムの多型を想定して、一定の確率で変異を入れることができる)。もともとSAMtool…

contigからscaffoldを作るツールの検証

2020 10/4 コメント追加 アセンブルして作ったcontigをペアリード情報やロングリード情報を使って統合し、Scaffoldを作るツールがいくつか発表されている。代表的なものをインストールしてテストした。 ツールのインストール テストには2種のバクテリア、No…

Pacbioロングリードのシミュレーター PBSIM

2019 7/28 condaインストール追記 PBSIMはPacbioリードのシミュレーションを行うツール。ユーザーの持っているPacbioデータをもとにリードの長さやクオリティをシミュレートすることもできるため、実際の解析に適用しやすい。 インストール GitHub - pfaucon…

illumina、454、SOLIDのショートリードのシミュレータ ART

2019 7/16 タイトル修正 インストール追記、help追加 NGSのリードをシミュレートする手法はいくつかあるが、今回はMiseqのリードなどもシミュレートできるARTを紹介する。 https://www.niehs.nih.gov/research/resources/software/biostatistics/art/ ARTはI…