macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

次世代リードのシミュレーター

GCbiasを考慮したイルミナのシミュレーター ArtificialFastqGenerator

ArtificialFastqGeneratorはカバレッジGCバイアスを考慮可能なNGSリードのシミュレーター。イルミナのペアードエンドfastqに対応している。 比較表 Biostars https://www.biostars.org/p/124126/ ダウンロード javaの実行ファイルがダウンロードできる。 htt…

SlnCで高速に変異入りリードをシュミレートする

SlnCは最も多い変異であるSNV、indel、CNVをシミュレートできるNGSのリードシミュレーションツール。マルチコアに対応しており、ARTのようなツールと比較して高速にカバレッジのディープなデータセットを発生させることができる。 ダウンロード 依存 GSL (ht…

シュードゲノムのシミューレーター Simulome

Simulomeは2017年に発表されたbacteria向けの遺伝子のシミュレートツールである。gene情報を与えることで、標準では一部の遺伝子に限定してシミュレートする。具体的には、遺伝子の長さの分布を調べ、その平均と標準偏差から遺伝子のサンプリングをお行い、…

bamに塩基置換やindel変異を起こすbamsurgeon

bamsurgeonはガンの原因となる体細胞突然変異をシミュレートするために構築されたbamに対する変異導入ツール。ユーザーが用意したリストを元にして、bamに不完全な変異や構造変化を引き起こす大きな変異を導入することができる。2015年にnature methodsに発…

リファレンスを変えて、変異株のゲノム配列を作る。

変異のコール結果であるVCFファイルを元に変異株のゲノムを作りたいことが時々ある。そうゆう時は、gatkのFastaAlternateReferenceMakerが利用できる。 マニュアル gatkがない人はbrewで導入しておく。 brew install gatk ラン 入力は変異コール結果のVCFフ…

BBMapでメタゲノムの簡単なシミュレートを行う

メタゲノムをシミュレートするには、ゲノムごとのインサートサイズや増幅biasなどを考慮する必要があり、厳密に行うと計算が複雑になる。また計算リソースも高度に要求される。そのためGPUを使ったシミュレーションツールなども登場している。それに加えて、…

ユーザー定義の変異を再現可能なfastqのシミュレーター NEAT-genReads

NEAT-genReadsは2016年に発表されたfastqをシミュレートできるツール。変異のVCFファイルなどの情報も与えて現実に近いfastqを発生させることができる。fastq以外にポジコンとして使えるbamやVCFファイルも生成されるため、indel検出ツールの妥当性をポジコ…

ナノポアのONTリードのシミュレーター NanoSim

NanoSImは2017年に発表されたOxford nanoporeのロングリードのシミュレーター。ユーザーが指定したONTリードからプロファイルを作成し、それに基づいてロングリードを発生させることができる。 インストール Github https://github.com/bcgsc/NanoSim 依存 L…

SNVやindel変異を再現できるfastqのシミュレーターwgsim

wgsimはfastqをシミュレートできるツールである。シーケンスエラーを再現したり、diploidゲノムの多型を想定して、一定の確率で変異を入れることができる(indelシーケンスエラーは再現されない)。 wgsimはARTなどのツールでは不可能な300bp以上の配列を発…

contigからscaffoldを作るツールの検証

アセンブルして作ったcontigをペアリード情報やロングリード情報を使って統合し、Scaffoldを作るツールがいくつか発表されている。代表的なものをインストールしてテストした。 ツールのインストール テストには2種のバクテリア、Nostoc pcc 7120(Taxonomy …

Pacbioロングリードのシミュレーター

PBSIMはPacbioリードのシミュレーションを行うツールである。ユーザーの持っているPacbioデータをもとにリードの長さやクオリティをシミュレートすることもできるため、実際の解析に適用しやすい。 GitHub - pfaucon/PBSIM-PacBio-Simulator: This is an upd…

fastq配列のシミュレーター ART

NGSのリードをシミュレートする手法はいくつかあるが、今回はMiseqのリードなどもシミュレートできるARTを紹介する。 https://www.niehs.nih.gov/research/resources/software/biostatistics/art/ ARTはIllumina's Solexa, Roche's 454 and Applied Biosyste…