macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

次世代リードのシミュレーター

ユーザー定義の変異を再現可能なfastqのシミュレーター NEAT-genReads

NEAT-genReadsは2016年に発表されたfastqをシミュレートできるツール。変異のVCFファイルなどの情報も与えて現実に近いfastqを発生させることができる。fastq以外にポジコンとして使えるbamやVCFファイルも生成されるため、indel検出ツールの妥当性をポジコ…

ナノポアのONTリードのシミュレーター NanoSim

NanoSImは2017年に発表されたOxford nanoporeのロングリードのシミュレーター。ユーザーが指定したONTリードからプロファイルを作成し、それに基づいてロングリードを発生させることができる。 インストール Github https://github.com/bcgsc/NanoSim 依存 L…

SNVやindel変異を再現できるfastqのシミュレーターwgsim

wgsimはfastqをシミュレートできるツールである。シーケンスエラーを再現したり、diploidゲノムの多型を想定して、一定の確率で変異を入れることができる(indelシーケンスエラーは再現されない)。 wgsimはARTなどのツールでは不可能な300bp以上の配列を発…

contigからscaffoldを作るツールの検証

アセンブルして作ったcontigをペアリード情報やロングリード情報を使って統合し、Scaffoldを作るツールがいくつか発表されている。代表的なものをインストールしてテストした。 ツールのインストール テストには2種のバクテリア、Nostoc pcc 7120(Taxonomy …

Pacbioロングリードのシミュレーター

PBSIMはPacbioリードのシミュレーションを行うツールである。ユーザーの持っているPacbioデータをもとにリードの長さやクオリティをシミュレートすることもできるため、実際の解析に適用しやすい。 GitHub - pfaucon/PBSIM-PacBio-Simulator: This is an upd…

fastq配列のシミュレーター

NGSのリードをシミュレートする手法はいくつかあるが、今回はMiseqのリードなどもシミュレートできるARTを紹介する。 https://www.niehs.nih.gov/research/resources/software/biostatistics/art/ ARTはIllumina's Solexa, Roche's 454 and Applied Biosyste…