macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

Genome Biology

メタゲノムを分類し、結果を可視化する Taxonomer

微生物集団のゲノム解析であるMetagenomicsは、環境と人体の微生物群集のプロファイリングを、これまでにない深みと幅で可能にする。その急速に拡大している用途は、自然環境や人工環境における微生物多様性の理解に革命をもたらしており、微生物の地域プロ…

MinHashを使い高速にゲノムを比較する MASH

BLASTが1990年に初めてpublishされたとき、公開されたアーカイブには5000万塩基以下の塩基配列しか存在しなかった[論文より ref.2]。現在では、1つのシーケンシング機器1回の実行で1兆塩基を超えるシーケンス生成が可能である[ref.3]。この規模のデータを管…

NGSデータから素早くバクテリアの分析を行う MICRA

ハイスループットシーケンシング(HTS)技術は多くの微生物学的問題に対処するための費用対効果の高い便利なアプローチとして浮上し、この分野を大きく変えている。完全なゲノム情報にアクセスすることは、微生物学における基礎研究に革命をもたらし、例えば…

ロングリードを使い環状DNAかどうか調べる Circlator

デノボアセンブリの課題は、世界初の自動DNAシーケンサーの登場以来ずっと存在していた。初期ゲノムシーケンスデータのアセンブリは、大きく2つの戦略に基づいていた:BAC / YACタイリングまたは全ゲノムショットガン[論文より ref.1]。これらのストラテジー…

リードをマッピングしてゲノムアセンブリの精度を評価する REAPR

REAPRは、リファレンスゲノムを使わずゲノムアセンブリの精度を評価するツール。カバレッジおよびインサートサイズの分布などのマッピング情報を分析して、ミスアセンブリの位置が特定される。 誤ったアセンブリはレポートされ、新しいアセンブリが出力され…

複数のアセンブラのコンティグをマージする Metassembler

Metassemblerは複数のアセンブルツールのcontigをマージし、他のツールの短所を補い合うことで(例えばOLCのアセンブルツールとde brujin graphのアセンブルツール)、より長いcontigを作るツール。アセンブルコンペティションのAssemblathonの1と2のデー…

エラーコレクションツール lighter

インストール cent OSに導入した。 Github https://github.com/mourisl/Lighter git clone https://github.com/mourisl/Lighter.gitcd Lighter/make./lighter #動作確認 ghter]$ lighter Usage: ./lighter [OPTIONS] OPTIONS: Required parameters: -r seq_f…

数百から数千のバクテリアゲノムの同時比較を行うHarvest

Harvestは数百、数千のバクテリアのゲノム比較を高速に実行する方法論。同じ種のほぼ同一なゲノムの比較を対象としている。labo-strainのような非常に似ているがわずかに変異が出現したような株同士のマルチプルアライメントを行い、バリアントの出現パター…

メタゲノムデータの高速なtaxonomy assignmentを行う kraken

2018 10/6 タイトル修正 krakenは2014年に発表されたメタゲノムデータの分類手法。fastqまたはfastaの入力からk-merの配列に分解し、構築したデータベースにアライメントを行う。BLASTと同等の精度を保ちながら、megablastより最大909倍高速と主張されている…

ゲノムの相同性の高い領域の網羅的な検索 MUMmer

MUMmerはゲノム全体を高速にアライメントするオープンソースのツール。Finisihしたゲノムだけでなくドラフトゲノムでも使用でき、容易に何百あるcontigのアライメントを行うことができる。最初の論文が発表されたのは1999年だが(ref.1)、現在でもオープン…