macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

BMC Bioinformatics

mixed sampleの多様性を見積もる ShoRAH

ディープシークエンシングや次世代シークエンシング(NGS)と呼ばれる新しい世代のハイスループットDNAシークエンシング技術の出現により、基礎的、応用的、臨床的研究における新しい実験的アプローチの扉が開かれた。 NGSによって生成される膨大な量のデー…

Var2GO

Var2GOはハイスループットシーケンシングデータのさまざまな変異コールから、遺伝子アノテーションとフィルタリングをサポートする新しいWebベースのツールである。その主な目的は、非生物情報学者が直感的なWebインターフェイスを介してVariant Calling For…

バリアントをランク付ける VVP

2018 10/23 コマンドの誤り修正 バリアントの優先順位付けは、遺伝子検査、エキソームまたは全ゲノムシーケンシングの過程で同定されたバリアントが遺伝子機能を損なう可能性があるかどうかを決定するプロセスである(レビュー[論文より ref.1,2,3])。バリ…

エンリッチされたDNAモチーフ配列を検出する DiNAMO

一連のDNA配列が与えられた場合、モチーフ発見は、偶然によって予想されるよりも配列中で有意に頻繁なover-represented(以後、過剰表現)されたモチーフを見つけることにある。これは、バイオインフォマティクスと同程度の歴史を持ち、多数のアプリケーショ…

WGSデータからミトコンドリアゲノムをアセンブルする NORGAL

ミトコンドリアなどの特定の細胞小器官には、独自の異なるゲノムが存在している。ミトコンドリアゲノム - the mitogenome - は、真核生物の核ゲノムとは著しく異なる。典型的に環状であり、サイズがより小さい[ref.1]。The mitogenomeは、ミトコンドリアを単…

複雑なクエリ表現に対応し、BAMを様々な条件でフィルタリングできる BAMQL

Binary Alignment / Map(BAM)は、リファレンスゲノムとのアラインメント後に大量のゲノムリードデータを保持するための共通フォーマットを提供している。リードには捕捉情報が追加されており、例えばFASTAやFASTQファイルには含まれていないターゲット位置…

ゲノムなどの長い配列同士を比較し、違いをレポートする NucDiff

2018 10/13 コマンドエラー修正 2019 11/13 インストール手順訂正 全ゲノムシーケンシング戦略およびアセンブリアプローチの進歩により、一連の配列を互いに比較する方法が必要となっている。共通のクエスチョンは、同じリードセットの異なるアセンブリプロ…

ラージゲノムにも対応したcontigのscaffoldingツール BESST

近年のハイスループットシーケンシング(HTS)技術は、低コストで数百万の短いDNA配列(リードと呼ばれる)を生成するため、デノボアセンブリプロジェクトにとって魅力的である。しかしながら、これらのリードは数百bpの長さしかないため、アセンブラ(例え…

複数のアセンブラのコンティグをマージする GAM-NGS

2019 6/10 インストール追記 2019 6/11 sparsehashインストール追記 次世代シーケンシング(NGS)技術の出現により、生物圏のすべての生物を事実上 シーケンシングでききるようになった[論文より ref.1]。 NGS技術は、非常に高いデータ生産量を特徴としてお…

バリアントをランク付けする Variant Ranker

変異を特定することは、病気の病因を理解する上で重要である。ハイスループットな次世代ゲノム技術の進歩により、ゲノムシーケンシング、エクソンシークエンシング、RNA-SeqおよびChIP-Seqは、複雑なメンデル症の感受性遺伝子座を同定するための標準となって…

gene-targeted assembler: aTRAM2.0

大規模なシーケンスからの迅速な標的遺伝子座特異的なアセ​​ンブリは、現在、医学から広範囲の系統学までの応用分野で、生物学科学全体で一般的に使用されている。ターゲットアセンブリ手法は、完全なゲノムのデノボアセンブリと比較してアセンブリの計算規…

メタゲノムのgene-targeted assembler: MegaGTA

次世代シーケンシングは、近年のメタゲノミクスの研究を大きく促進してきた。これらの研究は、しばしば何百万から数十億のリードをde novoでアセンブリし、コンティグにして遺伝子アノテーションすることを含む。これは、メタゲノムのアセンブリ効率を大幅に…

メタゲノムデータをサブサンプリングして繰り返し アセンブリする Spherical

過去10年間、研究者らは、ハイスループットシーケンシングを利用して、世界中の多様な環境からの微生物群集の構造と機能を調べてきた[論文より ref.1、2、3]。これらの研究は、微生物の働きについてユニークで斬新な洞察を提供してきたが、入手可能なツール…

メタゲノム分析サーバ CoMet

Metagenomicsは、人間の腸[論文より ref.1,2]、土壌[ref.3]および海水表面[ref.4]を含む様々な環境における微生物の動態の培養に依存しない研究を可能にした。メタボノミクスは、直接サンプリングと微生物の遺伝物質のハイスループットショットガンシーケン…

Pacbioのロングリードアライナー HISEA

デノボゲノムアセンブリは、リファレンスゲノムを使用せずにシーケンシングリードから生物のゲノム全体を再構築する。ハイスループットのNGS技術は、微生物および真核生物ゲノムの反復領域の大部分よりもはるかに小さい、数百塩基対の短いリードを生成する。…

ロングリードのハイブリッドエラーコレクションツール FMLRC

2019 7/26 condaインストール追記、流れ修正 ゲノムのデノボアセンブリは、いわゆるロングリードシークエンシング技術の導入により劇的に恩恵を受けている。 PacbioによるSMRTシーケンシングやOxford Nanopore Technologiesによるナノポアシークエンシングプ…

ペアエンドリードを使いミスアセンブリを検出する misFinder

ミスアセンブルを検出するツールにはQuest、GAGEなどがあるが、これらのツールはミスアセンブルとリファンレスの違いを区別せず全て報告する。そのため、ミスアセンブルのみを検出するには通常さらなる工夫が必要になる。 一方、CGALやALE、REAPRはDe novoの…

RNA seqのクオリティチェックツール QoRTs

RNA-Seqは特定のバイアス、アーティファクトを受けやすく、 堅牢で包括的なクオリティチェックが重要になる。とくにサンプル調製、ライブラリー作成、またはシークエンシングのエラーは、 予期せぬアーティファクト、バイアスを引き起こす。適切に処理できる…

Synteny blockを検出して、染色体の類似領域を可視化する Cinteny

Cintenyは類似の生物間のゲノム配列を比較し、Synteny block(wiki)で描画するツール。人やマウスなどのデータについてはビルド済みのwebサーバーが提供されており、すぐにゲノム比較を行うことができる。 webサーバー http://cinteny.cchmc.org 使い方につ…

TopHatのunmapped.bamを修復する TopHat-Recondition

tophatはスプライシングされた領域を跨ぐアライメントが可能なRNAのマッピングツールだが、他のアライメントユーツとは異なり、tophatのすべてのバージョンはアライメントされなかったリードを独自形式で別のbamに書き込む。このフォーマットが理由で、unmap…

TE及び単純反復をDe novoで検出する Red

RedはTE及び単純反復の検出ツール。機械学習を通して訓練された。バクテリアゲノムでのテストでは既存のツールより高速に動作し(バクテリアなら10秒程度)、中程度の偽陽性率であった。よく知られている既存のリピート検出ツールと異なり、ほかのアライメン…

特異的なプライマーを自動設計する Primer BLAST

2018 11/07追記 2018 11/16 誤字修正 プライマーデザイン時には、GC率が適度か、ヘアピンループを取らないか、ダイマーを作らないかなどはチェックされるが、ゲノム全体で特異的な増幅が可能な組み合わせになっているかどうか調べるのは簡単ではない。特に、…

エラーコレクションツール FMOC

FMOCは(bwaやbowtieも使っている)FMインデックスを使ったエラー補正の方法論。ハイクオリティなデータセットであるなら、エラー補正能の感度は高いとされる。計算にかかる時間はKarectと同等(karectリンク)。 インストール cent OSに導入した。 本体 Git…

Roche 454のクオリティトリミングツール QTrim

QTrimは454のトリミングツール。PRINSEQと同等のパフォーマンスを持つとされる。 公式HP http://hiv.sanbi.ac.za/software/qtrim#Installation webサーバー http://hiv.sanbi.ac.za/tools/#/qtrim インストール 公式HPから実行可能なバイナリと454のテストデ…

ファミリー遺伝子などから特異的なプライマーを自動設計するwebツール Primique

Primiqueは特異的なプライマーを自動設計してくれるツール。高い相同性を持つ遺伝子ファミリーからなるような配列から特異的、または縮退した配列を設計するのに重宝する。 webサーバー http://cgi-www.cs.au.dk/cgi-chili/primique/front.py how to use htt…

プライマーがどれだけユニークか調べるwebツール GenomeTester 1.3

GenomeTester 1.3はプライマーペアの結合サイトをゲノム全体から調べて、どれだけの断片が増幅されるのか予測するツール。データベース化されたヒトゲノムといくつかのモデル真核生物ゲノムで使用できる。 webサーバー http://bioinfo.ebc.ee/genometester/ …

BWAに近い精度でかつ数倍高速なマッピングツール FSVA

HiseqX10などの登場でシーケンススループットはますます高まっているが、ソフトの方が追いついていない。200GBのデータを処理するのに、BWA MEMだと1CPU使用で80時間程度かかる(20コアでようやく10-20時間)。解決には分散コンピューティング(e.g., pBWA、Sp…

アセンブル結果の分析およびマージを行う CAMSA

2019 6/11 インストール追記、タイトル修正 ドライの計算技術およびウエット実験技術を利用して、ドラフトゲノムからゲノムを再構築する様々な方法が存在するが、それらはアセンブリの一部のみを生成する。したがって、異なる方法によって作製されたアセンブ…

並列化で高速に動作するシミュレーター SlnC

SlnCは最も多い変異であるSNV、indel、CNVをシミュレートできるNGSのリードシミュレーションツール。マルチコアに対応しており、ARTのようなツールと比較して高速にカバレッジのディープなデータセットを発生させることができる。 ダウンロード 依存 GSL (ht…

アダンプタートリミングツール TagDust2

TgaDust2は、アダプター、バーコード、単純リピートなどの不要な情報を見つけて除去するツール。2009年にTagDDustが発表され、その後2015年にTagDust2が発表された。 公式サイト TagDust インストール brewで導入できる。 brew install TagDust brewではTagD…