macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

misassembly

ゲノムアセンブリを評価する WebQUAST

ゲノミクス研究において、適切なゲノムアセンブリを選択することは、ダウンストリーム解析の鍵となる。しかし、多くのゲノムアセンブリツールが存在し、その実行パラメータは非常に多様であるため、このタスクは困難である。また、既存のオンライン評価ツー…

HiFiロングリードアセンブリのためのリピートを認識したポリッシングツール NextPolish2

PacBio社が開発した高忠実度(HiFi)ロングリードシーケンス技術により、ゲノムアセンブリの塩基レベルの精度は大幅に向上したが、これらのアセンブリには、特にHiFiロングリードのエラーが発生しやすい領域内に、塩基レベルのエラーが残っている。しかし、…

ONTリードを用いて2倍体HiFiアセンブリを検証する GAVISUNK

現在、多くの生物種や個体において、 de novo phased diploid genome assembliesが実現可能である。そのため、アセンブリの精度を検証し、オーソログシーケンスデータによるミスアセンブリを検出し、ダウンストリーム解析を確実に行うための手法が求められて…

ゲノムアセンブリと遺伝地図を統合するツール Chromonomer

新しいリファレンスゲノムの配列決定とコンピュータによるアセンブリのペースは加速している。しかし、DNAシーケンシング技術やアセンブルソフトウェアツールは進化し続けているが、反復配列などのゲノムの生物学的特徴や、シーケンシングライブラリの調製に…

ゲノムアセンブリを修正したりscaffoldingするためのツールコレクション RagTag

作物のゲノム解析を進めるためには、高品質な個別ゲノムアセンブリによる効率的な遺伝子システムが必要である。ここでは、アセンブリーのscaffoldingやパッチを自動化するツールセットであるRagTagを紹介し、広く使われているトマトの遺伝子型M82と、機能的…

ロングリードを使ったゲノムアセンブリの評価とミスアセンブリ修正を行う Inspector

全ゲノムde novoアセンブリはリファレンスゲノムを持たない種の研究には不可欠であり、リファレンスゲノムを持つ種の遺伝的変異の全容を明らかにするためにも重要である。ロングリードシーケンシング技術の進歩により、ロングリードはより正確に、より長く、…

ロングリードゲノムアセンブリのミスアセンブリ修正およびスキャフォールディングを行う LongStitch

モデル生物や非モデル生物のゲノム研究では、高品質なデノボゲノムアセンブリの作成が不可欠である。近年、ロングリードシーケンシングは、ゲノムアセンブリやスキャフォールディング(ロングレンジ情報を利用してアセンブリされた配列を順番と方向付けする…

ゲノムアセンブリの品質、完全性、フェーズ評価を行う Merqury

最近のロングリードアセンブリは、利用可能なリファレンスゲノムの品質と完全性を上回ることが多く、その検証は困難を極めている。ここでは、効率的なk-merセット操作に基づいてリファレンスフリーにアセンブリを評価する新しいツール、Merquryを紹介する。M…

メタゲノムアセンブリの品質評価を行う DeepMAsED

アセンブリーの品質を評価する手法の多くは、リファレンスゲノム(アセンブリを比較するためにキュレートされたゲノムのセット)を必要とする。そのような手法として、コンティグを1つ以上のリファレンスゲノムにマッピングして、逆位、リアレンジメント、種…

リファレンスフリーで(メタ)ゲノムアセンブリのミスアセンブリの同定・修正を行う metaMIC

メタゲノムアセンブリの品質を評価することは、信頼性の高いメタゲノムアセンブリゲノムを構築し、下流の解析を行う上で重要である。ここでは、メタゲノムアセンブリのミスアセンブリを特定し、修正するための機械学習ベースのツールであmetaMIC (https://g…

複数のロングリードドラフトアセンブリを使って連続性の高いアセンブリを得る GALA

高品質のゲノムアセンブリは、遺伝学や医学研究の分野で幅広く応用されている。しかし、現在のワークフローでは、ギャップのない染色体スケールのアセンブリを実現することは非常に困難である。ここでは、preliminaryなアセンブリやキメラを含む生データから…

タンデムリピートなどのミスアセンブリを分析する TandemQUAST

タンデムリピートは、不均等なクロスオーバーによってしばしば生成される複数の連続するほぼ同一のシーケンスによって形成される(Smith、1976)。初期のDNAシーケンスプロジェクトで、タンデムリピートが真核生物のゲノムに豊富にあることが明らかになった…

微生物ゲノムアセンブリの品質と比較ゲノミクス(correspondence要約)

私(論文のオーサー;hereafter、私)の最近の研究では、低品質の細菌ゲノム配列(ここでは「多くのコンティグを含むゲノム配列アセンブリ、最終的には明らかなミスアセンブリと未解決のプラスミド配列」と定義)を扱ってきた。主要な問題は、ゲノムのクオリ…

アセンブリのグラフを分析する Asgan

Asgan - [As] sembly [G] raphs [An] alyzer - は、アセンブリグラフを分析するためのツールである。 このツールはGFA形式の2つのアセンブリグラフを入力として受け取り、そのグラフの最小セットの相同配列(シンテニーパス)を見つけ、見つかったパスに基づ…

contigやシーケンシングリードのリファレンスへのアラインメントを複数の方法で視覚化する Alvis

2019 6/10 誤字修正 2019 6/21 リンク追加 2021 6/3 論文引用 2セットの配列間のアラインメントを見つけることは、バイオインフォマティクスにおける基本的な作業である。ロングリードの解析、アセンブリ結果の評価、またはターゲットキャプチャープロトコル…

リードや他のアセンブリから得られた情報を組み込んでゲノムアセンブリ精度を向上させる NucMerge

過去10年にわたるシーケンシング技術の大きな進歩にもかかわらず、第2世代シーケンシングリードを用いたゲノムアセンブリは依然として複雑な問題のままである。これは主に、ゲノムの構造の繰り返しと、大量のデータ、短いリード長及びフラグメント長、不均一…

アセンブリの構造的誤りが疑われる部位をコールする NucBreak

2020 3/3 論文引用 ゲノムシーケンシング技術全体の進歩により、近年ゲノム配列が決定された生物数が大幅に増加している。これは、広範な生物の比較ゲノム解析を行う機会を提供している。分析結果は、使用されたゲノムアセンブリの品質に大きく依存する。ア…

Linked readsを使ってミスアセンブリを検出する tigmint

ショートリード・シーケンシング・データのアセンブリは、シーケンシング・ライブラリのフラグメント・サイズよりも大きいリピート配列によって容易に混乱させられる。リピートのサイズがライブラリのフラグメントサイズを超えると、コンティグは最善のケー…

ラージゲノムにも対応したde novo assembly評価ツール QUAST-LG

2019 7/28 help追記、タイトル修正、コマンド例追記 2019 10/20 リンク追加 2020 1/11 インストール修正 現代のDNAシーケンシング技術は染色体の全配列を読み取ることができない。代わりに、それらはゲノムの異なる部分からサンプリングされた多数のリードを…

review article要約 ラージゲノムのシーケンシング解析

はじめに この記事はレビュー論文の要約です。チェックリスト、または思考を整頓するガイドとして使ってください。ただし、この要約で論文を読んだことにはなりません。時間が許す限り原著論文を読むことをお勧めします。review articleは各段落が一般論で構…

メイトペア情報を使いスキャホールドの誤りを検出する NxRepair

ゲノムのde novoアセンブリの一般的な方法は、de Bruijnグラフ(論文より Compeau、Pevzner&Tesler、2011)の構築に基づく。最も単純なケースでは、グラフはシングルエンドリードから構成されるが、シングルエンドのリードだけでは、de Bruijnグラフをもつ…

ペアエンドリードを使いミスアセンブリを検出する misFinder

ミスアセンブルを検出するツールにはQuest、GAGEなどがあるが、これらのツールはミスアセンブルとリファンレスの違いを区別せず全て報告する。そのため、ミスアセンブルのみを検出するには通常さらなる工夫が必要になる。 一方、CGALやALE、REAPRはDe novoの…

ロングリードやcontig情報を使いスキャッホールドのギャップを埋める GMcloser

2019 9/4 インストール追記 NGSのリードやアセンブルしたコンティグを使い、スキャッホールドのギャップを埋めるツールがいくつか発表されているが、オーサーらは、これらのツールに起因するアセンブリのエラー率が、デノボアセンブルで起こるエラー率よりも…

リードをマッピングしてゲノムアセンブリの精度を評価する REAPR

2021 7/11 link追加 REAPRは、リファレンスゲノムを使わずゲノムアセンブリの精度を評価するツール。カバレッジおよびインサートサイズの分布などのマッピング情報を分析して、ミスアセンブリの位置が特定される。 誤ったアセンブリはレポートされ、新しいア…