Nanopore long read
ロングリードシーケンスデータは、大規模で複雑な構造変異の検出に有用だが、技術的なアーティファクトが誤った構造変異の検出を引き起こす可能性がある。解析において、ロングリードデータにおけるフォールドバックアーティファクトの存在に気づいた。その…
ウイルスゲノムのシークエンシングと解析は、ウイルスの多様性と進化を理解する上で極めて重要である。従来のサンガーシークエンシングはシークエンスデプスが低く、労力を要するという制約があった。イルミナなどの次世代シーケンシング(NGS)法はシークエ…
2025/09/09 プレプリント引用 ロングリードメタゲノムアセンブリは、マイクロバイオームからの完全なゲノム復元を約束する。しかし、メタゲノムの複雑性は課題をもたらす。本著者らは、PacBio HiFiおよびOxford Nanopore Technologies (ONT) R10.4ロングリー…
第3世代のロングリードシーケンス技術は、メタゲノムアセンブリの質を著しく向上させることが示されている。PacBio HiFiで生成された高精度のリードを用いた結果は特に注目すべきもので、手作業なしで数百の環状化された完全なゲノムをメタゲノムアセンブリ…
2025/03/19 追記 シーケンスデータの品質管理は、多くのシーケンスワークフローの最初のステップである。ショートリードおよびロングリードシーケンス技術には、品質管理に関して多くの共通点がある。品質管理プログラムはいくつか存在するが、両方のテクノ…
2025/01/25 追記 レポジトリより Doradoは、Oxford Nanoporeリード用の高性能で使いやすいオープンソースのベースコーラーである。 特徴1つの実行ファイルで、適切なデフォルト設定、ハードウェアの自動検出および設定が可能。 Appleシリコン(M1/2ファミリ…
マニュアルより POD5は、ナノポアシーケンスデータを簡単にアクセスできる方法で保存するためのファイルフォーマットである。このフォーマットはApache Arrowを用いて格納され、標準的なツールを用いて多くの言語でデータを利用することができる。POD5には、…
mmlong2はNanoporeまたはPacBio HiFiシーケンスデータから原核生物ゲノムを自動回収・解析するゲノム中心のロングリードメタゲノミクスワークフローである。mmlong2ワークフローはmmlongを継承している。mmlong2はロングリード専用のワークフローであり、Nan…
ゲノム解析において正確なゲノムサイズの推定は重要な要素であるが、既存のツールは主にショートリードデータに最適化されている。本著者らは、リード間のオーバーラップ情報を利用して、リファレンスフリーな方法でゲノムサイズを推定する新しいツールであ…
逆位、重複、その他の医学的に重要な変異は、日常的な遺伝子解析では無視されがちである。リピートの性質と複雑さにより、最新の配列アラインメント手法では正確にアラインメントすることが困難である。本著者らは、この限界が、 linear edits(欠失、挿入、…
最近のロングリードシーケンスの進歩により、ヒトゲノムのテロメア間(完全)アセンブリが可能になり、現在では複数のヒトゲノムのハプロタイプを分解した完全アセンブリに貢献している。反復性の高い領域ではリードマッピングツールの精度が低下するため、…
高品質なリファレンスゲノムを用いた生物多様性研究の取り組みが活発化し、さまざまな生物の塩基配列決定が可能になっていることから、大規模ゲノムアセンブリのための最先端の方法論を取り入れた、アクセスしやすく、再現性が高く、使いやすいツールの開発…
最近のロングリードシーケンス技術の進歩により、高品質なゲノムアセンブリの作成が大幅に容易になった。テロメアtoテロメアなギャップレス(T2T)アセンブリは、ゲノムアセンブリの新たなゴールデンスタンダードとなっている。最近、T2Tレベルのリファレン…
2024/05/22 追記、誤字修正、コメント追加 2024/08/22 追記 2025/03/04 追記 メタゲノムの分類学的な分類器は、DNA配列かアミノ酸(AA)配列のどちらかを解析する。しかし、Metabuli (https://metabuli.steineggerlab.com)は、DNAとAAの両方を共同で解析し、…
第3世代シークエンシング技術は、高品質でウルトラロングリードを生成できることから人気を博している。さまざまなサンプルや複数のシーケンスプラットフォームから得られたデータセットを比較および包括的な解析に活用することは、生物学的メカニズムの解明…
エラーの自己修正は、ロングリードシークエンシングデータの解析において極めて重要な最初のステップである。しかし、この目的のための既存のメソッドのほとんどは、主にエラー率が5%を超えるノイズの多いシーケンスデータ用に調整されており、多くの場合、…
微生物群集のホールゲノムショットガン(WGS)メタゲノムシークエンシングにより、多様な生態系に生息する微生物の原核生物や真核生物の機能、生理、進化の歴史を発見することができる。その重要性にもかかわらず、微生物真核生物のメタゲノム研究は、WGSデ…
20240419 タイトル修正 2024/08/05 引用の間違い修正 2025/01/22 テストラン追記 注;論文のタイトルにはHEROと書かれてますが、レポジトリではHERROとなっています。ここではHERROで統一します。 追記 HEROとHERROを混同していました。コメントで教えていた…
ハプロタイプ間の遺伝的差異を解明するためには、Diploid assembly(二倍体アセンブリ)、すなわち相同染色体の配列を別々に決定することが不可欠である。一つのアプローチは、リファレンス配列上で一塩基変異(SNV)をコールし、phase化することである。し…
PacBioやOxford Nanoporeシークエンサーで作られたロングリードは、ショートリードよりも構造変異(SV)のブレイクポイントに頻繁にまたがっている可能性がある。そのため、既存のロングリードのマッピング手法では、しばしば誤ったアラインメントやバリアン…
2024/09/04 論文引用 ロングリードシーケンスは、複雑な微生物群集の特徴を明らかにする上で大きな可能性を秘めているが、ロングリード専用に設計された分類学的プロファイリングツールはまだ不足している。ここでは、ロングリードのユニークな特性を生かし…
またIGVの簡単なTipsを紹介します。 1,ロングリードシークエンスのindelエラーの表示/非表示 ロングリードシークエンスの普及により、IGVにTGS向けのオプションが追加されています。 View => Preference => Third Genタブ TGS向けの長めのVisibility range…
オックスフォード・ナノポア・テクノロジーズ(ONT)のシーケンスプラットフォームは、シーケンス中にリアルタイム解析を実行する優れた機会を提供する。この機能により、実験データに対する早期の洞察が可能になり、さらなる解析のための潜在的な意思決定プ…
ナノポアシークエンシングによるウイルスゲノムの検出と解析は、病原体アウトブレイクのサーベイランスにおいて大きな可能性を示している。しかし、ナノポアシーケンスをサポートするウイルス検出パイプラインの数は非常に限られている。この論文では、Nanop…
次世代シーケンサーデータのin silicoシミュレーションは、ゲノミクス分野で広く用いられている手法である。しかし、DNAまたはRNA分子を時系列電流シグナルデータの形で測定する「第3世代」ナノポアシーケンス装置からのシミュレーションデータを作成するた…
ロングリードシーケンスプロジェクトにおけるコホートサイズの増加により、Oxford Nanopore TechnologiesとPacific Biosciencesのシーケンスデータの品質評価と処理のためのより効率的なソフトウェアが必要とされている。ここでは、実験の要約、データセット…
krakenに代表されるメタゲノムの分類学的プロファイリングツールは、fastqのそれぞれのReadに対してダイレクトに分類学的分類を行う。そのために、kraken1ではJellyfishを使ってリファレンスゲノムからk-merが取り出され、ゲノムの分類学的情報と共にデータ…
プラスチドゲノム(プラストーム)の構造は、ほとんどの種子植物で高度に保存されているが、過去20年間の研究により、大幅な再配列を経験したいくつかの異種族系統が明らかになっている。ほとんどのプラストームには、大きなインバーテッドリピートと2つのシ…
Genome-resolved metagenomicsの正確で包括的な解析は、多様な微生物群からリファレンス品質(完全で高品質な)のゲノムを再構築することに大きく依存している。Nanoporeロングリードにより、ドラフトゲノムのギャップ解消が進んでいるが、ゲノム品質の向上…
現在、多くの生物種や個体において、 de novo phased diploid genome assembliesが実現可能である。そのため、アセンブリの精度を検証し、オーソログシーケンスデータによるミスアセンブリを検出し、ダウンストリーム解析を確実に行うための手法が求められて…