macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

Nanopore long read

ロングリードからフォールドバックアーティファクトを検出する breakinator

ロングリードシーケンスデータは、大規模で複雑な構造変異の検出に有用だが、技術的なアーティファクトが誤った構造変異の検出を引き起こす可能性がある。解析において、ロングリードデータにおけるフォールドバックアーティファクトの存在に気づいた。その…

ナノポアリードからウイルスハプロタイプ再構築を行うnextflowパイプライン BonoboFlow

ウイルスゲノムのシークエンシングと解析は、ウイルスの多様性と進化を理解する上で極めて重要である。従来のサンガーシークエンシングはシークエンスデプスが低く、労力を要するという制約があった。イルミナなどの次世代シーケンシング(NGS)法はシークエ…

ロングリードのメタゲノムアセンブラ myloasm

2025/09/09 プレプリント引用 ロングリードメタゲノムアセンブリは、マイクロバイオームからの完全なゲノム復元を約束する。しかし、メタゲノムの複雑性は課題をもたらす。本著者らは、PacBio HiFiおよびOxford Nanopore Technologies (ONT) R10.4ロングリー…

ナノポアリードからの高品質メタゲノムアセンブリを行う nanoMDBG

第3世代のロングリードシーケンス技術は、メタゲノムアセンブリの質を著しく向上させることが示されている。PacBio HiFiで生成された高精度のリードを用いた結果は特に注目すべきもので、手作業なしで数百の環状化された完全なゲノムをメタゲノムアセンブリ…

ショートリードおよびロングリードシーケンスデータのアダプター残存など包括的な品質チェックを行う Sequali

2025/03/19 追記 シーケンスデータの品質管理は、多くのシーケンスワークフローの最初のステップである。ショートリードおよびロングリードシーケンス技術には、品質管理に関して多くの共通点がある。品質管理プログラムはいくつか存在するが、両方のテクノ…

Dorado ベースコーラ―

2025/01/25 追記 レポジトリより Doradoは、Oxford Nanoporeリード用の高性能で使いやすいオープンソースのベースコーラーである。 特徴1つの実行ファイルで、適切なデフォルト設定、ハードウェアの自動検出および設定が可能。 Appleシリコン(M1/2ファミリ…

POD5ツール

マニュアルより POD5は、ナノポアシーケンスデータを簡単にアクセスできる方法で保存するためのファイルフォーマットである。このフォーマットはApache Arrowを用いて格納され、標準的なツールを用いて多くの言語でデータを利用することができる。POD5には、…

ONT/PacBioのロングリードのメタゲノムアセンブリとbinningパイプライン mmlong2

mmlong2はNanoporeまたはPacBio HiFiシーケンスデータから原核生物ゲノムを自動回収・解析するゲノム中心のロングリードメタゲノミクスワークフローである。mmlong2ワークフローはmmlongを継承している。mmlong2はロングリード専用のワークフローであり、Nan…

ロングリードオーバーラップからゲノムサイズを推定する LRGE

ゲノム解析において正確なゲノムサイズの推定は重要な要素であるが、既存のツールは主にショートリードデータに最適化されている。本著者らは、リード間のオーバーラップ情報を利用して、リファレンスフリーな方法でゲノムサイズを推定する新しいツールであ…

複雑な構造変異を発見するために特別に設計されたロングリードアライナー VACmap

逆位、重複、その他の医学的に重要な変異は、日常的な遺伝子解析では無視されがちである。リピートの性質と複雑さにより、最新の配列アラインメント手法では正確にアラインメントすることが困難である。本著者らは、この限界が、 linear edits(欠失、挿入、…

ロングリードを完全長ゲノムアセンブリの難しい領域へ正確にマッピングする VerityMap

最近のロングリードシーケンスの進歩により、ヒトゲノムのテロメア間(完全)アセンブリが可能になり、現在では複数のヒトゲノムのハプロタイプを分解した完全アセンブリに貢献している。反復性の高い領域ではリードマッピングツールの精度が低下するため、…

自動化されたラージゲノムアセンブリと評価のためのツール Pipeasm

高品質なリファレンスゲノムを用いた生物多様性研究の取り組みが活発化し、さまざまな生物の塩基配列決定が可能になっていることから、大規模ゲノムアセンブリのための最先端の方法論を取り入れた、アクセスしやすく、再現性が高く、使いやすいツールの開発…

T2Tゲノムアセンブリの評価ツール Genome Continuity Inspector (GCI)

最近のロングリードシーケンス技術の進歩により、高品質なゲノムアセンブリの作成が大幅に容易になった。テロメアtoテロメアなギャップレス(T2T)アセンブリは、ゲノムアセンブリの新たなゴールデンスタンダードとなっている。最近、T2Tレベルのリファレン…

アミノ酸とDNAのジョイント解析による高感度で特異的なメタゲノミックリードの分類器 Metabuli

2024/05/22 追記、誤字修正、コメント追加 2024/08/22 追記 2025/03/04 追記 メタゲノムの分類学的な分類器は、DNA配列かアミノ酸(AA)配列のどちらかを解析する。しかし、Metabuli (https://metabuli.steineggerlab.com)は、DNAとAAの両方を共同で解析し、…

複数のロングリードシークエンシングデータの一括した分析を行う Giraffe

第3世代シークエンシング技術は、高品質でウルトラロングリードを生成できることから人気を博している。さまざまなサンプルや複数のシーケンスプラットフォームから得られたデータセットを比較および包括的な解析に活用することは、生物学的メカニズムの解明…

ナノポアR10リードのリピートおよびハプロタイプを考慮したエラー修正を行う DeChat

エラーの自己修正は、ロングリードシークエンシングデータの解析において極めて重要な最初のステップである。しかし、この目的のための既存のメソッドのほとんどは、主にエラー率が5%を超えるノイズの多いシーケンスデータ用に調整されており、多くの場合、…

メタゲノムシークエンシングデータから微生物真核生物ゲノムを取り出すパイプライン Eukfinder

微生物群集のホールゲノムショットガン(WGS)メタゲノムシークエンシングにより、多様な生態系に生息する微生物の原核生物や真核生物の機能、生理、進化の歴史を発見することができる。その重要性にもかかわらず、微生物真核生物のメタゲノム研究は、WGSデ…

ロングリードのハプロタイプを考慮したエラー訂正を行う HERRO

20240419 タイトル修正 2024/08/05 引用の間違い修正 2025/01/22 テストラン追記 注;論文のタイトルにはHEROと書かれてますが、レポジトリではHERROとなっています。ここではHERROで統一します。 追記 HEROとHERROを混同していました。コメントで教えていた…

ターゲット2倍体ゲノムアセンブラ JTK

ハプロタイプ間の遺伝的差異を解明するためには、Diploid assembly(二倍体アセンブリ)、すなわち相同染色体の配列を別々に決定することが不可欠である。一つのアプローチは、リファレンス配列上で一塩基変異(SNV)をコールし、phase化することである。し…

逆位の構造変異を持つノイジーなロングリードの高感度なマッピングツール invMap

PacBioやOxford Nanoporeシークエンサーで作られたロングリードは、ショートリードよりも構造変異(SV)のブレイクポイントに頻繁にまたがっている可能性がある。そのため、既存のロングリードのマッピング手法では、しばしば誤ったアラインメントやバリアン…

メタゲノムロングリードの分類学的分類と定量を行う Melon

2024/09/04 論文引用 ロングリードシーケンスは、複雑な微生物群集の特徴を明らかにする上で大きな可能性を秘めているが、ロングリード専用に設計された分類学的プロファイリングツールはまだ不足している。ここでは、ロングリードのユニークな特性を生かし…

IGVのtips 4

またIGVの簡単なTipsを紹介します。 1,ロングリードシークエンスのindelエラーの表示/非表示 ロングリードシークエンスの普及により、IGVにTGS向けのオプションが追加されています。 View => Preference => Third Genタブ TGS向けの長めのVisibility range…

ユーザーフレンドリーなナノポアロングリードの転写解析プラットフォーム NanopoReaTA

オックスフォード・ナノポア・テクノロジーズ(ONT)のシーケンスプラットフォームは、シーケンス中にリアルタイム解析を実行する優れた機会を提供する。この機能により、実験データに対する早期の洞察が可能になり、さらなる解析のための潜在的な意思決定プ…

ナノポアのロングリードからウイルスゲノムを検出する VirPipe

ナノポアシークエンシングによるウイルスゲノムの検出と解析は、病原体アウトブレイクのサーベイランスにおいて大きな可能性を示している。しかし、ナノポアシーケンスをサポートするウイルス検出パイプラインの数は非常に限られている。この論文では、Nanop…

ノイズパラメータを調整可能なナノポアシーケンスシグナルデータのシミュレーター squigulator

次世代シーケンサーデータのin silicoシミュレーションは、ゲノミクス分野で広く用いられている手法である。しかし、DNAまたはRNA分子を時系列電流シグナルデータの形で測定する「第3世代」ナノポアシーケンス装置からのシミュレーションデータを作成するた…

ロングリードシーケンスデータを評価する NanoPack2

ロングリードシーケンスプロジェクトにおけるコホートサイズの増加により、Oxford Nanopore TechnologiesとPacific Biosciencesのシーケンスデータの品質評価と処理のためのより効率的なソフトウェアが必要とされている。ここでは、実験の要約、データセット…

mOTUs3を使ってロングリードの分類学的プロファイリングを行う

krakenに代表されるメタゲノムの分類学的プロファイリングツールは、fastqのそれぞれのReadに対してダイレクトに分類学的分類を行う。そのために、kraken1ではJellyfishを使ってリファレンスゲノムからk-merが取り出され、ゲノムの分類学的情報と共にデータ…

ロングリードデータを用いたプラスチドゲノムのアセンブリを行う ptGAUL

プラスチドゲノム(プラストーム)の構造は、ほとんどの種子植物で高度に保存されているが、過去20年間の研究により、大幅な再配列を経験したいくつかの異種族系統が明らかになっている。ほとんどのプラストームには、大きなインバーテッドリピートと2つのシ…

ONTのメタゲノムシークエンシングデータからリファレンス品質の高品質MAGをアセンブルする NanoPhase

Genome-resolved metagenomicsの正確で包括的な解析は、多様な微生物群からリファレンス品質(完全で高品質な)のゲノムを再構築することに大きく依存している。Nanoporeロングリードにより、ドラフトゲノムのギャップ解消が進んでいるが、ゲノム品質の向上…

ONTリードを用いて2倍体HiFiアセンブリを検証する GAVISUNK

現在、多くの生物種や個体において、 de novo phased diploid genome assembliesが実現可能である。そのため、アセンブリの精度を検証し、オーソログシーケンスデータによるミスアセンブリを検出し、ダウンストリーム解析を確実に行うための手法が求められて…