macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2025

ゲノムアノテーションとゲノム多様性解析のためのオールインワンワークフロー EASYstrata

生命のツリー全体にわたって新たなリファレンスゲノムとトランスクリプトームがますます利用可能になり、刺激的な疑問に取り組む新たな道が開かれている。しかしながら、ゲノムのアノテーションと進化プロセスの推論には依然として課題があり、方法論の標準…

細菌ゲノムの新規アノテーションのための統合プラットフォーム BacExplorer

ハイスループットシーケンシング(HTS)は、微生物学者の日常的な分析に不可欠な要素となっている。数十のサンプルをシーケンシングするプロセスでは、手作業ではアノテーションを付与できない膨大な量のデータが生成される。この課題に対処するため、長年に…

完全に自動化された 16S・18Sメタアンプリコン解析パイプライン AmpWrap

次世代シーケンシング革命は、群集構成を探索するための効率的かつ費用対効果の高い方法としてメタバーコーディングの確立を推進した。原核生物の16S rRNA遺伝子などの分類マーカー遺伝子のアンプリコンシーケンシングは、ハイスループット分類プロファイリ…

軽量かつインタラクティブなアライメントの視覚化を行う Alignoth

Alignothは、DNAシーケンシングリードアライメントパイルアップの自己完結型でポータブルなHTMLレポートを生成する軽量コマンドラインアプリケーションである。PNG、SVG、PDFなどの静的フォーマットやJSONベースの埋め込み可能な形式へのエクスポートもサポ…

大規模データにおいて形質の進化的関連性を調べる SimPhyNI

ゲノム特徴と形質の間、またはゲノム形質のペア間の関連性を識別する従来の方法は、細菌ゲノムに適用すると困難をきたす。細菌におけるゲノムワイド連鎖が強い進化誘導関連性を生み出すという事実を説明するために、いくつかの微生物GWAS(mGWAS)法が開発さ…

マルチスケール適応型クラスタリングと評価によるメタゲノムロングリードの効率的なビニングを行う LorBin

ロングリードシーケンスはメタゲノミクスを変革し、メタゲノムアセンブルゲノム(MAG)の品質を向上させた。しかし、現在のビニング手法では、未知の種の同定や不均衡な種分布の管理が課題となっている。本稿では、天然マイクロバイオーム中のMAGを再構築す…

シンテニープロット解析前のクオリティコントロールを行う SyntenyQC

SyntenyQCは、シンテニープロットを構築するためのデータ前処理ツールである。ゲノムデータの収集、アノテーション、デレプリケーションをサポートし、有益なシンテニープロットの構築を容易に(場合によっては根本的に)実現する。 SyntenyQCは、Pythonバー…

8つの生物種におけるオルソログ起源情報を提供する OrthoGuide

オーソロジーは、代謝経路や遺伝子制御ネットワークといった生物システムの進化研究において、貴重な代替指標であることが証明されている。同じオーソロググループに属する遺伝子は、通常、共通の祖先を反映して、同じ進化史を共有している。この特性を活用…

ゲノム近傍を解析するwebサービス GNAT

Gene Neighbourhood Analysis Tool(GNAT)は、タンパク質配列を与えられた微生物(細菌、古細菌、真菌)またはウイルスデータベース内の相同遺伝子を同定し、それらのゲノム近傍(GN)を類似性に基づいてアラインメントおよびクラスタリングし、一致したゲ…

細胞外多糖類生合成遺伝子クラスターを発見する epsSMASH

バイオフィルムは、自然環境および人工環境における細菌のデフォルトの生活様式を表し、細胞外多糖類(exoPS)はバイオフィルムマトリックスの重要な構造的および機能的構成要素として機能する。その重要性にもかかわらず、これらの環境でのexoPSの産生はほ…

ロングリードの事前フェーシングでSVジェノタイピングを改善する SVUPP

ここでは、リードのフェージング情報を遺伝子型尤度に組み込むことでSVの遺伝子型判定を改善する手法SVUPPを提案する。包括的なベンチマーク評価により、SVUPPは近傍にSVが存在しない場合のSV遺伝子型判定において、オックスフォード・ナノポア・テクノロジ…

シード遺伝子からオルソログを高速探索できる fDOG

植物材料の分解は地球規模の炭素循環の主要な推進力であり、従来は菌類や細菌に起因すると考えられてきた。しかし、一部の無脊椎動物も、水平遺伝子移動によって獲得された可能性のある、細菌や真菌のセルロース分解酵素のオルソログを保有している。この網…

RNA:DNA三重鎖の予測と解析のためのインタラクティブなプラットフォーム 3plex Web

Long non-coding RNAs(lncRNA)は、タンパク質やDNAを含む他の分子と協調することでその機能を発揮する。一本鎖RNA(ssRNA)と二本鎖DNA(dsDNA)の相互作用によって形成される三重鎖構造(トリプレックス)は、lncRNAが生体内で特定のゲノム配列を標的とす…

生態系特異性・機能的遺伝子の探索ができるMAGゲノムのグローバルリポジトリ gcMeta

2025/11/05 誤字修正 メタゲノムシーケンシングの急速な発展により、メタゲノムアセンブルゲノム(MAG)の前例のない膨大なデータが生成され、微生物の発見および機能的特徴づけの機会が一変した。しかしながら、これらの資源を完全に活用することは、データ…

マイクロバイオーム群集検出のためのウェブツール MiCoDe

Microbiome Community Detector (MiCoDe) は、ベイジアン加重確率的ブロックモデルを用いて微生物分類群のネットワークをコミュニティにクラスタリングする、無料の使いやすいウェブツールである。MiCoDeはデータを自動的にフィルタリングし、高次元性、構成…

SingleMによってプロファイリングした公開メタゲノムデータの地理的・生態学的情報を提供する Sandpiper

メタゲノムデータにおける微生物の分類群と相対的豊度の決定は、技術的に依然として困難である。本研究では、普遍的マーカー遺伝子内の保存領域を用いて群集構成を推定する「SingleM」を提案する。ゲノム情報が欠如した種を正確に組み込むことで、未知種がほ…

MSRスケッチングに基づくHiFiリードの高速かつハプロタイプ認識型(aware)のアセンブリを行う Alice

マッピングに適したシーケンス削減(MSR)スケッチを提案する。これは高忠実度(HiFi)ロングリード向けのスケッチ手法であり、これらのスケッチを直接操作するアセンブラ「Alice」を提供する。MSRはコンパクトな表現を生成し、(i) アライン可能な配列(2つ…

組成とカバレッジの分離によるグラフベースのメタゲノムビニングを行う CoCoBin

メタゲノムビニングはメタゲノム解析における重要なステップであり、同一ゲノム由来のコンティグを一貫性のあるグループにクラスタリングすることを目的とする。現代的なワークフローでは、ほとんどのビニングツールはショットガンメタゲノムシーケンスデー…

ヒトNGSデータにおけるコンタミネーションと血縁関係の検出、定量ツール NGSTroubleFinder

品質管理はNGSパイプラインの基本的なステップであるが、軽視されがちである。クロスサンプルコンタミネーションやサンプルスワップのような問題を検出することは、データの完全性を管理するために不可欠である。ここでは、ヒトの全ゲノムおよび全トランスク…

ペタバイト規模の公共配列リポジトリへの効率的かつ正確な検索を行う MetaGraph

公開リポジトリで利用可能な生物学的シーケンスデータの量は急速に増加しており、生物医学にとって重要な資源を形成している。しかし、これらのデータを効率的かつ正確に全文検索可能にすることは依然として課題である。本研究では、大規模なシーケンスセッ…

ゲノム間のアラインメントを高速に行う FastGA

FastGAは、同等の感度を持つ従来手法と比較して1桁以上高速に2つのゲノム配列間のアラインメントを発見する。その高速性は以下の要因による:(a) MSD基数ソートとマージのみを伴う完全キャッシュローカルアーキテクチャ、(b) ソート済みk-merテーブルの線形…

Helixerと比較して新規アノテーションのミスを探す AnnotationSplitter

非モデル生物におけるゲノム解析では、タンパク質コード遺伝子の正確なアノテーションが極めて重要である。しかし、限られたRNA-Seqデータと不完全なタンパク質リソースは、誤ったアノテーションを引き起こす可能性がある。例えば、隣接する2つ以上の遺伝子…

深層学習を用いて細菌分離株の高精度なSNVコールを行う AccuSNV

細菌種内の変異を正確に検出することは、微生物進化の基礎研究、伝播事象の再構築、抗菌薬耐性変異の同定において極めて重要である。全ゲノムシーケンスから一塩基多型(SNV)を特定する多くのツールが開発されているが、細菌ゲノムの複雑さや、サンプルタイ…

ロングリードベースの真核生物アセンブリを7つの指標で評価する PAQman

ロングリードシーケンシングとアセンブリアルゴリズムの進歩により、高品質なゲノムアセンブリの生成はより容易かつ費用対効果の高いものとなった。しかし、既存ツールはしばしば限られた指標に依存し、あるいは比較用のリファレンスアセンブリを必要とする…

McDevol

メタゲノム・ビニングのための最近の深層学習手法のいくつかは、高品質なメタゲノムアセンブリゲノムの回収率向上を主張している。これらの手法は、contig embeddings(コンティグの主要な特徴量を固定次元のベクトルに変換する操作を行ったもの)を学習しク…

包括的な高品質MAGのデータベース MAGdb

微生物群集のメタゲノム解析は、メタゲノムアセンブリゲノム(MAG)の再構築により、種間および種内の遺伝的多様性が非常に高いレベルで存在することを明らかにした。MAGデータベース(MAGdb)は、臨床、環境、動物のカテゴリーにまたがる74の代表的な研究論…

fastpのバッチ処理スクリプトを使う

2025/09/19 追記 fastpのversion 1.0がリリースされ、フォルダ内のfastqをバッチ処理する便利なスクリプトも提供されました。このスクリプトの使い方を確認しておきます。 インストール 最新のfastpにパスが通っている必要がある。fastpのバージョンが1未満…

ピークコール結果から遺伝子へのマッピングを行う peakScout

peakScoutは、ゲノムピークデータと遺伝子アノテーションの間のギャップを迅速かつ容易に埋めるために設計されたコマンドラインおよびウェブベースのバイオインフォマティクスツールであり、研究者が調節エレメントの測定値とその標的遺伝子との関係を理解す…

ゲノムアセンブリからウイルスゲノムを発見して正確なアノテーションをつける Cenote-Taker 3

ウイルスは地球上のあらゆる環境に豊富に存在し、あらゆる細胞生物を感染させる。にもかかわらず、ウイルスはゲノム科学者にとって一種のブラックボックスである。その遺伝的多様性は他の全ての生命体を合わせたものよりも大きく、そのゲノムはシーケンシン…

超高速なGFF操作ユーティティ GFFx

ゲノムアノテーションは、多様な調節要素や転写バリアントの発見により、ますます包括的になりつつある。しかし、このアノテーション精度の向上は、特に大規模ゲノムやパンゲノムを横断する効率的なクエリに対して重大な課題をもたらす。既存のツールは、大…