macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2025-05-01から1ヶ月間の記事一覧

細菌ゲノムのロングリードコンセンサスアセンブリを行う Autocycler

2025/09/03論文追記 ロングリードシーケンスにより完全な細菌ゲノムアセンブリが可能になるが、個々のアセンブラは不完全であり、しばしば配列レベルや構造エラーが生じる。Trycyclerを用いたコンセンサスアセンブリは精度を向上させることができるが、自動…

ロングリードのメタゲノムアセンブラ myloasm

2025/09/09 プレプリント引用 ロングリードメタゲノムアセンブリは、マイクロバイオームからの完全なゲノム復元を約束する。しかし、メタゲノムの複雑性は課題をもたらす。本著者らは、PacBio HiFiおよびOxford Nanopore Technologies (ONT) R10.4ロングリー…

メタゲノムリードの正確な分類を行う Centrifuger

Centrifugerは、微生物ゲノムデータベースとシーケンスリードを比較する効率的な分類手法である。Centrifugerでは、Burrows-Wheeler変換されたゲノム配列は、ランブロック圧縮と呼ばれる新しいスキームを用いて可逆圧縮される。ランブロック圧縮は線形以下の…

効率的なエビデンスベースのゲノムアノテーションを行う EviAnn

長年にわたり、機械学習をベースとしたab initio遺伝子探索アプローチは真核生物のゲノムアノテーションパイプラインの中心的な構成要素であり続けており、現在もそうである。これらのアプローチへの依存は、タンパク質相同性とともに遺伝子アノテーションの…

類似した株のマッピング識別のため存在量を考慮したメタゲノムリードの再割り当てを行う Mora

メタゲノムシーケンスによって微生物コミュニティを解析する場合、基本的なタスクは、特定のシーケンスリードがどの参照ゲノムに由来するかを決定することである。これにより、微生物の組成に関する情報が得られ、遺伝的変異のマッピングベースの解析が可能…

webベースのタンパク質構造アライメントツール Web-based GTalign

2025/05/08 誤字修正 正確なタンパク質構造アライメントは、構造的・機能的関係を理解するために不可欠である。ここでは、GTalign-webを紹介する。GTalignは、空間インデックス駆動型のタンパク質構造アライメントツールである。GTalign-webは、DALIおよびFo…

BWA-MEM-SCALE

2025/05/08 追記 BWA-MEM-SCALEはBWA-MEM2およびBWA-Michをベースに、ゲノム配列アライメントの全ステップにおける性能向上を実現した。Exact Match Filter (EMF)、FM-index Accelerator (FMA)、様々な最適化技術が追加されている。BWA-MEM-SCALEは、利用可…

系統樹と配列からtime treeを構築したり祖先配列を推定する TreeTime

多くの生物は、環境の変動に対応して可逆的な休眠(シードバンク)を採用している。この生命戦略は、基本的な生態進化の力を変化させ、遺伝的多様性の明確なパターンをもたらす。休眠の2つのモデルが、合体タイムスケールに対する休眠の平均期間に基づいて提…

ディープニューラルネットワークによる高速・高精度・多用途な系統復元を行う Phyloformer

系統推論は、共通の祖先から派生した配列の進化を記述する樹を再構築することを目的としている。最新の最尤推論やベイズ推論は計算コストが高いため、現実的な進化モデルの下では使い勝手が悪い。尤度なし推論と幾何学的ディープラーニングの最近の進歩を利…

De novoゲノムアセンブリのためのディープラーニングフレームワーク GNNome

すべてのde novoゲノムアセンブラにおいて重要な段階は、再構成されたゲノム配列に対応するアセンブラグラフのパスを特定することである。既存のアルゴリズム手法では、主に繰り返し領域が複雑なグラフのもつれを引き起こし、断片的なアセンブリにつながるた…

ナノポアリードからの高品質メタゲノムアセンブリを行う nanoMDBG

第3世代のロングリードシーケンス技術は、メタゲノムアセンブリの質を著しく向上させることが示されている。PacBio HiFiで生成された高精度のリードを用いた結果は特に注目すべきもので、手作業なしで数百の環状化された完全なゲノムをメタゲノムアセンブリ…

複数のゲノムアセンブリにおけるBUSCO解析結果を比較し、アセンブリの完全性を一貫性のある方法で評価する BUSCOMP

レポジトリより BUSCOMPはBUSCOの非決定論的限界を克服するために設計されている。アセンブリから完全なBUSCOの冗長でない最大集合をコンパイルし、この集合を用いて同じゲノムの異なるアセンブリ間の完全性の "真の "比較を予測可能な挙動で提供する。各BUS…

各KEGGパスウェイモジュールの完全性を計算する kegg-pathways-completeness tool

2025/05/05 追記 2025/05/06 追記 レポジトリより このkegg-pathways-completenessというツールは、与えられたKEGGオルソログ(KO)の集合に対して、その有無に基づいて各KEGGパスウェイモジュールの完全性を計算する。このツールの現在のバージョンは、495のK…

複数の遺伝子アノテーション手法からの構造情報を統合し、対象の種のコンセンサスアノテーションを生成する OMAnnotator

シーケンス技術の進歩により、研究者は全ゲノムのシーケンスを迅速かつ安価に行えるようになった。しかし、ゲノムアセンブリの改善にもかかわらず、ゲノムアノテーション(タンパク質をコードする遺伝子の同定)は、特に真核生物ゲノムでは依然として困難で…

オルソロジーに基づく代替モデル生物の選択を支援する OMAMO

生物種を超えてパスウェイや遺伝子が保存されていることから、科学者はヒト以外のモデル生物を用いてヒトの生物学をより深く理解することができるようになった。しかし、マウス、ラット、ゼブラフィッシュのような伝統的なモデル系を使用することは、コスト…

パンゲングラフによって遺伝子含有量を探索する pangene

遺伝子内容は生物の生物学的性質を制御しており、種間および同一種内の個体間で変化する。細菌ゲノムにおける遺伝子内容の変化を特定するツールは開発されているが、ヒトパンゲノムのような大規模な真核生物ゲノムのコレクションには適用可能なものは存在し…

ゲノム配列から高精度なab initioの遺伝子構造予測を行う Tiberius

25年以上にわたり、学習ベースの真核生物遺伝子予測は、DNA配列を直接入力する隠れマルコフモデル(HMM)によって駆動されてきた。最近、HolstらはHelixerを用いて、深層学習とHMMポストプロセッサーを組み合わせることでab initio真核生物遺伝子予測の精度…

推定ウイルスコンティグの完全性と汚染を評価する ViralQC

ウイルスは地球上で最も豊富な生物学的存在であり、多様な生態系において重要な役割を果たしている。さまざまな環境におけるウイルスのカタログ化は、その特性や機能を理解するために不可欠である。メタゲノムシーケンシングは、宿主や環境サンプルからウイ…

非モデル生物のエンリッチメント解析ツール getENRICH

遺伝子オントロジー(Gene Ontology)システムは、遺伝子を特定の生物学的プロセス、細胞構成要素、および分子機能に分類することで、遺伝子の機能的注釈付けを容易にする。DAVIDやEnrichrなど多くのツールが存在するものの、非モデル生物の解析は遺伝情報や…

fastqファイルを迅速かつ効率的に取得する ngsfetch

ffqとaria2を使ってfastqファイルを取得するためのユーティリティ。大規模なデータセットを迅速かつ効率的にダウンロードできるよう設計されている。GEO、SRA、EMBL-EBIのENA、DDBJのDRAなどのデータのダウンロードに対応している。 特徴(レポジトリより) …

次世代の細菌ゲノムアノテーションシステム BASys2

BASys(Bacterial Annotation System)は2005年に初めてリリースされ、オンラインでの細菌ゲノム注釈とインタラクティブなゲノム表示をサポートする最初のウェブサーバーの一つだった。過去20年間で、ウェブ技術や注釈アルゴリズムは大きく進歩した。これら…

種の分岐年代に関するリソース TimeTree 5 (TToL5)

生命のタイムツリー・プロジェクトの成果である「TimeTree of Life」リソースの第5版(TToL5)を発表する。このプロジェクトは、公開されているモレキュラータイムツリーを統合し、進化に関する知識を誰でも簡単に利用できるようにすることを目的としている…

AAIを高速に推定する FastAAI

環境や臨床由来の微生物叢(マイクロバイオーム)を記述するうえで、全ゲノムの類縁性推定および分類学的同定は、重要なバイオインフォマティクスの課題である。種レベルの近縁な微生物やウイルスゲノムの類縁性を推定するためには、ゲノム全体の平均ヌクレ…

系統樹の可視化と操作のための柔軟でモジュール性のGUIソフト TreeViewer

系統樹は、分類群間あるいは遺伝子間の進化的関係を示す。樹形図は結果やデータを提示する際に非常に重要であり、明確で効果的なプロットを作成することで、研究者は多くの種類の進化パターンを説明することができる。しかし、系統樹を作成するのは時間のか…

BEAST 2とBEAST X(旧BEAST 1)

近年、ベイズ系統推論手法の精緻化が急ピッチで進められており、進化データの共同モデリングのほぼすべての側面において、新たな大きな進歩が見られる。ゲノム配列、サンプリング日、表現型データ、放射性炭素年代、発掘された化石、生物地理学的範囲情報な…