macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

Bioinformatics Advances

ゲノム間のアラインメントを高速に行う FastGA

FastGAは、同等の感度を持つ従来手法と比較して1桁以上高速に2つのゲノム配列間のアラインメントを発見する。その高速性は以下の要因による:(a) MSD基数ソートとマージのみを伴う完全キャッシュローカルアーキテクチャ、(b) ソート済みk-merテーブルの線形…

ナノポアリードからウイルスハプロタイプ再構築を行うnextflowパイプライン BonoboFlow

ウイルスゲノムのシークエンシングと解析は、ウイルスの多様性と進化を理解する上で極めて重要である。従来のサンガーシークエンシングはシークエンスデプスが低く、労力を要するという制約があった。イルミナなどの次世代シーケンシング(NGS)法はシークエ…

非モデル生物のエンリッチメント解析ツール getENRICH

遺伝子オントロジー(Gene Ontology)システムは、遺伝子を特定の生物学的プロセス、細胞構成要素、および分子機能に分類することで、遺伝子の機能的注釈付けを容易にする。DAVIDやEnrichrなど多くのツールが存在するものの、非モデル生物の解析は遺伝情報や…

ショートリードおよびロングリードシーケンスデータのアダプター残存など包括的な品質チェックを行う Sequali

2025/03/19 追記 シーケンスデータの品質管理は、多くのシーケンスワークフローの最初のステップである。ショートリードおよびロングリードシーケンス技術には、品質管理に関して多くの共通点がある。品質管理プログラムはいくつか存在するが、両方のテクノ…

高速なトランスクリプトームアノテーションパイプライン TransAnnot

2025/02/14 condaインストール追記(conda) 深くシークエンシングされ、de novoアセンブルされたトランスクリプトームのアノテーションは、最新のツールの中には動作が遅く、インストールが難しく、使いにくいものがあるため、依然として難題である。TransAnn…

AlphaFastPPi

2024/10/31追記、論文引用、11/02追記 プロテオーム全体にわたる新しいタンパク質間相互作用(PPI)を発見することは、新しいタンパク質の機能を理解し、生物内あるいは生物間のシステム特性を解明する上で大きな可能性をもたらす。近年の計算構造生物学、特…

ミトコンドリアゲノムの遺伝子アノテーションを行うWebプラットフォーム DeGeCI 1.1

DeGeCIは、de Bruijn graphとして表現されるアノテーションされたミトコンドリアミトコンドリアゲノムのリファレンスデータベースを用いて、ミトコンドリア塩基配列から完全自動のde novo遺伝子予測を生成するコマンドラインツールである。入力ゲノムはこの…

大規模なデータセットにもスケールする多目的k-merカウンターおよび多様性推定器 MerCat2

MerCat2("Mer-Catenate2")は、オミックスデータ中のフィーチャーをロバストに解析するための、汎用性、並列性、拡張性、モジュール性を備えたソフトウェアパッケージである。MerCat2は、あらゆるプラットフォームからのHTSシークエンシングの生リード、ア…

複数のプロファイルHMMを1つに統合する HMMerge

過去数十年の間に多重配列アライメントのための手法開発が進歩したにもかかわらず、配列の長さが大きく異なるデータセットのアライメントは、特に入力配列に非常に短い配列(シークエンシング技術、または進化の過程で大きく欠失した配列)が含まれる場合、…

ゲノムワイドなSNPデータとメタデータを同時に調べるためのウェブアプリケーション Evidente

病原体やその系統の解析では、一塩基多型(SNP)を用いてその進化史を再構築することが一般的である。しかし、ゲノムワイドなSNPベースの系統樹がさらなる情報なしに解析されることはほとんどない。SNPのデータだけでなく、サンプルのメタデータも含めて解析…

ネットワークベースのパスウェイアノテーションのためのウェブサーバー PathBIX

パスウェイアノテーションは、生命科学における実験データを解釈し、意味を与えるための重要なツールである。このタスクのために数多くのツールが存在するが、最新世代のパスウェイエンリッチメント解析ツールであるネットワークベース法は、単に遺伝子の内…