BRAKER4

レポジトリより BRAKER4は、BRAKERパイプラインをSnakemakeで完全に書き直したものである。遺伝子予測のロジックは同じで、GeneMarkは外部エビデンスに基づいて学習し、AUGUSTUSはGeneMarkの予測結果に基づいて学習し、TSEBRAがこれらの結果を統合する。変更…

2026-01-28

SingularityコンテナのGUI環境を提供する Colony

windowsツール 2026 Bioinformatics Advances Singularity GUIツール mouse

バイオインフォマティクスパイプラインは、再現可能な解析を可能にするために、FAIR基準を満たす必要がある。FAIRは、再現可能な研究に必要な4つの主要要件、すなわち、検索可能性、アクセス可能性、相互運用性、再利用性を規定している。Singularityなどの…

2025-09-30

ロングリードベースの真核生物アセンブリを７つの指標で評価する PAQman

2025 docker Preprint evaluation tool telomere T2T assembly Singularity

ロングリードシーケンシングとアセンブリアルゴリズムの進歩により、高品質なゲノムアセンブリの生成はより容易かつ費用対効果の高いものとなった。しかし、既存ツールはしばしば限られた指標に依存し、あるいは比較用のリファレンスアセンブリを必要とする…

2025-08-16

ロングリードおよびショートリードの RNA-seqから遺伝子アイソフォームを定量する miniQuant

2025 Nature Biotechnology Singularity docker RNAseqの定量 isoform

RNAシーケンスは遺伝子アイソフォームの定量に広く応用されているが、複雑な遺伝子のアイソフォームを正確に定量するには、特にショートリードでは限界がある。ここでは、ショートリードでは正確な定量が困難な遺伝子を同定し、これらの領域の定量にロングリ…

2025-08-14

潜在的な病原体の検出を可能にするメタゲノムシーケンスデータ解析パイプライン TaxTriage

nextflow Singularity 2025 Preprint clinical and diagnostic

TaxTriageは、ショートリードとロングリードの非標的DNAおよびRNAシーケンスデータの両方に対応した、包括的な病原体同定ワークフローである。リードの分類、マッピング、およびデ・ノボアセンブリのアプローチを組み合わせることで、キュレーションされた病…

2025-05-04

複数の遺伝子アノテーション手法からの構造情報を統合し、対象の種のコンセンサスアノテーションを生成する OMAnnotator

phylogenetic tree viewer 2024 Preprint orthologue Singularity annotation eukaryotic genome annotation

シーケンス技術の進歩により、研究者は全ゲノムのシーケンスを迅速かつ安価に行えるようになった。しかし、ゲノムアセンブリの改善にもかかわらず、ゲノムアノテーション（タンパク質をコードする遺伝子の同定）は、特に真核生物ゲノムでは依然として困難で…

2025-05-03

ゲノム配列から高精度なab initioの遺伝子構造予測を行う Tiberius

2024 Bioinformatics 高速なツール eukaryotic genome annotation ab initio gene prediction Singularity

25年以上にわたり、学習ベースの真核生物遺伝子予測は、DNA配列を直接入力する隠れマルコフモデル（HMM）によって駆動されてきた。最近、HolstらはHelixerを用いて、深層学習とHMMポストプロセッサーを組み合わせることでab initio真核生物遺伝子予測の精度…

2025-03-29

全ゲノムアラインメントを操作するための超高速ツールキット Wgatools

docker Singularity PAF format multi-fasta alignment (MAF) format conversion chain format dot plot 結果の視覚化 (visualization) 2025 Bioinformatics SNV small indel structural variations (SV)

ロングリードシーケンス技術の急速な発展により、個体完全長ゲノムの時代が近づいている。本著者らは、様々な全ゲノムアラインメント（WGA）フォーマットをサポートし、アラインメントの変換、処理、評価、可視化のための実用的なツールを提供する、クロスプ…

2025-01-25

ディープラーニングと隠れマルコフモデルを組み合わせて真核生物の一次遺伝子モデルの予測を行う Helixer

Preprint eukaryotic genome annotation 2023 web tool docker Singularity

遺伝子構造アノテーションはゲノム配列から生物学的知識を得るための重要なステップであり、現在でもゲノミクスプロジェクトにおいてチャレンジングな課題である。現在のde novo隠れマルコフモデルは、生物学的複雑性をモデル化する能力に限界があり、一方、…

2024-06-13

高い特異性と感度で外来配列を除去する ContScout

docker Singularity 2024 Nature Communications contamination filtering Horizontal gene transfer (HGT)

ゲノムのコンタミネーションは、比較進化ゲノミクスからメタゲノミクスに至るまで、様々なダウンストリームアプリケーションに影響を及ぼす問題として、ますます認識されるようになってきている。ここでは、ContScoutを紹介する。ContScoutは、アノテーショ…

2024-06-02

タンパク質のドメインレベルのアノテーションを行う Domainator

2024 Preprint bacterial annotation HMM Singularity 結果の視覚化 (visualization) protein domain GenBank

2024/06/03 タイトル修正、誤字修正生物学的配列の大規模なデータベースが利用可能になったことで、遺伝子の多様性と機能を深く探求する機会がもたらされた。細菌防御系は、多様であるがアノテーションが困難な遺伝子の豊富な供給源であり、バイオテクノロ…

2024-02-16

ロングリードのハプロタイプを考慮したエラー訂正を行う HERRO

Genome Biology 2023 Singularity error correction Nanopore long read

20240419 タイトル修正 2024/08/05 引用の間違い修正 2025/01/22 テストラン追記注；論文のタイトルにはHEROと書かれてますが、レポジトリではHERROとなっています。ここではHERROで統一します。追記 HEROとHERROを混同していました。コメントで教えていた…

2024-02-11

ノイズの多いロングリードからハプロタイプを考慮したde novo二倍体ゲノムアセンブリを行う PECAT

Preprint 2022 diploid docker Singularity 2024 Nature Communications

2024/04/19 論文引用高いシーケンスエラーは、2倍体ゲノムアセンブリへのロングノイズリードの適用を妨げてきた。既存のアセンブラーでは、長ノイズリードに含まれる高シーケンスエラーとヘテロ接合体を区別できず、ハプロタイプスイッチの多いアセンブリー…

2023-08-29

大規模な系統学的データセットを削減する Treemmer

2018 BMC Bioinformatics tree filtering Singularity

大規模な塩基配列データセットは、視覚化するのも扱うのも難しい。さらに、それらはしばしば自然の多様性のランダムなサブセットを表しているのではなく、調整されていない便宜的なサンプリングの結果である。その結果、冗長性やサンプリングバイアスに悩ま…

2023-07-20

MiniprotとAUGUSTUSによるゲノムアノテーションを行う GALBA

2023 Preprint Singularity protein-to-genome alignment annotation BMC Bioinformatics

2023/09/01 論文引用アース・バイオゲノムプロジェクトによって、利用可能な真核生物ゲノムの数は急速に増加しているが、公開されたゲノムのほとんどは、タンパク質をコードする遺伝子のアノテーションが不足している。さらに、いくつかのゲノムではトラン…

2023-07-04

ライフサイエンスのための包括的なフォーマットコンバーター BioConvert

2023/07/04 追記バイオインフォマティクスは、長年にわたって開発されてきた数多くの標準やフォーマットで知られる分野である。このフォーマットの多さは時に補完的であり、しばしば冗長であるため、バイオインフォマティクスのデータ解析者に多くの課題を…

2023-06-11

バクテリアの比較ゲノム解析を簡単に行う zDB

automated pipeline 2023 Preprint COG web tool 結果の視覚化 (visualization) orthologue Singularity docker phylogenetic tree viewer UniProt PFAM KEGG pathway circos

ゲノムの解析と比較は、アノテーション、オルソロジー予測、系統推論などのタスクのために、さまざまなツールに依存している。しかし、ほとんどのツールは単一のタスクに特化しており、結果を統合して可視化するためにはさらなる努力が必要である。このギャ…

2023-05-27

アノテーションパイプライン BRAKER3

docker Singularity 2023 eukaryotic genome annotation automated pipeline 2024 Genome Research

2023/05/28, 5/30 誤字修正 2023/06/13 プレプリント引用 2024/02/19 ツイート追記 2026/02/19 レビュー論文追記タンパク質配列やRNA-Seqライブラリの形で大量の外部エビデンスを提供するデータベースの利用可能性が高まっており、タンパク質コード遺伝子の…

2023-04-24

ロングリードシーケンスデータを用いてトランスポーザブルエレメントのアレル頻度推定を行うTrEMOLO

2023 Genome Biology Singularity snakemake

Transposable Element MOnitoring with LOng-reads（TrEMOLO）は、アセンブリベースとマッピングベースのアプローチを組み合わせた新しいソフトウェアで、トランスポーザブルエレメント（TE）と呼ばれる遺伝要素を強固に検出することができる。TrEMOLOは、高…

2023-03-21

nf-coreのscRNAseq解析パイプライン nf-core/scrnaseq

scRNAseq nextflow nf-core Singularity docker

Nf-coreより nf-core/scrnaseqは、10x Genomics社のシングルセルRNA-seqデータを処理するためのバイオインフォマティクスのベストプラクティス解析パイプラインである。このパイプラインは、複数の計算インフラでタスクを実行するためのワークフローツールで…

2022-10-15

PanGenome Graphを構築する PGGB

docker pan-genome pangenome variation graph Singularity

Githubより pggb は入力配列から pangenome variation graph を作成する。pangenome variation graph は一般的な多重配列アライメントの一種で、ある生物種または生物群におけるゲノム要素の完全な集合をモデル化したものです。パンゲノムは、配列グラフの一…

2022-08-18

関心のあるあらゆる生物のWGSデータセットに対して、SV、SNP、IN/DEL、およびCNVのコールとアノテーションを実行する PerSVade

2022 Genome Biology structural variations (SV) docker Singularity Variant annotations in VCF format Copy Number Variation (CNV) SNV small indel

2022/08/22 オプション追記構造バリアント（SV）はゲノムの変異の根底にあるものだが、ショートリードからの検出が困難なため、見落とされることがよくある。ほとんどのアルゴリズムはヒトでテストされており、他の生物にどの程度適用できるかはまだ不明で…

2022-08-16

InParanoidをDIAMONDにより高速化した InParanoid-DIAMOND

2022 Bioinformatics Singularity docker orthologue 高速なツール

バイオインフォマティクスにおいて、祖先を共有する異なる生物種の遺伝子であるオルソログを予測することは重要な課題である。オルソログ予測ツールは、大量のデータを実行可能な時間内に解析するために、正確かつ高速に予測することが要求される。InParanoi…

2022-06-14

ショートリードメタゲノミクスデータから薬剤耐性を分類する AMR-meta

2022 GigaScience Singularity AMR mapping free metagenome

抗菌剤耐性（AMR）は世界的な健康問題である。微生物サンプルのハイスループットなメタゲノムシークエンシングにより、精選されたAMRデータベースとの比較によるAMR遺伝子のプロファイリングが可能になる。しかし、データベースの不完全性や、シークエンシン…

2022-06-06

バリアントを考慮したリファレンスアラインメントの高速リフトオーバーを行う levioSAM2

2022 2021 Preprint Bioinformatics SNV structural variations (SV) human whole genome liftOver 高速なツールインフォマティクス解析をサポートするツール docker Singularity bam/sam

テロメア単位の完全なゲノムアセンブリは、解析の向上や新しいバリアントの発見を期待できるが、多くの重要なゲノムリソースは古いリファレンスゲノムと関連したままである。そのため、リファレンスゲノム間のゲノムフイーチャーやリードアラインメントをト…

2022-05-09

ロングリードcDNAシーケンスも利用できる真核生物ゲノムの自動化されたアノテーションツール LoReAn

Singularity docker 2019 Plant Physiology eukaryotic genome annotation テスト失敗

1分子完全長相補DNA（cDNA）配列決定は、転写産物の構造やスプライス形態を明らかにすることで、ゲノムアノテーションを支援することができるが、現在のアノテーションパイプラインにはそのような情報が組み込まれていない。本研究では、ロングリードアノテ…

2022-04-23

メタゲノミクスデータ中のバクテリオファージの解析、アノテーション、分類のための自動化パイプラインMetaPhage

2022 Preprint phage docker automated pipeline nextflow OTU Singularity metagenome mSystems

2022/09/08 論文引用ここ数十年、微生物叢、特にヒトの腸内細菌叢の研究と特性評価に大きな関心が寄せられ、常在微生物が人体の正常な解剖学的発達と生理的機能に極めて重要な役割を果たすことが明らかにされている。異なる環境を特徴づける複雑な細菌の動…

2022-02-01

(SARS-CoV-2) シーケンシングリードの迅速なデコンタミネーションを行う ReadItAndKeep

docker Singularity SARS-CoV-2 Preprint 2022 contamination human genome clinical and diagnostic

臨床検体から得られたウイルス配列データには、人為的な汚染が含まれていることが多い。これらは、法的・倫理的な理由により、共有する前に除去する必要がある。ホストリードの除去を可能にし、低スペックのノートパソコンでSARS-CoV-2のシーケンスデータを…

2021-09-08

大規模な微生物の比較ゲノミクスのためのモジュラー式のツール PanACoTA

2021 Preprint docker 2020 NAR Genomics and Bioinformatics download Singularity pan-genome 2003

2021 9/8 修正 2021 9/9 誤字修正 2021 9/10 prokkaのバージョンによるエラー修正 (依存するライブラリの関係でpython3.7の環境に導入するように修正した), --prodigalのオプション消去 2021 10/15 docker imageのコマンド追記 2021 10/18 annotate追記 2021…

2021-06-30

ロングリードを用いてショートリードアセンブリのギャップをクローズする自動化されたパイプライン DENTIST

2021 Preprint Singularity gap closing Nanopore long read Pacbio

ロングシーケンスリードは、断片化されたショートリードベースのゲノムアセンブリのコンティグ性と完全性を高めるために、理想的には高い精度でアセンブリギャップを閉じることができる。これまでにもいくつかのギャップ解消法が開発されてきたが、これらの…

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

Singularity