バクテリアのインテグロンを同定する IntegronFinder2

2024/02/28 コマンド修正インテグロンは柔軟な遺伝子交換プラットフォームであり、アクセサリー遺伝子をコードする複数のカセットを含み、その順序は特定のインテグラーゼによってシャッフルされる。移動性遺伝要素に組み込まれたインテグロンには、しばし…

2024-02-19

微生物の機能をGO termの形で予測する DeepGOMeta

2024 Preprint docker GO term nextflow bacterial annotation bacteria

微生物サンプルの解析は、その多様性と複雑性のために、依然として計算上困難である。ロバストなde novoタンパク質機能予測法の欠如は、これらのサンプルから機能的洞察を導き出すことの難しさを悪化させている。相同性や配列の類似性に依存する従来の予測手…

2024-02-11

ノイズの多いロングリードからハプロタイプを考慮したde novo二倍体ゲノムアセンブリを行う PECAT

Preprint 2022 diploid docker Singularity 2024 Nature Communications

2024/04/19 論文引用高いシーケンスエラーは、2倍体ゲノムアセンブリへのロングノイズリードの適用を妨げてきた。既存のアセンブラーでは、長ノイズリードに含まれる高シーケンスエラーとヘテロ接合体を区別できず、ハプロタイプスイッチの多いアセンブリー…

2023-08-08

FASTAおよびFASTQファイルを大規模処理する BigSeqKit

2023 GigaScience 高速なツールインフォマティクス解析をサポートするツール docker fasta/fastqの操作

ハイスループットシーケンス技術により、利用可能なシーケンスデータの量はかつてないほど爆発的に増加しており、それらは通常FASTAファイルやFASTQファイルとして保存されている。配列データを生物学的知識に変換する目的で、この種のファイルを処理・操作…

2023-07-30

種のツリーにクエリを追加する DEPP

Systematic Biology 2023 genetic distance docker

新しい配列をリファレンス系統樹上に配置することは、環境サンプル、特にマイクロバイオームの解析にますます利用されるようになってきている。既存の配置手法は、クエリ配列がリファレンス系統上で直接特定のモデルの下で進化してきたと仮定している。例え…

2023-06-22

ゲノムとトランスクリプトームデータからスプライシングバリアントを見つける RegTools

2021 Preprint docker splicing variant variant calling on RNAseq variant Variant annotations in VCF format tumor

ゲノムの非コード領域における体細胞変異やエクソン変異は、解析ワークフローにおいて見過ごされがちな未同定の非コード化結果をもたらす可能性がある。ここでは、ゲノムデータから抽出した体細胞変異のコールと、トランスクリプトームデータから抽出したス…

2023-06-11

バクテリアの比較ゲノム解析を簡単に行う zDB

automated pipeline 2023 Preprint COG web tool 結果の視覚化 (visualization) orthologue Singularity docker phylogenetic tree viewer UniProt PFAM KEGG pathway

ゲノムの解析と比較は、アノテーション、オルソロジー予測、系統推論などのタスクのために、さまざまなツールに依存している。しかし、ほとんどのツールは単一のタスクに特化しており、結果を統合して可視化するためにはさらなる努力が必要である。このギャ…

2023-05-27

アノテーションパイプライン BRAKER3

docker Singularity 2023 eukaryotic genome annotation automated pipeline

2023/05/28, 5/30 誤字修正 2023/06/13 プレプリント引用 2024/02/19 ツイート追記タンパク質配列やRNA-Seqライブラリの形で大量の外部エビデンスを提供するデータベースの利用可能性が高まっており、タンパク質コード遺伝子の遺伝子構造予測手法を改善する…

2023-05-24

複数のアノテーション付きゲノムの視覚的探索をする Genome Context Viewer 2 (GCV)

2023 Nucleic Acids Research synteny_block docker dot plot

Genome Context Viewerは、ゲノム領域をそのミクロおよびマクロシンテニックな構造に基づいて特定、アライメント、可視化するためのウェブアプリケーションである。遺伝子アノテーションのような機能的要素を検索・比較の単位として使用することで、Genome C…

2023-05-19

遺伝子ファミリーの起源を推論する GenEra

2023 Genome Biology orphan gene taxonomically restricted genes (TRGs) Genomic phylostratigraphy docker 高速なツール

GenEra（https://github.com/josuebarrera/GenEra）は、DIAMONDを用いたgene-family founder inference framework（遺伝子ファミリーの起源となる遺伝子の推論フレームワーク）で、ゲノム系統分類における相同性検出の失敗など、これまで指摘されてきた限界…

2023-05-12

オルソログデータを探索・可視化する統合プラットフォーム OrthoVenn3

Nucleic Acids Research 2023 orthologue web tool GO enrichment analysis 系統解析 plant metazoa fungi bacteria vertebrate protists docker

比較ゲノム研究の進歩により、種の進化や遺伝的多様性を研究することに関心が高まっている。この研究を促進するために、OrthoVenn3は、ユーザーが効率的にオルソログクラスターの同定とアノテーションを行い、さまざまな種にわたる系統関係を推論できる強力…

2023-05-08

微生物ゲノム中の細胞機能をモデル化してアノテーションを行う MacSyFinder v2

2023 Preprint CRISPR docker bacterial annotation

複雑な細胞機能は、通常、微生物ゲノムの1つまたは数個の組織化された遺伝子座の遺伝子セットによってコードされている。Macromolecular System Finder (MacSyFinder) は、これらの特性を利用して、微生物ゲノム中の細胞機能をモデル化し、次にアノテーショ…

2023-04-02

系統マーカー遺伝子を自動で取り出して自動で系統推定を行う PHANTASM

生物種の推定 (taxonomic profiling) 系統解析 phylogenetic marker genes Nucleic Acids Research 2023 docker

16SリボソームRNA（rRNA）遺伝子の塩基配列は、数十年にわたり原核生物の分類学的位置づけを知るために用いられてきた。全ゲノム解析は、生物の進化的関係をより明確にすることができるが、このような解析には、微生物学者には珍しい計算能力が必要なことが…

2023-03-21

nf-coreのscRNAseq解析パイプライン nf-core/scrnaseq

scRNAseq nextflow nf-core Singularity docker

Nf-coreより nf-core/scrnaseqは、10x Genomics社のシングルセルRNA-seqデータを処理するためのバイオインフォマティクスのベストプラクティス解析パイプラインである。このパイプラインは、複数の計算インフラでタスクを実行するためのワークフローツールで…

2023-03-12

シークエンシングデータのクオリティコントロールを行う seqqc

nextflow contamination quality check docker

レポジトリより Arcadia-Science/seqqcは、シーケンシングデータの品質管理のための解析パイプラインである。このパイプラインは、ショートリードまたはロングリードのシーケンスデータ（FASTQフォーマット）に使用でき、アダプターの存在、高いシーケンス重…

2023-03-06

バクテリオファージ・サテライトを同定する SatelliteFinder

2023 Nucleic Acids Research Galaxy docker phage phage satellite

バクテリオファージとバクテリアの相互作用は、ファージサテライト（バクテリア間の移動にファージを利用する要素）によって影響を受ける。サテライトは、防御システム、抗生物質耐性遺伝子、病原性因子をコードすることができるが、その数や多様性は不明で…

2023-03-03

オルソログを探索する OrthoLoger

2023 Nucleic Acids Research orthologue docker

OrthoDBは、真核生物、原核生物、ウイルスの多様なサンプルの遺伝子の進化的・機能的アノテーションを提供する。Orthologyは、急速に拡大するゲノム配列の世界と、遺伝子の機能的知識を結びつける最も正確な方法である。OrthoDBは、最も多様な生物と最高品質…

2023-02-28

多様な節足動物ゲノムの迅速な機能アノテーションのためのワークフロー（interproscan）

insect Insects 2021 annotation GO term Pathway docker pathway mapping conserved domain protein domain

ゲノム技術によって遺伝子に関する情報はかつてないほど急速に蓄積されており、Earth BioGenome Project、i5k、Ag100Pest Initiativeなどのシーケンスイニシアティブによって、この取得速度がさらに加速されると予想される。しかし、ゲノム解読を人の健康や…

2023-02-14

ウイルスバリアント解析のための統合アプリケーション MALVIRUS

2021 BMC Bioinformatics Viruses variant SARS-CoV-2 web tool docker automated pipeline

COVID-19のパンデミックでも示されたように、日々増加する複数のウイルス株のシーケンスデータから効率的にバリアントをコールできることは、世界中に広がるウイルス株を追跡するために最も重要なことである。 SARS-CoV-2のようなウイルス集団の解析に必要な…

2022-12-13

ハイブリッドRNAシーケンスデータを使ってゲノムアノテーションを改善する annotate_my_genomes

2022 GigaScience docker eukaryotic genome annotation nextflow Iso-Seq

2022/12/27,28 追記ハイブリッドシーケンステクノロジーの進歩により、ハイブリッドシーケンス・トランスクリプトミクスを用いてしばしばアノテーションされるゲノムアセンブリがますます拡大し、ゲノムの特性解析が向上し、さまざまな生物における新規遺伝…

2022-11-21

スプライシングバリエーションを視覚化する sashimi.py

web tool docker 結果の視覚化 (visualization) sashimi plot differential alternative splicing (DAS) splicing variant RNA seq Hi-C

クロマチンの発現、タンパク質-DNA/RNA相互作用、アクセス性、構造などが条件や細胞種によってどのように異なるかを同時に可視化することにより、オルタナティブスプライシングの制御機構や機能的影響について理解を深めることができる。しかし、既存のSashi…

2022-10-15

PanGenome Graphを構築する PGGB

docker pan-genome pangenome variation graph Singularity

Githubより pggb は入力配列から pangenome variation graph を作成する。pangenome variation graph は一般的な多重配列アライメントの一種で、ある生物種または生物群におけるゲノム要素の完全な集合をモデル化したものです。パンゲノムは、配列グラフの一…