コア遺伝子の立体構造情報を使って正確な系統復元を行う Unicore

あるクレードのほとんどのメンバーに共通するシングルコピーのコア遺伝子の解析は、系統復元やゲノムの質の評価など、生物学における重要な課題にとって重要である。コア遺伝子は従来、プロテオーム間のアミノ酸類似性の解析によって同定されてきたが、構造…

2025-01-26

超高速でスケーラブルなゲノム検索を行う gsearch

2024 2023 Nucleic Acids Research ANI AAI 高速なツール

ゲノム検索や分類は、データベース（参照ゲノム）に最もマッチするゲノムを見つけることが一般的であるが、利用可能なデータベースゲノムの数が増加していることや、従来の手法が大規模なデータベースに対してうまくスケールしないという事実により、ますま…

2025-01-25

ディープラーニングと隠れマルコフモデルを組み合わせて真核生物の一次遺伝子モデルの予測を行う Helixer

Preprint eukaryotic genome annotation 2023 web tool docker Singularity

遺伝子構造アノテーションはゲノム配列から生物学的知識を得るための重要なステップであり、現在でもゲノミクスプロジェクトにおいてチャレンジングな課題である。現在のde novo隠れマルコフモデルは、生物学的複雑性をモデル化する能力に限界があり、一方、…

2025-01-23

Dorado ベースコーラ―

basecaller GPU Nanopore long read

2025/01/25 追記レポジトリより Doradoは、Oxford Nanoporeリード用の高性能で使いやすいオープンソースのベースコーラーである。特徴1つの実行ファイルで、適切なデフォルト設定、ハードウェアの自動検出および設定が可能。 Appleシリコン（M1/2ファミリ…

2025-01-23

POD5ツール

POD5 Nanopore long read format conversion

マニュアルより POD5は、ナノポアシーケンスデータを簡単にアクセスできる方法で保存するためのファイルフォーマットである。このフォーマットはApache Arrowを用いて格納され、標準的なツールを用いて多くの言語でデータを利用することができる。POD5には、…

2025-01-22

複数のゲノムから種を代表する代謝モデルを自動的に再構成する pan-Draft

2024 Genome Biology metabolic reconstruction automated pipeline transporter medium

未培養生物種のゲノムスケール代謝モデル（GEM）を正確に再構築することは、メタゲノムアセンブリゲノム（MAG）に典型的に見られる不完全で断片的な遺伝情報のために困難である。既存のツールは単一ゲノムの配列相同性を利用しているが、本研究ではpan-Draft…

2025-01-21

核酸配列の多重整列のための統合リアラインメントアプローチ ReAlign-N

2024 NAR Genomics and Bioinformatics multiple sequence alignment (MSA)

正確な多重配列アライメント（MSA）は、包括的な生物学的配列解析に不可欠である。しかしながら、進化関係が複雑であるため、一般的なアラインメントツールでは十分に対応できない変異がしばしば生じる。この問題を解決するためには、リアラインメントが極め…

2025-01-20

メタゲノムデータのLCA推定と分類学的プロファイリングを行う ngsLCA

2022 LCA metagenome Methods in Ecology and Evolution テスト失敗

環境サンプルから生成されたメタゲノム・データは、現代および古代の生物群集の解析においてますます一般的になってきている。この種のデータから分類学的プロフィールを得るためには、DNA配列を大規模なゲノム参照データベースに対してアラインメントし、各…

2025-01-19

広範な生物種のタンパク質アノテーションを評価するツール PSAURON

2025 NAR Genomics and Bioinformatics evaluation tool eukaryotic genome annotation large genome

ゲノムアノテーションにおけるタンパク質コード配列の正確性を評価することは困難な問題であり、広く適用できる解決策がない。この原稿では、タンパク質コード遺伝子アノテーションの品質評価を支援するために開発された新しいソフトウェアツール、PSAURON（…

2025-01-19

シングルコマンドで複数ラージゲノムのシンテニーパターンを可視化する ntSynt-viz

2025 Preprint synteny_block snakemake large genome docker 結果の視覚化 (visualization)

近年、染色体スケールのゲノムアセンブリが爆発的に増加しており、複数ゲノムのシンテニーを検出することによる比較ゲノム解析の可能性が大きく広がっている。既存のツールは複数のゲノム間のシンテニーブロックを検出することができるが、テキストベースの…

2025-01-18

RNAシーケンス解析のための統合プラットフォーム ExpressAnalyst

2023 Nature Communications RNA seq automated pipeline web tool microarray proteome volcano plot heatmap GSEA PCA GO enrichment analysis

非モデル生物種の研究へのRNAシーケンスの応用が進むにつれ、研究者が生物学的および機能的洞察を迅速に明らかにするための、使いやすく効率的なバイオインフォマティクスツールが求められている。我々は、あらゆる真核生物種のRNAシーケンスデータを処理、…

2025-01-18

GPUによる高速相同性検索に対応した MMseqs2

2024 高速なツール GPU protein search Preprint benchmark

急速に増加するタンパク質配列データベースの進化情報を検索するには、常に高速化が必要である。これは、配列のフィルタリングやギャップアラインメントを実行する革新的なアルゴリズムによって達成される。ここでは、8GPUで最大100TCUPSを達成するギャップ…

2025-01-16

ONT/PacBioのロングリードのメタゲノムアセンブリとbinningパイプライン mmlong2

2024 Preprint Binning (metagenomics) automated pipeline metagenome differential coverage rRNA Pacbio Nanopore long read MIMAGs/MISAGs

mmlong2はNanoporeまたはPacBio HiFiシーケンスデータから原核生物ゲノムを自動回収・解析するゲノム中心のロングリードメタゲノミクスワークフローである。mmlong2ワークフローはmmlongを継承している。mmlong2はロングリード専用のワークフローであり、Nan…

2025-01-15

Zetoroのレコードをダウンロードする zenodo_get

download インフォマティクス解析をサポートするツール tips

zenodo_getは、その名の通り、Zetoroのfrozen dataをダウンロードするコマンド。インストール #conda (link)mamba install conda-forge::zenodo_get -y#pippip3 install zenodo_get#from githubpip3 install git+https://github.com/dvolgyes/zenodo_get > …

2025-01-14

Hi-CデータとロングリードDe Bruijnグラフの統合による効率的なテロメア間ゲノムアセンブリを行う Verkko2

2024 Preprint T2T assembly snakemake Trio binning assembly human whole genome Hi-C Pore-C Reference-assisted assembly contigのscaffolding

2025/06/06 論文引用テロメア・ツー・テロメア・コンソーシアムは最近、ヒトゲノムの初の完全な配列を完成させた。最も複雑な繰り返しを解決するために、このプロジェクトは、長くて正確なPacBio HiFiとウルトラロングOxford Nanoporeシーケンスリードの半…

2025-01-14

FASTQ headersのバーコード情報によってdemultiplexingする fastq_demux

demultiplexing fasta/fastqの操作 barcode / index

fastq_demuxはFASTQヘッダーのバーコードに基づいてillumina fastqをデマルチプレックスするシンプルなプログラム。インストール condaで環境を作って導入した。 Github mamba create -n fastq_demux python=3 -yconda activate fastq_demux#本体git clone …