ヘテロ接合度の高い非モデル生物のアセンブリグラフをハプロタイプにアンジップする GraphUnzip

ロングリードやHi-Cは、難易度の高いゲノムに対して連続性の高いアセンブリを可能にし、ゲノムアセンブリの分野に革命をもたらした。現在では、あらゆる種類の生物でハプロイドの染色体レベルのアセンブリが一般的に達成されているため、アセンブリフェージ…

2024-09-11

パンゲノム解析のためのオブジェクト指向フレームワーク Pagoo

2021 Cell Reports Methods pan-genome 結果の視覚化 (visualization) STAR Protocols

2024/09/29 修正パンゲノム解析は、細菌集団で起こる分子進化を探るための基本的な手法である。ここでは、パンゲノムデータを簡単に扱うことができるRフレームワークPagooを紹介する。Pagooはカプセル化されているため、複雑な分子情報や表現型情報をオブジ…

2024-06-23

MEGA11

2021 Molecular Biology and Evolution multiple sequence alignment (MSA) phylogenetic tree Inference GUIツール分子系統樹 all versus all sequence comarison

2024/10/05 追記 MEGA（Molecular Evolutionary Genetics Analysis）ソフトウエアは、計算分子進化の手法とツールの大規模なコレクションを含むまでに成熟した。ここでは、MEGAを種、病原体、遺伝子ファミリーのタイムツリーを構築するための、より包括的な…

2024-03-31

クラスター化された原核生物ウイルスタンパク質ファミリー PHROG

NAR Genomics and Bioinformatics 2021 Viruses phage sequence clustering database HMM

ウイルスは豊富で多様性に富み、先祖伝来の生物学的実体である。その多様性は、遭遇する様々なタンパク質ファミリーの数においても、各タンパク質ファミリーの配列の不均一性においても高い。近年、ウイルスゲノムの塩基配列が解読されつつあり、このような…

2024-02-28

抗生物質耐性遺伝子、インテグロン、トランスポゾンを同定するアノテーションサーバー BacAnt

bacterial annotation 抗生物質耐性遺伝子 (ARGs) transposon integron Frontiers in Microbiology 2021 web tool

細菌の全ゲノムシークエンシング（WGS）は診断検査における日常的な手法となっている。WGSの臨床的に最も有用な利点の1つは、細菌配列中の抗菌薬耐性遺伝子（ARG）や移動性遺伝要素（MGE）を予測できることである。これにより、このような遺伝的特徴を包括的…

2024-02-28

細菌ゲノムに組み込まれたプロファージ領域を見つける PhageBoost

2021 NAR Genomics and Bioinformatics phage

2024/02/29 コマンド修正プロファージは細菌ゲノムに組み込まれたファージであり、細菌生物学の多くの側面を理解する鍵となる。プロファージは非常に多様であるため、配列の類似性を利用して検出することは困難である。本著者らは、新規プロファージの発見…

2024-01-26

大規模生体分子構造の3D可視化のためのウェブアプリケーション Mol* Viewer

2021 Nucleic Acids Research structure viewer

大規模な生体分子構造は、結晶学や電子顕微鏡などの確立された技術を用いて、日々実験的に決定されている。さらに、新たな統合的手法やハイブリッド手法（I/HM）により、時には数億個の水素原子以外の原子を含む巨大な高分子機械やアセンブリの構造モデルが…

2023-12-29

（ヒト）バリアントの優先順位付けのためのインタラクティブなウェブアプリケーション Gene.iobio

Nature Scientific Reports 2021 Human Phenotype Ontology (HPO) web tool variant ranking

多くの臨床現場で標準治療となることが予想される、包括的なゲノムデータの臨床治療への活用の増加に伴い、診断医学の実践は顕著な変化を遂げつつある。しかし、単一遺伝子またはパネルベースの遺伝子検査からエクソームおよびゲノムシーケンスへの移行は、…

2023-12-22

ヒトとマウスの転写因子結合部位予測ウェブツール TFBSPred

2021 promoter transcription factor binding site web tool

転写因子(TF)は遺伝子の発現調節に大きな役割を果たしている。各遺伝子の制御領域に結合するTFを発見することは、長年の研究の焦点であった。TF結合部位（TFBS）の実験的検証は複雑なプロセスであるため、予測を行うウェブツールが開発されてきた。しかし、…

2023-12-12

植物関連細菌の植物生長促進能を解析するための包括的なウェブリソース PLaBAse

2021 Preprint

植物に有益な微生物は、持続可能な植物生産や植物衛生上の実践において重要性を増している。しかし、植物成長促進（PGP）に関連する細菌形質を対象とした計算論的アプローチが不足しており、植物刺激性細菌株のin-silico同定、比較、選択を妨げている。この…

2023-09-06

HGVS命名法をチェックする Mutalyzer

2021 Bioinformatics human de novo mutation human gene nomenclature human genome

ヒトのDNAバリアントを記述のスタンダードとして、HGVS Nomenclature という記述のルール（命名則）が存在する。これはバリアントをどのように曖昧なく記述するべきかのガイドラインで、snpeffなどのアノテーションツールは、このスタンダードに従ってバリア…

2023-08-31

マルチプルアライメントと系統樹構築を行う Seaviewのバージョン5

Methods in Molecular Biology 2021 GUIツール tree DNA解析ソフト phylogenetic tree Inference

Seaviewバージョン５（*1）分子配列データからマルチプルアライメントと系統樹構築を行うマルチプラットフォーム・プログラム、Seaviewバージョン5を紹介する。Seaviewは、配列データベースへのネットワークアクセス、任意のアルゴリズムによるアラインメン…

2023-06-22

ゲノムとトランスクリプトームデータからスプライシングバリアントを見つける RegTools

2021 Preprint docker splicing variant variant calling on RNAseq variant Variant annotations in VCF format tumor

ゲノムの非コード領域における体細胞変異やエクソン変異は、解析ワークフローにおいて見過ごされがちな未同定の非コード化結果をもたらす可能性がある。ここでは、ゲノムデータから抽出した体細胞変異のコールと、トランスクリプトームデータから抽出したス…

2023-05-02

配列ファイルを堅牢かつ再現性よく操作するためのユーティリティ群 SeqFu

Bioengineering 2021 Nim fasta/fastqの操作 quality check

配列ファイル形式（FASTAおよびFASTQ）は、バイオインフォマティクス、分子生物学、生化学の分野でよく使用されている。次世代シーケンサー（NGS）の登場により、FASTQデータセットの作成・解析数は飛躍的に増加しており、これらのファイルを効率的に取り扱…

2023-04-27

（主にヒトRNA-seq）大規模RNA-seqデータセットからデータセットに関する情報を提供する Kmerator Suite

NAR Genomics and Bioinformatics 2021 RNAseqの定量 RNA seq evaluation tool 結果の視覚化 (visualization) contamination polyA

一般に公開されている膨大な数のRNA-sequencing (RNA-seq) ライブラリは、組織における既知または新規の転写産物の発現を定量化するための機能情報の宝庫である。しかし、転写産物の定量は、多くの計算資源と処理時間を必要とするアライメント手法に依存する…

2023-04-19

アセンブリグラフとペアエンドグラフを統合したマルチビューグラフベースのビニングアルゴリズム METAMVGL

BMC Bioinformatics 2021 Binning (metagenomics) ヒト腸内 (human gut)

微生物群集は複雑であるため、次世代シーケンサーデータを用いたde novoアセンブリでは、完全な微生物ゲノムを作成することができないのが一般的である。メタゲノム解析のビニングは、コンティグの塩基組成とリードデプスに基づき、断片化したコンティグをク…

2023-03-01

遺伝子の機能的アノテーションとエンリッチメント解析を行う KOBAS3.0

2021 Nucleic Acids Research KEGG pathway gene set enrichment analysis annotation

GSE（Gene Set Enrichment）解析は、ゲノムスケールの実験から生物学的な知見を引き出すために重要な役割を担っている。ORA (overrepresentation analysis)、FCS (functional class scoring)、PT (pathway topology) のアプローチは、GSE手法の3世代に渡って…

2023-02-28

多様な節足動物ゲノムの迅速な機能アノテーションのためのワークフロー（interproscan）

insect Insects 2021 annotation GO term Pathway docker pathway mapping conserved domain protein domain

ゲノム技術によって遺伝子に関する情報はかつてないほど急速に蓄積されており、Earth BioGenome Project、i5k、Ag100Pest Initiativeなどのシーケンスイニシアティブによって、この取得速度がさらに加速されると予想される。しかし、ゲノム解読を人の健康や…

2023-02-28

ネットワークベースのパスウェイアノテーションのためのウェブサーバー PathBIX

Bioinformatics Advances 2021 Pathway KEGG pathway annotation human genome

パスウェイアノテーションは、生命科学における実験データを解釈し、意味を与えるための重要なツールである。このタスクのために数多くのツールが存在するが、最新世代のパスウェイエンリッチメント解析ツールであるネットワークベース法は、単に遺伝子の内…

2023-02-21

ゲノムワイドなスプライシング効率を定量する SPLICE-q

human genome 2021 BMC Bioinformatics tumor splicing efficiency

一般にイントロンは一次転写産物から取り除かれ、成熟RNA分子を形成するために、スプライシングと呼ばれる転写後プロセスが行われる。一次転写産物の効率的なスプライシングは、遺伝子発現に不可欠なステップであり、その制御ミスは多くのヒト疾患に関連して…

2023-02-14

ウイルスバリアント解析のための統合アプリケーション MALVIRUS

2021 BMC Bioinformatics Viruses variant SARS-CoV-2 web tool docker automated pipeline

COVID-19のパンデミックでも示されたように、日々増加する複数のウイルス株のシーケンスデータから効率的にバリアントをコールできることは、世界中に広がるウイルス株を追跡するために最も重要なことである。 SARS-CoV-2のようなウイルス集団の解析に必要な…

2022-11-12

STRONG

Genome Biology 2021 Binning (metagenomics)

複数のメタゲノムサンプルからde novoで株を同定するSTrain Resolution ON assembly Graphs (STRONG)を紹介する。STRONGはメタゲノムアセンブリゲノム(MAG)に対してコアアセンブリとビニングを行い、バリアント簡略化の前にコアアセンブリグラフを保存する。…

2022-09-12

BUSCO遺伝子を使った系統解析のsnakemakeワークフロー

2021 Current Protocols in Bioinformatics tips phylogenetic marker genes essential Genes

2022/09/13 追記、誤字修正 2024/01/16 タイトル修正、わかりにくい説明を修正 Current Protocols in BioinformaticsにBUSCOの使い方に関する論文が出ています。（引用1）。その論文のパートの１つ；”Support Protocol 3: BUILDING PHYLOGENOMIC TREES”では…

2022-08-29

細菌の非リボソームペプチドの生合成遺伝子クラスターを発見する Nerpa

2021 secondary metabolites Metabolites gene cluster

微生物由来の天然物は、創薬のための生物活性化合物の主要な供給源である。その中でも、非リボソームペプチド（f）は、抗生物質、免疫抑制剤、抗がん剤を含む多様な天然物のクラスである。近年の天然物探索の進歩により、数千種類のNRPの化学構造が明らかに…

2022-08-17

シングルブレイクエンドバリアントと構造バリアントのフェージングにより体細胞構造変異の包括的な評価を行う GRIDSS2

2021 Genome Biology somatic mutation TCGA structural variations (SV) phasing human genome

GRIDSS2 は、片側のみが明確に決定できるブレイクポイントであるシングルブレイクエンドを明示的に報告する初めての構造的バリアントコーラーである。シングルブレイクエンドをブレイクポイントと同様に基本的なゲノムリアレンジメントシグナルとして扱うこ…

2022-07-30

グラフ畳み込みネットワークによりタンパク質の機能予測を行う DeepFRI

2021 Nature Communications deep neural network GO term annotation protein domain

2023/04/05 追記配列データベースに登録されるタンパク質数の急増とその機能の多様化により、自動的な機能予測のための計算機によるアプローチが課題となっている。本発表では、タンパク質言語モデルとタンパク質構造から抽出した配列特徴を利用して、タン…

2022-07-23

UCSF ChimeraX内でColabFoldを使う

Protein Science 2021 2018 2007 GUIツールタンパク質解析ソフト AlphaFold tips folding structure viewer

2021年の論文より UCSF ChimeraX は、UCSF Chimera に続く、Resource for Biocomputing, Visualization, and Informatics (RBVI) による次世代対話型可視化プログラムである。ChimeraXは、(a) パフォーマンスとグラフィックスの大幅な向上、(b) Chimeraで最…

2022-07-15

ノイズの多いロングリードを分類する deSAMBA

Frontiers in Cell and Developmental Biology 2021 Nanopore long read Pacbio clinical and diagnostic Viruses テスト失敗

ノイズの多いロングリードの分類を特定するための高速かつ正確な分類ツールが未だ存在せず、有望なロングリードメタゲノムシーケンス技術の利用におけるボトルネックとなっている。本発表では、de Bruijn graph-based Sparse Approximate Match Block Analyz…

2022-06-29

パンゲノム解析ツールキット PATO

2021 Bioinformatics pan-genome pan-proteome

2022/06/30 エラー発生時の対処例追記デスクトップパソコンを用いて数千のゲノムを同時に解析するために設計されたPangenome Analysis Toolkit (PATO)を発表する。このツールは、コアゲノムの定義やアクセサリーゲノムの特性といったパンゲノム解析の共通タ…

2022-06-19

遺伝子近傍の保存性を調べる FlaGs

2021 Bioinformatics テスト失敗

オペロンや遺伝子群の進化を理解し、機能的な関連を予測するためには、異なる進化段階における遺伝子近傍の保存性を解析することが重要である。このツールFlaGs（Flanking Genesの略）は、NCBIのタンパク質アクセッションのリストを入力とし、近傍にコードさ…

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2021