複雑な構造変異を検出するためのロングリードベースの手法 FindCSV

構造変異は遺伝病や進化のメカニズムにおいて重要な役割を果たしている。過去10年間、単純な構造変異を検出するために広範な研究が行われ、確立された検出方法が開発された。しかし、最近の研究では、単純な構造変異に比べて複雑な構造変異が個体に与える影…

2024-10-02

minimap2インデックスに既知バリアント情報を組み込むことで、WGSでのSNVコールを改善する minimap2_index_modifier

human genome variant index mapping 2024 BMC Bioinformatics

リファレンスゲノム配列に対するリードのアライメントは、次世代シーケンサー（NGS）技術によって得られたヒト全ゲノムシーケンスデータの解析における重要なステップの1つである。遺伝的変異の臨床的解釈の結果やゲノムワイド関連研究GWASの結果など、その…

2024-05-16

原核生物のゲノム進化のシミュレータ CoreSimul

recombination BMC Bioinformatics 2020 simulator

原核生物は無性の生物であるが、これらの生物は有性生物の減数分裂による組換えとは異なり相同組換えを頻繁に行う。ゲノム進化をシミュレートするために開発されたほとんどのツールは、有性生殖を想定しているか、あるいは集団にDNAフラックスが全くないこと…

2024-04-26

微生物の増殖曲線をインタラクティブに解析するウェブアプリケーション Dashing Growth Curves

2024 BMC Bioinformatics growth rate web tool

微生物の成長を記録し分析することは、ライフサイエンスにおける日常的な作業である。数十から数百の増殖曲線を同時に記録するマイクロプレートリーダーは、この作業にますます使用されるようになり、その迅速で信頼性の高い分析に対する需要が高まっている…

2024-02-25

de novo transcriptomeのアイソフォームアセンブラ ClusTrAsT

2024 BMC Bioinformatics de novo transcriptome isoform Alternative splicing Pacbio

2024/02/27 追記信頼できるリファレンスゲノムを持たない生物種のRNAシーケンスデータからのトランスクリプトームアセンブリはde novoで行う必要があるが、de novo methodでは転写産物のアイソフォームを再構築する能力が不十分であることが多いことが研究…

2023-09-07

ゲノムのGFF3アノテーションファイルを扱う AEGeAn Toolkit

2012 BMC Bioinformatics GFF annotation eukaryotic genome annotation 2022 NAR Genomics and Bioinformatics

マニュアルより AEGeAn Toolkitは、全ゲノム遺伝子構造アノテーションを管理・解析するツールを構築するための、いくつかの異なるが関連した取り組みとして始まった。AEGeAnはこれらの取り組みを一つのライブラリにまとめ、実行可能なプログラムだけでなく、…

2023-08-29

大規模な系統学的データセットを削減する Treemmer

2018 BMC Bioinformatics tree filtering Singularity

大規模な塩基配列データセットは、視覚化するのも扱うのも難しい。さらに、それらはしばしば自然の多様性のランダムなサブセットを表しているのではなく、調整されていない便宜的なサンプリングの結果である。その結果、冗長性やサンプリングバイアスに悩ま…

2023-07-20

MiniprotとAUGUSTUSによるゲノムアノテーションを行う GALBA

2023 Preprint Singularity protein-to-genome alignment annotation BMC Bioinformatics

2023/09/01 論文引用アース・バイオゲノムプロジェクトによって、利用可能な真核生物ゲノムの数は急速に増加しているが、公開されたゲノムのほとんどは、タンパク質をコードする遺伝子のアノテーションが不足している。さらに、いくつかのゲノムではトラン…

2023-05-11

相同な遺伝子クラスターを迅速に検索・可視化する webサーバー CAGECAT

BMC Bioinformatics 2023 gene cluster 結果の視覚化 (visualization) web tool synteny_block

特殊な機能をコードする遺伝子の共局在は、微生物ゲノムに共通し、より大きな真核生物のゲノムにも存在する。重要な例として、薬用、農業用、工業用として価値のある特殊な代謝物（例：antimicrobials）を生産する生合成遺伝子クラスター（BGC）がある。BGC…

2023-04-19

アセンブリグラフとペアエンドグラフを統合したマルチビューグラフベースのビニングアルゴリズム METAMVGL

BMC Bioinformatics 2021 Binning (metagenomics) ヒト腸内 (human gut)

微生物群集は複雑であるため、次世代シーケンサーデータを用いたde novoアセンブリでは、完全な微生物ゲノムを作成することができないのが一般的である。メタゲノム解析のビニングは、コンティグの塩基組成とリードデプスに基づき、断片化したコンティグをク…

2023-04-12

De novoトランスクリプトームアセンブリとアノテーションのSnakemakeパイプライン transXpress

2023 BMC Bioinformatics de novo transcriptome snakemake 高速なツールテスト失敗

RNA-seqとde novoトランスクリプトームアセンブリは、非モデル生物の生物学的研究に変革をもたらす技術であるが、RNA-seqデータの計算処理には、多くの異なるソフトウェアツールが必要である。このようなde novoトランスクリプトームワークフローの複雑さは…

2023-03-28

染色体外環状DNA（eccDNA）を検出するパイプライン ECCsplorer

2022 BMC Bioinformatics eccDNA テスト失敗

Extrachromosomal circular DNAs（eccDNA）は、染色体から物理的に分離したリング状のDNA構造で、100bpから数メガバイトの大きさである。eccDNAは、タンデムに繰り返されるDNAの他に、遺伝子のコピーや最近活性化したトランスポゾームエレメントを持つことが…

2023-02-21

ゲノムワイドなスプライシング効率を定量する SPLICE-q

human genome 2021 BMC Bioinformatics tumor splicing efficiency

一般にイントロンは一次転写産物から取り除かれ、成熟RNA分子を形成するために、スプライシングと呼ばれる転写後プロセスが行われる。一次転写産物の効率的なスプライシングは、遺伝子発現に不可欠なステップであり、その制御ミスは多くのヒト疾患に関連して…

2023-02-14

ウイルスバリアント解析のための統合アプリケーション MALVIRUS

2021 BMC Bioinformatics Viruses variant SARS-CoV-2 web tool docker automated pipeline

COVID-19のパンデミックでも示されたように、日々増加する複数のウイルス株のシーケンスデータから効率的にバリアントをコールできることは、世界中に広がるウイルス株を追跡するために最も重要なことである。 SARS-CoV-2のようなウイルス集団の解析に必要な…

2023-02-11

統計モデルを使った倍数性推定を行う nQuire

BMC Bioinformatics 2018 polyploid

酵母や真菌などの病原性真核生物や非病原性真核生物など、様々な生物種で種内変異が起こっている。次世代シーケンサー（NGS）を用いた実験から、DNA量を測定することなく、間接的に倍数体を推定することができる。著者らは、NGSを用いて2倍体、3倍体、4倍体…

2023-01-02

Ab initio遺伝子予測器 SNAP

BMC Bioinformatics 2004 ab initio gene prediction

計算機による遺伝子予測は、特に実験データの少ないゲノムに対して重要な問題であり続けている。様々なゲノムに容易に適応できるように設計されたSNAP遺伝子検出器を紹介する。また、SNAP遺伝子検出器のパラメータは、系統的に最も近いゲノムのパラメータと…

2023-01-01

イントロン位置の保存性とRNA-seqを活用したホモロジーに基づく遺伝子予測を行う GeMoMa

2019 Methods in Molecular Biology Evidence-driven gene prediction eukaryotic genome annotation 2018 BMC Bioinformatics Nucleic Acids Research 2016

明けましておめでとうございます。今年もよろしくお願いいたします。今年も忙しくなりそうなので、更新できるタイミングがあれば積極的に更新していきます。 GeMoMaは、進化的に関連するリファレンス種の遺伝子モデルを基に、対象種の遺伝子モデルを予測す…

2022-12-29

gff3出力をサポートを追加したexonerateのフォーク exonerate-gff3

protein-to-genome alignment 2005 BMC Bioinformatics

2023/01/05 追記 2023 01/13 パラメータの解釈間違いを修正 Exonerateはペアワイズ配列比較のためのツール。DNAとcDNA(EST)、DNAとタンパク質間のアライメントを行うことができる。アライメントモデルに基づき、ギャップありアライメント、ギャップなしアラ…

2022-09-27

Nanopolishのcall-methylationおよびeventalignモジュールを最適化して再実装した f5c

2020 BMC Bioinformatics SLOW5 format methylation analysis Nanopore long read GPU 高速なツール

ナノポアシーケンスにより、ポイントオブケア診断や現場でのジェノタイピングなど、携帯可能なリアルタイムシーケンスアプリケーションが可能になる。このような成果を得るためには、生のナノポアシグナルデータを解析するための効率的なバイオインフォマテ…

2022-07-13

ゲノム配列やシークエンシングデータを公開リポジトリから取得する getSequenceInfo

BMC Bioinformatics 2022 download ENA plasmid

2022/07/14 誤字修正生物学的配列は、世界中で急速に、そして指数関数的に増加している。塩基配列データベースは、様々な生物について有意義なゲノム情報を提供する重要な役割を担っている。getSequenceInfoは、GenBank、RefSeq、European Nucleotide Archi…

2022-05-30

ショートリードの遺伝子予測の高速化 FragGeneScanRs

2022 高速なツール BMC Bioinformatics coding region ab initio gene prediction gene prediction

FragGeneScanは現在、短くてエラーが起こりやすいリードの遺伝子予測に最も正確で人気のあるツールであるが、その実行速度は大規模データセットで使用するには不十分である。この問題を解決するはずの並列化も非効率的であった。その代替実装であるFragGeneS…

2022-05-24

腫瘍全ゲノムの体細胞変異エンリッチメント解析のための柔軟なツールセット MutEnricher

VCF somatic mutation variant enrichment analysis BMC Bioinformatics 2020 tumor

腫瘍の全エキソームから体細胞変異を解析することで、新規のガンドライバー遺伝子の発見が加速されている。しかし、ゲノムの約98%はノンコーディングであり、その中には変異によって正常な細胞機能が損なわれる可能性のある調節エレメントも含まれている。一…

2022-05-11

階層的ガイドゲノムアセンブラ HGGA

連鎖地図 assembly 2022 BMC Bioinformatics

De novoゲノムアセンブリでは、通常、完全なゲノムではなく、コンティグのセットが作成される。そのため、ゲノムの完全な構造を決定するためには、遺伝的連鎖地図、オプティカルマップ、Hi-Cデータなどの追加データが必要となる。従来の研究では、コンティグ…

2022-02-13

オミックスデータを探索するためのウェブベースアプリケーション ShinyOmics

2020 BMC Bioinformatics shiny 結果の視覚化 (visualization) 抗生物質耐性遺伝子 (ARGs) TnSeq / BarSeq RNA seq multi-omics heatmap PCA

オミックスプロファイリングは、生物の行動や環境中の反応を捉えるなど、大規模な生物学的データセットを得るための、ますます顕著なアプローチのcollectionである。このような大規模なデータセットを、プログラミングの経験なしに手作業で解析し、解釈する…

2022-01-30

RNA-seqの主成分分析のためのR/Bioconductorパッケージ pcaExplorer

2019 BMC Bioinformatics Bioconductor RNA seq PCA shiny 結果の視覚化 (visualization) GO enrichment analysis

2022/01/30 誤字修正主成分分析（PCA）は、RNAシーケンス（RNA-seq）遺伝子発現アッセイなどの高次元データにおける品質評価や探索的分析に、ゲノミクスアプリケーションで頻繁に使用されている。この目的のために開発された多くのソフトウェアパッケージが…

2022-01-26

非コード転写産物のマルチマッピングおよびマルチオーバーラッピングアラインメントのあいまいさに対処するRNA-seq定量ツール MGcount

2022 BMC Bioinformatics RNA seq RNAseqの定量 lncRNA non-coding RNA small RNA

2022 1/27追記トータルRNAシーケンス（total-RNA-seq）により、コーディングとノンコーディングの両方のトランスクリプトームを同時に研究することができる。しかし、計算パイプラインは従来、特定のバイオタイプに焦点を当て、total-RNA-seqデータセットが…

2022-01-05

複数の生物をサポートする機能的エンリッチメント解析ツール GeneSCF

2016 BMC Bioinformatics functional enrichment analysis cancer driver genes cancer gene set enrichment analysis 結果の視覚化 (visualization) RNA seq GO enrichment analysis KEGG KEGG pathway

ChIP-sequencing、RNA-sequencing、DNA sequencing、定量的メタボロミクスなどのハイスループット技術により、膨大な量のデータが生成される。研究者は、これらのハイスループット研究から影響を受けた遺伝子の生物学的意義を解釈するために、しばしばfuncti…

2022-01-04

動的に生成されるRスクリプトを用いてバルクRNA-seqの自動探索と可視化を行う Searchlight2

shiny 2021 BMC Bioinformatics 結果の視覚化 (visualization) 相関分析 automated pipeline heatmap PCA GMT format

2022 1/5 複数比較の例追記、コマンドの誤字修正バルクRNA-seqデータが処理されると、すなわちアラインメントされ、発現および差分表が作成されると、生物学的性質の探索、視覚化および解釈が行われる重要なプロセスが残る。可視化・解釈パイプラインを使用…

2021-12-31

ATAC-Seq、ChIP-Seq、WESなどのcDNA汚染の検出と除去を行う cDNA-detector

human exome 2021 BMC Bioinformatics ChIP-Seq ATAC-seq contamination

意図的または偶然に実験システムに導入された外因性cDNAは、そのシステムから得られた次世代シーケンサーライブラリーにおいて、その遺伝子に対するリードカバレッジの追加として現れることがある。適切に認識・管理されない場合、この外来シグナルによるク…

2021-12-12

シーケンスアラインメントやHMMER3のHMMプロファイルをlogoで視覚化する skylign

2014 BMC Bioinformatics HMM web tool multiple sequence alignment (MSA)

ロゴは、分子生物学において、配列の保存パターンをコンパクトなグラフで表現するためによく用いられる。ロゴは、配列アラインメントや隠れマルコフモデルに含まれる情報を、各位置に文字のスタックを描くことで表現する。スタックの高さはその位置の保存度…

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

BMC Bioinformatics