バクテリアのインテグロンを同定する IntegronFinder2

2024/02/28 コマンド修正インテグロンは柔軟な遺伝子交換プラットフォームであり、アクセサリー遺伝子をコードする複数のカセットを含み、その順序は特定のインテグラーゼによってシャッフルされる。移動性遺伝要素に組み込まれたインテグロンには、しばし…

2023-01-06

cDNA配列をゲノムにアラインメントする GMAP

2016 Methods in Molecular Biology

2016年の論文より RNA-SeqやDNA-SeqのデータセットをゲノムにアライメントするためのプログラムGMAPとGSNAPは、生物学的手法の進歩に伴い、より長いリード、より大量のデータ、新しいタイプの生物学的アッセイを扱うために進化してきた。ゲノム表現では、SIM…

2023-01-01

イントロン位置の保存性とRNA-seqを活用したホモロジーに基づく遺伝子予測を行う GeMoMa

2019 Methods in Molecular Biology Evidence-driven gene prediction eukaryotic genome annotation 2018 BMC Bioinformatics Nucleic Acids Research 2016

明けましておめでとうございます。今年もよろしくお願いいたします。今年も忙しくなりそうなので、更新できるタイミングがあれば積極的に更新していきます。 GeMoMaは、進化的に関連するリファレンス種の遺伝子モデルを基に、対象種の遺伝子モデルを予測す…

2022-12-08

微生物パンゲノム解析のスコア付けを行う Scoary

pan-GWAS Genome Biology 2016 PAV (presence/absence variations) pan-genome

2024/04/09 追記ゲノムワイド関連研究（GWAS）は、ヒトの医学やゲノミクスにおいて不可欠なものとなっているが、細菌を対象とした研究はほとんど行われていない。本発表では、パンゲノムの構成要素について、観察された表現形質との関連を、集団の階層性を…

2022-09-04

塩基をハッシング（ハッシュ化）する ntHash

other hash 2016 Bioinformatics

ハッシングは、配列アラインメント、ゲノムおよびトランスクリプトームアセンブリ、 k -mer計数および誤り訂正を含む、多くのバイオインフォマティクスアプリケーションにおける索引付け、照会および迅速類似性検索に広く使用されている。したがって、ハッ…

2022-07-04

アラインメント操作と要約統計量の計算のための高速なツールキット AMAS

PeerJ 2016 multiple sequence alignment (MSA) 分子系統樹 nexus phylip raxml format conversion API

近年、系統学で用いられるデータ量は爆発的に増加しており、数百から数千の遺伝子座と多数の分類群から多くの系統が推定されている。このような最新の系統学研究では、遺伝子のサブセットや連結配列の多重解析に加え、各遺伝子座の個別解析が必要となること…

2022-06-08

（主にヒト）バリアントを視覚化する ProteinPaint

2016 結果の視覚化 (visualization) Nature Genetics cancer mouse Fly genome browser clinical and diagnostic Hi-C web tool

小児がんの遺伝子病変（sequence mutations や遺伝子融合など）とRNA発現を同時に可視化するウェブアプリケーション、ProteinPaintについて説明する。小児がんデータセットは、17サブタイプの小児がんから診断時または再発時に取得された27,188の検証済み体…

2022-03-14

seqkitに新しく追加されたコマンドを確認する其の２

tips primer 2016 PLoS ONE fasta/fastqの操作 bam/sam circular

2022/03/14追記これまで数回に分けてseqkitのコマンドを紹介して来ましたが（リンク）、バージョンアップが続いていて、ありがたいことに新しいコマンドも追加されています（谢谢您）。久しぶりに新機能を確認してみます。この記事を書いたすぐ後にv2.2が…

2022-01-25

ヒトおよびモデル生物のタンパク質相互作用データベース Integrated interactions database

protein-protein interaction (PPI) 2021 2020 2019 2016 Nucleic Acids Research Methods in Molecular Biology human genome web tool

バイオアッセイの改良により、新しいタンパク質間相互作用（PPI）の同定率が大幅に向上し、検出されたヒトPPIの数は、初期のヒト・インタラクトームの推定サイズを大幅に上回っている。これらの新しいPPIは、疾患メカニズムのより完全な見解を提供しているが…

2022-01-14

JBrowseゲノムブラウザのデスクトップアプリケーション JBrowse 2 desktop

human genome clinical and diagnostic circos structural variations (SV) variant windowsツール GUIツール 2016 web tool PAF format dot plot genome browser DNA解析ソフト Genome Biology

2022/05/21 ツイート追記 2023/04/18 論文引用 HPより JBrowseは、JavaScriptとHTML5で作られた高速でフル機能のゲノムブラウザです。Webサイトやアプリに簡単に組み込むことができますが、スタンドアロンのWebページとして提供することも可能です。 version…

2022-01-05

複数の生物をサポートする機能的エンリッチメント解析ツール GeneSCF

2016 BMC Bioinformatics functional enrichment analysis cancer driver genes cancer gene set enrichment analysis 結果の視覚化 (visualization) RNA seq GO enrichment analysis KEGG KEGG pathway

ChIP-sequencing、RNA-sequencing、DNA sequencing、定量的メタボロミクスなどのハイスループット技術により、膨大な量のデータが生成される。研究者は、これらのハイスループット研究から影響を受けた遺伝子の生物学的意義を解釈するために、しばしばfuncti…

2021-11-08

STITCHデータベース

2016 Nucleic Acids Research

2021 11/8 文章修正タンパク質と低分子の間の相互作用は、生体の生物学的プロセスに不可欠な要素である。これらの相互作用に関する情報は、多くのデータベース、テキスト、予測手法に分散しているため、利用可能な証拠を包括的に把握することは困難である。…

2021-10-24

miRNA解析の手法を集めたプラットフォーム Tools4miR

2016 Bioinformatics miRNA seq database

miRNAは、遺伝子の発現を抑制する短いノンコーディング分子であり、生物にとって重要な役割を果たしている。miRNA関連の研究のために、何十もの計算手法が開発されているが、それらはさまざまな面で大きく異なっている。比較が難しい手法が数多く存在するた…

2021-04-27

バクテリアの表現型をゲノムから予測する Traitar

2016 mSystems metagenome phenotype bacteria bacterial annotation heatmap 結果の視覚化 (visualization) SVM

2023/12/07 dockerのコマンド修正配列決定されたゲノムの数は飛躍的に増加しており、データの生成からゲノムの解釈に至るまでのボトルネックが大きく変化している。形質は、細菌を特徴づけたり区別したりするためによく用いられ、微生物群集組成の原動力と…

2021-03-27

Multiple Sequence Alignmentの結果を視覚化する Sequence Bundles

2014 BMC Proceedings 2016 Nucleic Acids Research multiple sequence alignment (MSA) 結果の視覚化 (visualization) web tool

本研究では、複数の配列アライメント（MSA）を表現するための新しいデータ可視化手法であるSequence Bundlesを紹介する。既存のバイオインフォマティクスのデータ可視化手法（Sequence Logoなど）の主な限界を特定し、解決するために、Sequence Bundlesを用…

2021-03-22

遺伝子融合イベントのアノテーションと視覚化を行う AGFusion

mouse polish human genome 2016 Preprint fusion gene

遺伝子融合(wiki)は、構造的染色体再編成の結果であり、関与する遺伝子にさまざまな機能的変化を引き起こす可能性がある。多くの場合、遺伝子融合によりキメラタンパク質が生成され、それによりタンパク質ドメインが組み合わされて新規機能が生成される。遺…

2021-03-13

染色体の遺伝子密度マップを描く DensityMap

2016 BMC Bioinformatics GFF chromosome map 結果の視覚化 (visualization) 連鎖地図 docker

2021 3/14 修正ゲノムデータを可視化するためのツールはいくつか存在する。GbrowseやJbrowseのようないくつかのツールは、小さなゲノム領域に対しては非常に効率的であるが、ゲノム全体には適していない。また、PhenogramやCViTのように、ゲノム全体の可視…

2021-01-30

ANIを計算する改善されたアルゴリズム orthoani

International Journal of Systematic and Evolutionary Microbiology 2016 ANI API BLAST reciprocal best hit

細菌・古細菌における種の分類は、主にゲノム全体の関連性に基づいて行われており、現代の微生物学の枠組みとなっている。現在、2つの系統間の類似度は、実験的に決定されたDNA-DNAハイブリダイゼーション（DDH）による類似度から、ゲノム配列に基づく類似度…

2021-01-19

多様なヒートマップを作図できるwebサービス Heatmapper

heatmap 2016 Nucleic Acids Research 結果の視覚化 (visualization) sequence clustering sequence comparison geographic distribution SARS-CoV-2

2021 1/19 誤字修正 Heatmapperは自由に利用できるWebサーバであり、ユーザーは使いやすいグラフィカルなインターフェースを使って、データをヒートマップの形でインタラクティブに視覚化することができる。既存の非商用のヒートマップパッケージは、グラフ…

2021-01-16

高速なハプロタイプバリアントコーラー LocHap

2016 Nucleic Acids Research haplotype haplotyping human genome 高速なツール

Somatic mosaicismとは、単一の生物学的サンプル中の体細胞の一部に体細胞変異が存在することである。その重要性は主に理論的に議論されてきたが、実験的な研究により体細胞モザイクと疾患診断との関連性が明らかになりつつある。本研究では、健康なドナーの…

2021-01-10

（主に微生物）代謝モデルのデータベース BiGG Models

2020 Nucleic Acids Research 2016 2010 BMC Bioinformatics web tool Pathway metabolism bacteria bacterial annotation human genome database

BMC Bioinformatics. 2010 Apr 29;11:213 COBRA（Constraint Based Reconstruction and Analysis）フレームワークに基づくゲノムスケールの代謝再構成は、生物の代謝能力を解析し、実験データを解釈するための貴重なツールである。このような再構成や解析手…

2020-10-06

リピートをマスクする RepeatMasker

2016 Nucleic Acids Research repetitive sequences mask small RNA Long Terminal Repeat retrotransposons (LTR-RTs)

2021 3/26 コマンド追加 2022/12更新 2023/01/08, 01/9 追記 RepeatMasker は、DNA 配列をスクリーニングして、散在したリピート配列や、複雑性の低い DNA 配列を検出するプログラムである。プログラムの出力は、クエリ配列に存在するリピートの詳細なアノテ…

2020-09-18

NCBI Genome のBrowse by Organism機能

NCBI tips download bacteria assembly 2016 Nucleic Acids Research

2020 10/25 追記ハイスループットシークエンシング技術の普及により、NCBIなどの塩基配列データベースに登録されるゲノム数は爆発的に増大している。BLAST検索をやり直したら少し前は無かったゲノム情報が出てきた、という話も度々耳にする。特にバクテリア…

2020-09-12

バクテリアゲノムの比較ゲノム解析を行うwebサービス EDGAR

BMC Bioinformatics Nucleic Acids Research 2009 2016 2019 pan-genome download database ANI AAI 結果の視覚化 (visualization) POCP

2022/03/28 URL 更新, POCP matrix追記 Bergey's Manual of Systematics of Archaea and Bacteriaより次世代シークエンシングアプローチの展開により、完全にシークエンシングされたゲノムの数は急速に増加している。その結果、単一ゲノムだけでなく、関連…

2020-08-01

De brujin アセンブラ BCALM 2

2016 Bioinformatics k-mer assembly graph assembly

シーケンシング実験あたりのデータ量が増加するにつれて、フラグメントアセンブリはますます計算量が増加している。De Bruijn graphは、フラグメントアセンブリアルゴリズムで広く使用されているデータ構造で、リードのセットからの情報を表現するために使用…

2020-07-02

インタラクティブなオンラインの系統樹ツール Interactive Tree Of Life (iTOL) v4

2007 2011 2016 2019 Bioinformatics Nucleic Acids Research web tool 分子系統樹初心者向け metadata multi-omics 系統解析結果の視覚化 (visualization) multiple sequence alignment (MSA) heatmap phylogenetic tree viewer

2020 7/2 誤字修正 2021 4/27 v5の論文リンク追加 2022 8/27追記 2024/04/21 v6論文追加系統樹は、生物学やその他の科学分野において重要なツールであり、様々なデータタイプのコンテキスト化としても機能している。このことは、このような系統樹を作成する…

2020-06-07

IQ-TREE をwebで使える W-IQ-TREE

2016 Nucleic Acids Research web tool 系統解析分子系統樹 phylogenetic tree Inference

IQ-TREEはTREE-PUZZLEの後継プログラムであり、大規模な系統樹データの最尤解析を行うための効率的で汎用性の高い系統樹ソフトウェアである。IQ-TREEは効率的にツリー空間を探索し、RAxMLやPhyMLよりも高い尤度を達成することが多い。IQ-TREEの他の重要な特…

2020-04-22

（ヒトゲノム）遺伝子の変異プロットを描く Lollipops

2016 PLoS ONE 結果の視覚化 (visualization) human genome human gene nomenclature SNV SNP

2020 4/22 重複した説明を削除簡潔な可視化は、大量の情報を最小限のスペースで迅速に解釈できるよう提示するために非常に重要である。精密医療における臨床応用は、解釈の時間依存性のため、重要な使用例となっているが、生命科学の分野では可視化の必要性…

2020-03-28

単一のメタゲノムアセンブリゲノム（MAGs）とシーケンシングデータからバクテリアの増殖率を推定する iRep

2016 Nature Biotechnology replication rates bacteria metagenome

培養に依存しない微生物群集の研究により、微生物群集の複雑さと代謝の可能性に対する理解が深まった。ただし、コミュニティへの個々のマイクロバイオームメンバーの貢献を理解するには、どの細菌が活発に複製しているかを判断することが重要になる。ドラフ…

2020-02-18

バクテリアゲノムの進化をシミュレートする SimBac

2016 Microbial Genomics bacteria evolution simulator

バクテリア全ゲノムシーケンシングは急速に普及しており、高解像度の遺伝情報を迅速かつ費用対効果の高い方法で提供することにより、multilocus sequence typing（MLST）に取って代わっている（Didelot et al、2012; Wilson、2012）。遺伝学的データを使用し…

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2016