パンゲノム解析を行うためのprokaryotesゲノム情報のデータベース proGenomes2

2019 10/27 twitter追記2 019 10/27 ブラウザについて追記大規模ゲノミクスは、微生物の理解を深めるために役立っている。微生物学は、数千のシーケンスされたゲノムを利用できるデータ集約型の分野に発展した（ref.1–3）。過去20年以上にわたり、シークエ…

2019-10-24

Metagenomic contigsの分析と可視化のための自動化されたパイプライン MetaErg

2019 Frontiers in Genetics metagenome automated pipeline annotation 結果の視覚化 (visualization) taxonomic assignment 生物種の推定 (taxonomic profiling) abundance estimation in metagenomics data pathway rRNA database GO term enzyme Binning (metagenomics) secondary metabolites metabolism

2019/10/24 MetaCycの結果追記 2021 1/27 誤字修正ゲノムアノテーションは、文字通り、アセンブリされたDNA分子の特徴の注釈である。そのような特徴は、そもそも、タンパク質をコードする遺伝子[「オープンリーディングフレーム」（ORF）]およびリボソーム…

2019-09-22

タンパク質相互作用を調べる BioGRID

2019 Nucleic Acids Research protein-protein interaction (PPI) web tool database CRISPR

大量の個々のタンパク質または遺伝的相互作用、およびRNA、DNA、膜、炭水化物、低分子代謝産物の相互作用から集約された生物学的相互作用ネットワークは、遺伝子と表現型の関係およびすべての細胞の機構的基盤を理解するためのフレームワークとして機能する…

2019-09-09

ユーザー指定の文献リストを使って文献を仕分ける分類器 BioReader

2019 BMC Bioinformatics web tool database 文献検索

現在、生物医学科学が直面している「ビッグデータ問題」は、分析能力を超えるゲノム配列、プロテオミクス、トランスクリプトームおよびメタゲノムプロファイルなどの大量のraw biological dataによるものである。生物医学文献でも同様の傾向が観察されている…

2019-09-04

DAVIDデータベース

review 2009 Nucleic Acids Research database Gene ID Conversion RNA seq web tool GO enrichment analysis

2019 10/20 誤字修正 2019 10/26タイトル修正従来の生物学的研究アプローチでは、通常、一度に1つの遺伝子またはいくつかの遺伝子を研究する。対照的に、ハイスループットゲノム、プロテオミクス、およびバイオインフォマティクススキャニングアプローチ（…

2019-08-31

UniProtKBデータベースを３つのレベルでクラスタリングした Uniclust データベース

2017 Nucleic Acids Research protein search annotation database multiple sequence alignment (MSA) UniProt

UniProt（ref.1）やGenBank（ref.2）などの公共データベースのタンパク質配列の数は、さまざまな大規模ゲノミクスプロジェクト（ref.3〜5）のために急速に増加している。急速な成長により、多くのアプリケーションが代表的なサブセットで動作するようになっ…

2019-08-30

STRINGデータベース

2019 Nucleic Acids Research web tool database protein-protein interaction (PPI) text mining

個々のタンパク質の構造的および機能的情報が蓄積されているが（ref.1–3）、それらの相互作用に関する知識は断片化されたままになっている。いくつかの相互作用は、たとえばlarge cellular machineries（ref.4〜6）の3次元再構築のコンテキストで非常によく…

2019-08-26

UniProt のUniRef データベース

database 2015 Bioinformatics BLAST web tool UniProt

UniRefデータベース (UniProt Reference Clusters) は、UniProtナレッジベースと選択されたUniParcレコード（UniParc link）からクラスター化されたシーケンスセットを提供し、複数の解像度（100％、90％、50％の同一性）でシーケンススペースを完全にカバー…

2019-08-24

Gene Ontologyデータベース AmiGO2

2009 Bioinformatics GO term web tool database

AmiGOのペーパーより Gene Ontologyプロジェクト[GO（http://www.geneontology.org）; Gene Ontology Consortium、2000]は、構造化された統制語彙、またはオントロジーを開発し、遺伝子およびその産物（遺伝子産物）の基本的な特性を種に依存しない方法で記…

2019-07-25

ヒトとマウスの様々なアライナー用indexやアノテーションをダウンロードできる Refgenie

2019 mitochondria Preprint repetitive sequences mouse human genome human exome human whole genome rRNA RNA seq download API RNA spike-in web tool database 2020 GigaScience docker Ensembl

2019 8/15 リンク追記 2020 1/30論文追記 2020 8/28 実行例を一部修正 2022/04/19 画像追加リファレンスゲノムの構築とキュレーションに多大な努力が注がれている (ref.1–5)。これらのリファレンスアセンブリは結果を比較するための共通の表現を提供し、そ…

2019-07-06

タイプ株を中心にバクテリアの表現型情報をまとめたデータベース BacDive

2019 Nucleic Acids Research bacteria database web tool archaea phenotype morphology taxonomic assignment 生物種の推定 (taxonomic profiling) Nomenclature

2020 10/16 タイトル変更、誤字修正 2021 10/7 画像一部更新原核生物は、研究開発との関連性が高い多種多様な表現型形質を発現する。バクテリアのメタデータのホットスポットとしてよく利用できるのは、最初の（一次）文献で報告された種の説明と、生物資源…

2019-06-23

メタバーコディングのデータベース配列キュレーションなどを行うツールキット MetaCurator

2019 Preprint phylogenetic marker genes metagenome DNA barcoding PCR primer multiple sequence alignment (MSA) database

配列ベースの生物学的コミュニティの特徴付けの過程において、配列の教師ありのtaxonomic classification は重要な目標である。多数の配列分類ソフトウェアプログラムは、配列類似性を測り、そして配列類似性と分類学的所属との間の関係をモデル化することに…

2019-06-21

バクテリア、アーキア、プラスミドの複製起点（ori）データベース DoriC

2018 plasmid bacteria Nucleic Acids Research oriC archaea web tool database tips

2019 6/21 誤字修正、コマンド修正 2023/10/19 URL修正すべての生物において、DNA複製は複製機構の構築段階で正確に制御されている（ref.1）。複製起点は特定のゲノム遺伝子座であり、そこでは二本鎖DNAがほどけて一本鎖DNA鋳型を形成して新しい鎖の合成を…

2019-06-02

ホモログ及びオルソログタンパク質を検索するwebデータベース orthoFind

2015 PLoS ONE orthologue database protein search conserved domain multiple sequence alignment (MSA) 分子系統樹 web tool fungi plant bacteria archaea

相同配列を見つけることは、機能転移によるタンパク質の機能的アノテーションを可能にし、これらの配列が共通の進化起源を有するために推論され、そして進化研究の支持としてしばしば使用される［ref.１−３］。ホモログ内では、オルソログは種分化事象から進…

2019-05-04

複数データベースを統合した包括的な薬剤耐性遺伝子データベース ARGminer

2018 Preprint Pathogen AMR database bacteria bacterial annotation web tool 抗生物質耐性遺伝子 (ARGs)

2019 5/4 タイトル修正薬剤耐性（AMR）は、世界保健機関（WHO）によって世界規模の主要な健康上の脅威として認識されている。 AMRは2050年までに指数関数的に増加し、実質的なヒトの罹患率と死亡率をかなり増やすと予測されている。したがって、モニタリン…

2019-05-01

SRAのRNA seqデータを素早く比較・分析する Digital expression explorer 2（手持ちのデータにも対応）

2019 GigaScience plant bacteria human genome fish animal insect database SRA RNA seq web tool インフォマティクス解析をサポートするツール高速なツール C. elegans D. melanogaster

2021 1/9 ツイート追記 10年前の最初の記述以来、RNAシーケンス（RNA-seq）はトランスクリプトームにおける強力な方法となり、非常に正確な遺伝子発現の定量を可能にした[ref.1]。シークエンシングのコストが下がるにつれて、RNA seqのデータは科学文献でよ…

2019-04-03

種の形質をコレクションするデータベース Traitpedia

2018 Bioinformatics fungi plant taxonomy ID database web tool taxonomic assignment living things phenotype UniProt

種はそれらの遺伝子型および表現型によって一義的に定義することができる。この遺伝子型および表現型は非常に密接に絡み合っており、追加の環境コンポーネントがこの関係の広い理解を複雑にしている。表現型、または形質は、生物の遺伝情報にある程度依存し…

2019-03-24

2005-2017年の各大学のバイオイオンフォマティクス系論文出版数と内容を視覚化した BIOLITMAP

2018 web tool database Bioinformatics 結果の視覚化 (visualization)

科学および技術のさまざまな分野の科学的貢献に価値を置くことがますます重要になっている。バイオインフォマティクスの急速な発展とその本質的な学際的性質のために、さまざまな応用分野や機関の貢献がどのように発展しているかを視覚化することは特に難し…

2019-02-18

表現型や遺伝子情報からどんな菌かを絞り込めるwebツール BaFF

2019 Bioinformatics bacteria bacterial annotation database clinical and diagnostic taxonomy ID web tool

現在のシナリオでは、生物学的データの大量生成は、特に原核生物のような多数の生物に関していくつかの実験的および計算技術の結果として、ますます一般的になっている。例えば、メタゲノミクス実験からは、所与の試料（例えば、腸、海水など）中でDNA断片か…

2019-01-30

バクテリアとアーキアのデータベース EzBioCloud

International Journal of Systematic and Evolutionary Microbiology 2017 amplicon sequence web tool 生物種の推定 (taxonomic profiling) 系統解析結果の視覚化 (visualization) ANI education ゲノム比較 (comparative genomics) bacteria archaea rRNA database

2019 7/5 関連ツール追記について追記現代のバクテリアと古細菌の分類学の目標の1つは種の客観的定義である。分類を決定するプロセスは、新しいテクノロジーの出現により、時とともに継続的に改善されてきた。 PCRとそれに続く16S rRNA遺伝子のシークエンシ…

2019-01-14

review article要約 16Sアンプリコンシーケンシングによる微生物コミュニティの定量

2018 Journal of Microbiological Methods amplicon sequence review PCR archaea bacteria rRNA wastewater database ヒト口腔 (human oral) ヒト腸内 (human gut) insect qPCR circular dPCR bias OTU polyploid

いくつかの例を挙げると、微生物群集は、地球規模の元素循環、排水処理プラントでの廃棄物除去、およびバイオガスプラントでのメタン生産を促進する、多くの自然および人工生態系における隠れたチャンピオンである。これらのシステムを理解しモデル化するた…

2019-01-09

冗長性がある配列データベースに対する正確なリードアライメントを行う KMA

2018 BMC Bioinformatics mapping Nanopore long read database

バイオインフォマティクスで最も古く、おそらく最も重要なツールは1つ以上の配列のアライメントである。アライメントは、ある配列が別の配列とどの程度類似しているかを知らせ、類似の配列パターンの存在量を定量化するために使用できる。見つかったパターン…

2019-01-07

k-merベースのスケーラブルなメタゲノムの全配列比較ツール Libra

2018 GigaScience metagenome 生物種の推定 (taxonomic profiling) k-mer web tool database virus taxonomic assignment automatic pipeline MInHash genetic distance CyVerse

ショットガンメタゲノミクスは、微生物群集の生物多様性と機能に対する強力な洞察を提供する。しかしながら、メタゲノム研究からの推論は、データセットのサイズと複雑さや既存のデータベースの可用性と完全性によって制限される。 de novo比較メタゲノミク…

2018-12-10

nrなどのNCBIデータベースをダウンロードする ncbi-blast-dbs

database download amplicon sequence protein search plasmid taxonomic assignment bacteria Viruses virus archaea NCBI

2018 12/10 タイトル訂正 2020 9/7追記2020 9/11 わかりにくい説明を修正、9/11 簡単な並列処理例追記、9/12.9/15 taxonkit コマンド修正, わかりにくい部分を修正、10/3 taxonkitのコマンドを修正、10/10 コマンド微修正、10/28 誤字修正 2022 1/6 例のパラ…

2018-10-31

de novo transcriptomeのアノテーションツール dammit

annotation database assembly RNA seq de novo transcriptome

2020 1/31 誤字修正 2020 2/1 コマンド修正 dammitは、単純なde novo transcriptome annotatorである。アノテーションのプロセスの個々の部分は全てすでに存在しているが、既存の解決策は過度に複雑であるか、または無駄な非フリーソフトウェアに依存してい…

2018-08-10

ターゲットキャプチャシーケンシングをシミュレートする capsim

gene panel human exome simulator human genome database

高スループットシークエンシング（HTS）は、費用対効果が高く時間効率の良いサンプルの完全な遺伝情報を得る能力を持ち、ゲノム研究に大きく革命をもたらした。多くの臨床応用において、作用可能な領域のパネルのみが調査対象である（Bellos et al、2014; Sa…

2018-08-05

50近いバクテリアの１万以上の機能未知遺伝子欠損の影響をまとめた Fitness Browser

bacteria database TnSeq / BarSeq protein search Nature 2018 シーケンス技術 phenotype web tool cyanobacteria

注意: タイトルには機能未知遺伝子だけ相手にしたように書いてますが、実験はゲノム全体の遺伝子をターゲットにランダムかつ網羅的に行われており、mutant phenotypeの影響を調べた遺伝子数自体は１万よりずっと多くなります。実験結果をまとめたFitness Br…

2018-07-31

バイオインフォマティクスデータの検索と分析サイト Datasets2Tools

web tool database bioinfomatics tools 結果の視覚化 (visualization)

ウェブの導入により、研究成果の伝統的な印刷出版物のソフトウェアベースの拡張が可能になった。a）研究論文をより簡単にコピー及び配布できるよりソフトウエアベースでpublishできる。 b）研究によって収集されたデータは、再利用および統合的で遡った（ret…

2018-07-27

解析内容などから適したインフォマティクスツールを探せる Bio-TDS

database web tool bioinfomatics tools

バイオインフォマティクスと計算生物学は、バイオサイエンスとバイオメディカル研究において重要な役割を果たす。研究者が実験プロジェクトを設計する際には、データから新しい知識発見に至る最も関連性の高いバイオインフォマティクスツールキットを見つけ…

2018-07-23

既知の二次代謝産物生合成遺伝子クラスターを検出する antiSMASH

gene cluster secondary metabolites bacteria ゲノム比較 (comparative genomics) plant fungi duplication database web tool 2017 Nucleic Acids Research

2019 6/17 インストール追記 2020 5/15 help追加 2020 7/9 ローカルでの実行例記載 2021 5/13 v6について追記二次代謝産物または特殊代謝産物とも呼ばれる天然の産物（Natural products）は、多くの薬の基礎であり、農業および栄養学の応用にとって重要な分…

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

database