HMMER web server

シーケンスの類似性を検出するためのプロファイル隠れマルコフモデル（HMM）の使用は広く普及している。それらの人気は、いくつかの関連およびアラインされた配列を使用してプロファイルHMMを構築できるという事実に由来し、それを使用して大きなシーケンス…

2019-11-28

ロングリードのマッピングから逆位を検出する npInv

2018 BMC Bioinformatics structural variations (SV)

DNAのセグメントの向きが、染色体の残りの部分と比較してその先祖から反転している逆位多型（Inversion polymorphisms）は、ショウジョウバエの異なる系統のハイブリッドにおける染色体間の組換えの抑制因子として、スターテバントによって1917年に最初に発…

2019-11-16

publication品質の近傍遺伝子描画webサービス Gene Graphics

2018 Bioinformatics gene cluster 結果の視覚化 (visualization) web tool bacteria archaea Viruses virus

遺伝子近傍の検査は比較ゲノミクスの不可欠な部分だが、遺伝子クラスターのpublication品質のグラフィックスを作成するツールはない。 Gene Graphicsは、このようなビジュアルを作成するための簡単なWebアプリケーションである。サポートされている入力には…

2019-11-13

全ゲノムシーケンスしたバクテリア/アーキアのゲノム配列のblastサービス BLAST-XYPlot Viewer

BLAST G3: Genes, Genomes, Genetics 2018 web tool genome alignment

現在、数千の完全にシーケンシングされた細菌および古細菌のゲノムが公開リポジトリで利用可能であり、この数は急速に増加している。この情報は、徹底的な比較ゲノム研究の達成を可能にする。配列類似性を検索するために最も広く使用されているツールの1つは…

2019-11-09

ゲノム上でクラスターを形成する遺伝子群を探すwebサービス Cluster Locator

2018 Bioinformatics gene cluster 結果の視覚化 (visualization) mouse human genome yeast

遺伝子は真核生物のゲノムに沿ってランダムには配置されていないことが十分に確立されている（Feuerborn and Cook、2015; Hurst et al、2004）。これまでに研究されたすべての真核生物で、遺伝子の位置と遺伝子発現、遺伝子機能または量的形質の間の多様な相…

2019-11-02

GenBankやEMBL/ENA flat fileをNCBI submission用に変換する GB2sequin

2018 format conversion Genomics web tool annotation NCBI

2022/09/06 タイトル変更一般的なウェットラボのユーザーは、ベクターNTI Advance（Life Technologies、Invitrogen、Carlsbad、CA、USA）またはLasergene SeqBuilder（DNASTAR、Madison、WI、USA）などの市販のシーケンス可視化およびアノテーションソフト…

2019-10-30

リファレンスベースのアセンブリやアノテーション情報のliftoverを行う RGAAT

2018 Genomics, Proteomics & Bioinformatics liftOver annotation Reference-assisted assembly

シーケンシング技術の開発により、さまざまな種のゲノムを取得することが容易になっている。 NCBIゲノムデータベース（https://www.ncbi.nlm.nih.gov/genome/browse#!/）では、最大で4963の真核生物、125,679の原核生物、12,952のウイルス、10,916のプラスミ…

2019-10-20

冗長なデータベースに対して正確なmappingを行う KMA

2018 BMC Bioinformatics mapping metagenome Nanopore long read

バイオインフォマティクスで最も古く、おそらくおそらく最も重要なツールは、1つまたは複数の配列のアラインメントである。アラインメントは、ある配列が別の配列とどのように類似しているかを示し、類似の配列パターンの豊富さを定量するために使用できる。…

2019-10-16

初めてコマンドを使う人向けの解説：その２、ツールをインストールする環境の構築 (mac対象)

2018 Nature Methods 初心者向け education conda

2019 10/16 誤字とおかしな文章を修正 2019 10/17,10/18,10/20同上 2019 10/19 次回について追記 2020 4/9 macの写真を更新 2020 4/29動画リンク追記 2020 5/12 anaconda3.8 ダウンロードリンク追記 2020 7/26 仮想環境追記昨日ツイートしていた通り、次世…

2019-10-10

バクテリア/アーキアの高速なアノテーションパイプライン DFAST

CRISPR 2018 annotation 高速なツール web tool bacteria archaea COG

2019 11/17 補足説明追記 2019 12/28 インストールコマンド修正 2020 1/17 実行例追加 2020 10/19 help更新 (v.1.2.10) 2021 2/22 ツイート追記本著者らはパブリックシーケンスデータベースへのゲノム送信をサポートする原核生物ゲノムアノテーションパイプ…

2019-10-06

メタゲノムのmappingを行う MetaMaps

2018 mapping metagenome 生物種の推定 (taxonomic profiling) Pacbio Nanopore long read abundance estimation in metagenomics data 2019 Nature Communications

メタゲノム配列の分類は、高速で正確かつ情報豊富でなければならない。新しいロングシーケンステクノロジーは、これらの要素間のバランスを改善することを約束するが、ほとんどの既存の方法はショートリード用に設計されている。 MetaMapsは、ロングリリード…

2019-09-23

miRNAとそのターゲット遺伝子のデータベース miRTarBase

2018 Nucleic Acids Research microRNA web tool non-coding RNA disease

MicroRNA（miRNA）は、18〜25ヌクレオチドの小さな非コーディングRNAであり、動物と植物の両方で転写後レベルの中心的な調節因子である。 miRNAとそのターゲットmRNAの完全またはほぼ完全な相補的結合は、mRNAの分解を促進したり、mRNAの翻訳を抑制したりし…

2019-09-05

viral quasispeciesのハプロタイプを再構成する PEHaplo

2018 Bioinformatics quasispecies Viruses assembly assembly graph haplotype reconstruction

高い突然変異率、自然選択および組換えは、RNAウイルス集団の高い遺伝的多様性につながる可能性がある（Domingo-Calap et al、2016）。これらはclosely relatedだが異なるウイルス株で構成されている。ウイルス集団のこれらのグループは、しばしばquasispeci…

2019-08-28

GOアノテーション間の関係と類似性を調べるwebサーバー NaviGO

2017 2018 BMC Bioinformatics Methods in Molecular Biology GO term web tool GO enrichment analysis UniProt

遺伝子の機能解明は、バイオインフォマティクスを含む現代の生物学における中心的な問題の1つである。体系的な機能的アノテーションのために、GOは遺伝子機能の語彙（以後、term）として広く使われている[ref.1]。 GO termは、term間の親の関係が表されてい…

2019-08-27

Functional annotationを行うwebサーバー PANNZER2

2018 Nucleic Acids Research web tool annotation GO term protein search UniProt

2021 10/7 論文引用正確なfunctional annotationを持つタンパク質は、生物学的研究に不可欠である。残念ながら、タンパク質配列の大部分は機能的に特徴付けられていない。つまり、実験的に検証されたアノテーションはない。ハイスループットシーケンスの進…

2019-08-16

Functional annotationを行うwebサーバー GO FEAT

Nature Scientific Reports 2018 automatic pipeline annotation bacterial annotation web tool 高速なツール GO term conserved domain protein search de novo transcriptome

2019 8/17 タイトル修正、tips追記ゲノムデータおよびトランスクリプトームデータに生物学的意味を与えることは、特にハイスループットテクノロジーによって生成される大量のデータと、この目的のために開発されたツール、Webサーバー、およびデータベース…

2019-07-27

ニューラルネットワークを使ってONTのロングリードの低クオリティ領域を除く MiniScrub

2018 Preprint GPU CNN deep neural network filtering trimming / preprocessing Nanopore long read

Pacific Biosciences [ref.1]やOxford Nanopore [ref.2]のような企業のシーケンシング技術がゲノムアセンブリ[ref.1]、[ref.10]、抗菌剤耐性遺伝子[ref.18]、個人用トランスクリプトームシーケンシング[ref.19]、およびドラフトゲノム[ref.20]の改善に寄与し…

2019-07-17

PGAPとPGAP-Xを組み込んだバクテリアのパンゲノム解析webサーバー PGAweb

2018 BMC Genomics multiple sequence alignment (MSA) ゲノム比較 (comparative genomics) pan-genome SNV orthologue web tool 結果の視覚化 (visualization) windowsツール Frontiers in Microbiology tree

2019 7/21追記 2019 10/2 コードエラー修正 2019 11/2 誤字修正 "PGAP-X: extension on pan-genome analysis pipeline"よりパンゲノムの概念は2005年に提案されて以来[ref.1、2]、過去10年間でバクテリアゲノムの進化と動態を調査するために急速に採用され…

2019-07-13

シングルの配列やメタゲノムのbinned.fastaのtaxonomic classificationを行う BASTA

taxonomy ID taxonomic assignment 生物種の推定 (taxonomic profiling) British Ecological Society 2018 metagenome Binning (metagenomics) LCA

2019 7/13 説明修正 2019 8/1 説明追記 2020 1/21 インストール手順修正 2020 2/4 データベースダウンロード手順修正 2020 4/17 コマンド修正 2020 4/19 binned fastaを使う手順追記 DNAシーケンシング、例えばアンプリコン、メタゲノムおよび全ゲノムシーケ…

2019-07-12

de novo transcriptome解析のクラスタリングとclosely rellatedな種の情報を用いたアノテーションを行う Grouper

2018 Bioinformatics annotation human genome large genome RNA seq RNAseqの定量 de novo transcriptome

シーケンシング技術の進歩により、モデル生物の範囲を超えてトランスクリプトームを効率的かつ正確に探索することが可能になった（Ekblom and Galindo、2011; Marioni et al、2008）。トランスクリプトームシークエンシングは、高品質のリファレンスゲノムを…

2019-06-25

複数のメタゲノムをその場で分析するための軽量で多機能なメタゲノム分析ツール SqueezeMeta（オフライン使用）

2018 Frontiers in Microbiology 生物種の推定 (taxonomic profiling) metagenome metatranscriptome Nanopore long read リアルタイム解析 off-line automatic pipeline assembly Binning (metagenomics) taxonomic assignment

2020 11/19 condaインストール追記シーケンシング技術の改良によりメタゲノムシーケンシングが一般化し、メタゲノムシーケンシングがマイクロバイオームの構造および機能性を分析するための標準的な手順となった。メタゲノム実験によって生成された膨大な数…

2019-06-21

バクテリア、アーキア、プラスミドの複製起点（ori）データベース DoriC

2018 plasmid bacteria Nucleic Acids Research oriC archaea web tool database tips

2019 6/21 誤字修正、コマンド修正 2023/10/19 URL修正すべての生物において、DNA複製は複製機構の構築段階で正確に制御されている（ref.1）。複製起点は特定のゲノム遺伝子座であり、そこでは二本鎖DNAがほどけて一本鎖DNA鋳型を形成して新しい鎖の合成を…

2019-06-17

（ヒト、マウス向け）GO term enrichment解析を行う GOnet

2018 BMC Bioinformatics web tool GO term human genome mouse

ゲノムワイド研究のアウトプットは、通常、共有の発現パターンを示す遺伝子（またはそれらのタンパク質産物）のリストである。例えば、これらは、疾患の有無にかかわらずドナー群において差次的に発現される遺伝子、または生物学的サンプルの特定の画分にお…

2019-06-09

ディープCNNによってONTのバーコーディングロングリードをdemultiplexingするdeepbinner

2018 PLOS Computational Biology GPU demultiplexing deep neural network リアルタイム解析 Nanopore long read barcode / index basecalling CNN

Multiplexing（バーコード）は、ハイスループットDNAシーケンス能力を複数のサンプルに分散させるために使用される一般的な方法である[ref.1]。各入力DNA試料について、独自のバーコードがシーケンシング用に調製されたDNA分子のライブラリーに組み込まれる…

2019-06-06

ショートリードとロングリードのhybrid-assemblyにより de novo transcriptomeアセンブリを行う IDP-denovo

2018 Bioinformatics RNA seq Hybrid-Seq de novo transcriptome isoform Nanopore long read Pacbio assembly docker

2020 5/3 docker imagesアップ新世代のシークエンシング技術がトランスクリプトームの探索において実質的な進歩をもたらすにつれて、スプライス検出および転写物再構成などの関連するバイオインフォマティクス方法が数多く開発され、様々な種で広く使用され…

2019-06-04

tumor heterogeneityを見積もるGenoClone

Briefings in Bioinformatics 2018 tumor SNV VCF SNP

腫瘍の進化は、連続的な体細胞変異とダーウィン的な自然淘汰によって引き起こされるクローン増殖の反復過程である[ref.1、2]。したがって腫瘍は、腫瘍内異質性と呼ばれる顕著な異なる細胞集団（「サブクローン」と呼ばれる）で構成されている。腫瘍サンプル…

2019-05-29

k-merカウントツール Squeakr

error correction 2018 Bioinformatics k-mer 高速なツール

Massively parallel high-throughput sequencing (HTS) 技術の登場により、シーケンシング能力は劇的に増加している。増加するHTSデータに対処するための新しい計算方法の多くは、k-mer（k塩基の文字列）をシーケンスの分析の最小単位として使用する。例えば…