メタゲノムのビニングを行う MetaBAT2

2020 4/4 追記 2021 5/30 help更新微生物の分離と培養に基づく微生物群集の研究は、高スループットの全ゲノムショットガンシーケンスベースのメタゲノムに徐々に置き換えられている（Van Dijk et al、2014; Tringe＆Rubin、2005でレビュー）。計算メタゲノ…

2019-09-29

マッピングとバリアントコールを両方行う MapCaller

2019 Preprint VCF SNV small indel structural variations (SV) mapping 高速なツール

2023/09/20 バージョンされたコマンドに更新次世代シーケンシング（NGS）技術の進歩により、近い将来に精密医療のさまざまなアプリケーションをサポートできるようになってきている（Ku and Roukos、2013）。ますます多くの医学的および生物学的研究でNGS技…

2019-09-28

配列をクラスタリングする Sumaclust

sequence clustering

次世代シーケンシングの開発により、数百万のシーケンスを妥当な時間で処理するための効率的なツールが必要になる。Sumaclustは、LECAによって開発されたプログラムで、高速かつ正確な方法でシーケンスをクラスター化することを目的としている。このツール…

2019-09-27

BWTによる高速なゲノム間アラインメントを行う GSAlign

2019 Preprint ゲノム比較 (comparative genomics) genome alignment 高速なツール

パーソナルゲノミクスと比較ゲノミクスは、臨床診療とゲノム研究においてますます重要になっている2つの分野である。両方のフィールドは、配列の保存と構造の変化を発見するためにシーケンスアラインメントが必要である。ゲノム配列のアラインメントを処理す…

2019-09-26

Human Phenotype Ontology (HPO)データベース（Exomiserについて紹介）

2019 Nucleic Acids Research Human Phenotype Ontology (HPO) web tool Disease VCF human exome

鑑別診断 (differential diagnostics, wiki) およびトランスレーショナルリサーチの基盤となるのは、詳細な表現型の特定である: 詳細な個々の臨床異常のコンピューター分析である（ref.1,2）。 Human Phenotype Ontology（HPO, wiki）は、計算によるdeep phe…

2019-09-25

アセンブリ結果を評価する dnAQET

2019 BMC Genomics assembly evaluation tool 結果の視覚化 (visualization) ゲノム比較 (comparative genomics)

次世代シーケンス（NGS）テクノロジーの導入により、大量のゲノムシーケンスデータを生成できるようになった。これにより、個人のゲノムをシーケンシングしてde novoアセンブリすることが可能になった。約10年前、NGSテクノロジーにより、二倍体de novoゲノ…

2019-09-23

miRNAとそのターゲット遺伝子のデータベース miRTarBase

2018 Nucleic Acids Research microRNA web tool non-coding RNA disease

MicroRNA（miRNA）は、18〜25ヌクレオチドの小さな非コーディングRNAであり、動物と植物の両方で転写後レベルの中心的な調節因子である。 miRNAとそのターゲットmRNAの完全またはほぼ完全な相補的結合は、mRNAの分解を促進したり、mRNAの翻訳を抑制したりし…

2019-09-22

タンパク質相互作用を調べる BioGRID

2019 Nucleic Acids Research protein-protein interaction (PPI) web tool database CRISPR

大量の個々のタンパク質または遺伝的相互作用、およびRNA、DNA、膜、炭水化物、低分子代謝産物の相互作用から集約された生物学的相互作用ネットワークは、遺伝子と表現型の関係およびすべての細胞の機構的基盤を理解するためのフレームワークとして機能する…

2019-09-21

prokaryotic virusのcontigをクラスタリングしTaxonomic assignmentを行う vContact2

2017 PeerJ 2019 Nature Biotechnology metagenome virus virome taxonomic assignment 生物種の推定 (taxonomic profiling)

2019 9/25 誤字修正細菌と古細菌は、海洋と土壌の生態系での栄養とエネルギーのサイクルに役割を果たしており、人間の健康にも重要な役割を果たしている。細菌や古細菌に感染するウイルスは、殺害、代謝再プログラミング、または遺伝子導入によってこれらの…

2019-09-20

タンパク質のホモリピートを分析するwebサーバー dAPE

2017 Bioinformatics low complexity web tool

Low Complexity（LC）は、タンパク質中のタンデムリピートおよびcompositionally biased regions（CBR）のようなアミノ酸組成にほとんど多様性がない領域を説明するために使用される一般用語である。ホモリピート、またはpolyX領域は、単一のアミノ酸残基の…

2019-09-19

初めてコマンドを使う人向けの解説：その１、指定した領域から配列を抽出する

初心者向け motif bed request

2019 9/20追記ゲノムのダウンロードこの記事では、初めてコマンドで動作するツールを使う方向けにゲノムの指定した領域から配列を抽出する方法について説明します。コンピュータはmacを想定しています。普通はpython3やanacondaを入れ、condaのコマンドを…

2019-09-19

ONTのロングリードから抗生物質耐性遺伝子の分布を調べるwebサーバー NanoARG

2019 Microbiome (Journal) AMR web tool Nanopore long read 結果の視覚化 (visualization) 生物種の推定 (taxonomic profiling)

薬剤耐性（AMR）は、感染症を予防および治療する能力を損ない、世界的な公衆衛生の脅威になる[ref.1]。現在、抗生物質耐性による世界中の年間死亡者数は、2050年までに1,000万人を超えると推定されている[ref.2]。これに対応して、多くの国内および国際機関…

2019-09-18

pacbioのbamをfastqに変換する BAM2fastx

demultiplexing Pacbio format conversion format

PacificBiosciences/bam2fastx Converting and demultiplexing of PacBio BAM files into gzipped fasta and fastq files. by @PacificBiosciences - Repository | DevHub.io BAM format specification for PacBio（5.1.0） https://pacbiofileformats.readt…

2019-09-17

rRNAのアンプリコンシーケンスのトリミングを行う FIGARO

2019 Preprint docker filtering quality check amplicon sequence テスト失敗

マイクロバイオーム研究は、巨視的世界にとっての微生物コミュニティの重要性についての途方もない洞察を提供し続けている。ハイスループットDNAシーケンシング技術（すなわち、次世代シーケンス）は、微生物分類群を同定し、生物学的および環境試料の多様性…

2019-09-16

ロングリードRNA seqのアライナー Graphmap2

2019 Preprint RNA seq Nanopore long read Pacbio

オックスフォードナノポアテクノロジー（ONT）[ref.1]やパシフィックバイオサイエンス（PacBio）[ref.2]などの企業が達成したシーケンシングテクノロジーの進歩により、長さが10 kbpを超えるロングリードが生成される。当初、このようなロングリードのエラー…

2019-09-14

モデルベースでDNA-DNAハイブリダイゼーションを計算するwebツール GGDC

2013 BMC Bioinformatics digital DNA-DNA hybridization (dDDH) web tool bacteria archaea ゲノム比較 (comparative genomics) genetic distance GC

2020 7/28 追記、タイトル修正 DNA-DNAハイブリダイゼーション（DDH）は、古細菌および細菌種の描写のための分類学的ゴールドスタンダードとして現在も使用されているウェットラボ法である。 2つのそれぞれの生物のゲノムDNAがDDHの類似性が70％未満であるこ…

2019-09-13

リードやコンティグ配列のリード長ヒストグラム

tips fasta/fastqの操作

pyfaidxとRのhistを使えばワンライナーで出力できる。インストール #python (link)pip install pyfaidx 実行方法 FASTAファイルを指定する。 faidx --transform chromsizes input.fa | cut -f2 | Rscript -e 'data <- as.numeric (readLines ("stdin")); su…

2019-09-12

シングルセルとメタゲノムに対応したIDBA-UDアセンブラ

2012 Bioinformatics assembly Reference-assisted assembly RNA seq metagenome

2021 2/7 タイトル修正 2021 4/24,26 追記次世代シーケンシングにより、シングルセルシーケンシングまたはメタゲノムシーケンシングテクノロジーを使用して、微生物環境のシーケンシングができる。しかし、両方の技術には、ゲノムの異なる領域または異なる…

2019-09-11

Pacbioのロングリードのシミュレータ PaSS

2019 BMC Bioinformatics Pacbio simulator

PacBioやSMRT（1分子リアルタイム）シーケンスやナノポアシーケンスを含む第3世代のシーケンス技術は、これまでにないシーケンスリード長をゲノムを研究する研究者に提供し、ゲノミクス研究に革命をもたらしている[ref.1]。 Pacific BioSciencesが開発したSM…

2019-09-10

fungiのゲノムアセンブリ完全性評価ツール FGMP

2019 BMC Bioinformatics assembly evaluation tool phylogenetic marker genes fungi テスト失敗

ハイスループットシークエンシングおよび分析ツールの最近の爆発により、培養不可能な生物を含む生命のツリーを横切るほぼ全ての種のシークエンシングがより容易かつ安価になった。しかしながら、これらのゲノムの質と完全性は、リピート領域をアセンブリす…

2019-09-09

ユーザー指定の文献リストを使って文献を仕分ける分類器 BioReader

2019 BMC Bioinformatics web tool database 文献検索

現在、生物医学科学が直面している「ビッグデータ問題」は、分析能力を超えるゲノム配列、プロテオミクス、トランスクリプトームおよびメタゲノムプロファイルなどの大量のraw biological dataによるものである。生物医学文献でも同様の傾向が観察されている…

2019-09-08

tRNA配列を比較する tRNAviz

2019 Nucleic Acids Research tRNA web tool 結果の視覚化 (visualization) 系統解析

比較研究および豊富なシーケンシングに基づく分子アッセイに何千ものゲノムが利用可能な現在、tRNA遺伝子の全相補体がどのように展開され調節されるかについての我々の理解が進んでいる。トランスファーRNA（tRNA）はタンパク質翻訳の中心であり、さまざまな…

2019-09-07

Functional enrichment analysisとID変換を行う g:Profiler

functional enrichment analysis 2019 Nucleic Acids Research Gene ID Conversion web tool orthologue SNP protein domain GO enrichment analysis KEGG GMT format

2019 9/12 誤字修正、おかしな文章削除ハイスループット研究からの遺伝子リストの解釈には、最新のデータに基づいた有能で便利なツールが必要である。 Enrichr（ref.1）、WebGestalt（ref.2）、Metascape（ref.3）、KOBAS（ref.4）、AgriGO（ref.5）などのf…

2019-09-06

興味があるタンパク質情報を文献やデータベースからマイニングする PaperBLAST

2017 mSystems web tool text mining 結果の視覚化 (visualization) protein search BLAST 文献検索 UniProt

ゲノムシーケンスは、タンパク質の機能が決定される速度をはるかに超えて、新規タンパク質の発見を加速している（ref,1）。ゲノムシーケンスを解釈し、これらの予測されたタンパク質の役割のアノテーションを付けるには、新規タンパク質と特徴付けられたタン…

2019-09-05

viral quasispeciesのハプロタイプを再構成する PEHaplo

2018 Bioinformatics quasispecies Viruses assembly assembly graph haplotype reconstruction

高い突然変異率、自然選択および組換えは、RNAウイルス集団の高い遺伝的多様性につながる可能性がある（Domingo-Calap et al、2016）。これらはclosely relatedだが異なるウイルス株で構成されている。ウイルス集団のこれらのグループは、しばしばquasispeci…

2019-09-04

DAVIDデータベース

review 2009 Nucleic Acids Research database Gene ID Conversion RNA seq web tool GO enrichment analysis

2019 10/20 誤字修正 2019 10/26タイトル修正従来の生物学的研究アプローチでは、通常、一度に1つの遺伝子またはいくつかの遺伝子を研究する。対照的に、ハイスループットゲノム、プロテオミクス、およびバイオインフォマティクススキャニングアプローチ（…

2019-09-03

NCBI GEO のRNA-seqデータを分析する GREIN

2019 Nature Scientific Reports web tool docker GO enrichment analysis human genome GEO download 結果の視覚化 (visualization) normalize evaluation tool NCBI shiny

RNA-seqデータセットをGene Expression Omnibus（GEO）およびSequence Read Archive（SRA）のリポジトリに保存すると、公開されている研究の再現性が保証され、再利用が容易になる。これらのデータの再分析は、新しい科学的洞察をもたらす可能性があり、新し…

2019-09-02

MG-RAST（簡単な紹介）

生物種の推定 (taxonomic profiling) metagenome metatranscriptome 2016 Methods in Molecular Biology abundance estimation in metagenomics data geographic distribution

2022/06/26 追記分子生物学、とりわけ、微生物群集（メタゲノミクス分野）のハイスループットシーケンシングは、気候変動、環境汚染、人間の健康などに関わる微生物群集の組成と機能的内容の理解を急速に進歩させている。メタゲノミクスは、以前は実験室制…

2019-09-01

追加配列のアノテーションを含めるように既存のfastaとgff3を改変する reform

fasta/fastqの操作 GTF annotation tips

タイトルの通りのスクリプト。使い方は下のテストラン参照。インストール依存 reform requires Python3 and Biopython. 本体 Github pip install biopythongit clone https://github.com/gencorefacility/reform.git cd reform/ > python3 reform.py -h $ …

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2019-09-01から1ヶ月間の記事一覧