全工程が自動化された高速なRNA seq解析webサービス RaNA-Seq（60以上のモデル生物に対応）

2020 4/10 タイトル修正、説明と図追加 RaNA-Seqは、RNA-Seqデータを迅速に解析・可視化するためのクラウドプラットフォームである。FASTQファイルの定量、品質管理指標の計算、発現変動遺伝子の解析の実行、機能解析による結果の説明を可能にすることで、数…

2020-04-04

パンゲノムグラフから微生物の多様性を調べる PPanGGOLiN

2019 Preprint pan-genome bacteria assembly graph heatmap 結果の視覚化 (visualization) PAV (presence/absence variations) 高速なツール系統解析 Horizontal gene transfer (HGT) 2020 PLOS Computational Biology archaea

2020 4/10 引用追加、タイトル修正 2021 1/4 追記 2023/5/30追記 2024/02/26 追記機能研究、進化研究、疫学研究のために比較ゲノムを使用するには、与えられた種での発現の観点から遺伝子ファミリーを分類する方法が必要である。これらの方法は、通常、分割…

2020-03-17

計算リソースを効率的に使って多数のよく似たバクテリアゲノムを素早く分析する自動化されたパイプライン Bactopia

2020 3/17 パラメータ追記、コマンド修正、タイトル修正 2020 3/18 追記 2020 5/11 説明追加 2020 8/13 論文追記 2020 12/9 ツイート追加 2021 2/24アップデートされたコマンドに修正 2021 10/7 ツイート追加イルミナのテクノロジーを使用した細菌ゲノムの…

2020-03-16

スモールゲノムからラージゲノムまで対応した高速かつ精度の高いハイブリッドアセンブラ HASLR

2020 Preprint 高速なツール hybrid assembly human genome

オックスフォード・ナノポア・テクノロジーズやパシフィック・バイオサイエンスなどのプラットフォームからの第三世代シーケンシング技術は、より連続したアセンブリを構築し、ゲノムを完全に再構築する道を開いた。これらのテクノロジーで生成されより長い…

2020-03-15

ラップトップでも軽快に動作するゲノム比較ツール bindash

2019 Bioinformatics MInHash genetic distance 高速なツール

ゲノム（メタゲノムを含む）の数は加速的に増加している。近い将来、数百万のゲノム間のペアワイズ距離を推定する必要があるかもしれない。クラウドコンピューティングを使用しても、そのような推定を実行できるソフトウェアはほとんどない。マルチスレッ…

2020-03-07

（ヒトゲノム）ハイパフォーマンスなハイブリッドアセンブラ WENGAN

2019 Preprint human genome assembly 高速なツール BGI hybrid assembly 2020 Nature Biotechnology

2020 3/7 パラメータの表記ミス修正ロングリードシーケンシング技術の継続的な改善により、高品質のゲノムを約束する新しいde novoアセンブリ時代が始まっている。ただしロングリードのみを使用して、大規模で反復性の高いヒトゲノムの正確なゲノムアセンブ…

2020-01-29

高速なヒトゲノムのアセンブラ Peregrine

2019 human genome human whole genome Overlap-layout-consensus (OLC) Preprint 高速なツール assembly

初期のヒトゲノムプロジェクトと安価なDNAシークエンシング技術の技術の開発は、学術研究とゲノム情報を使用して人間の健康を改善する産業の両方を進歩させた。それは、遺伝子型と表現型の関連と多くの重要かつ臨床関連のアプリケーションのための貴重な情報…

2020-01-18

URMAP

2020 Preprint 高速なツール mapping PeerJ

2020 1/19 コマンドの誤り修正 2020 1/20 twitter追記 2020 6/25 論文追記、リンク切れ更新次世代シーケンシングにより、ヒト機能ゲノミクス（Morozova and Marra、2008）から微生物メタゲノミクス（Gilbert and Dupont、2011）までの分野で劇的な進歩が可…

2019-12-28

ラージゲノムにもスケールする高速且つ精度の高いドラフトゲノムポリッシャー hypo

2019 Preprint polish 高速なツール human genome

DNAシーケンサーによって生成されたフラグメント（リード）からゲノムを再構築するゲノムアセンブリと、種間または種内の遺伝的変異を調べるためのその解析は、ゲノミクスの中心である。 Pacific Biosciences（PacBio）やOxford Nanopore Technologies（ONT…

2019-12-27

Whisper 2

2019 Preprint mapping 高速なツール

第3世代のシーケンシングの開発にもかかわらず、高いスループットと低いエラーレートのショートリードプラットフォームは多くの生物学的分析に不可欠なままである。これらは、とりわけ、スモール（Kim et al、2018）および構造（Cameron et al。、2019）変…

2019-11-21

ラージデータにも対応したマルチプルシーケンスアラインメントツール Kalign 3

2019 Bioinformatics multiple sequence alignment (MSA) 高速なツール

マルチプルシーケンスアラインメント（MSA）は、生物学的シーケンス解析の重要なタスクのままである。 MSAプログラムは、Consistency-based のメソッドとprogressive なメソッドに分けることができる。後者は、ペアワイズシーケンス距離を推定し、ガイドツリ…

2019-10-10

バクテリア/アーキアの高速なアノテーションパイプライン DFAST

CRISPR 2018 annotation 高速なツール web tool bacteria archaea COG

2019 11/17 補足説明追記 2019 12/28 インストールコマンド修正 2020 1/17 実行例追加 2020 10/19 help更新 (v.1.2.10) 2021 2/22 ツイート追記本著者らはパブリックシーケンスデータベースへのゲノム送信をサポートする原核生物ゲノムアノテーションパイプ…

2019-09-29

マッピングとバリアントコールを両方行う MapCaller

2019 Preprint VCF SNV small indel structural variations (SV) mapping 高速なツール

2023/09/20 バージョンされたコマンドに更新次世代シーケンシング（NGS）技術の進歩により、近い将来に精密医療のさまざまなアプリケーションをサポートできるようになってきている（Ku and Roukos、2013）。ますます多くの医学的および生物学的研究でNGS技…

2019-09-27

BWTによる高速なゲノム間アラインメントを行う GSAlign

2019 Preprint ゲノム比較 (comparative genomics) genome alignment 高速なツール

パーソナルゲノミクスと比較ゲノミクスは、臨床診療とゲノム研究においてますます重要になっている2つの分野である。両方のフィールドは、配列の保存と構造の変化を発見するためにシーケンスアラインメントが必要である。ゲノム配列のアラインメントを処理す…

2019-08-29

Uniprotデータベースに対する高速なタンパク質ホモロジーサーチを行う SANSparallel

2015 Nucleic Acids Research protein search web tool 高速なツール UniProt

近年、シーケンスの数が著しく増加している。これにより、データベース検索（ref.1〜4）がますます長くなり、無料のコンピューティングサービスと事前に計算されたデータベースが閉鎖に追い込まれたりまたは依存するようにクラウドソーシング（ref.5〜7）に…

2019-08-16

Functional annotationを行うwebサーバー GO FEAT

Nature Scientific Reports 2018 automatic pipeline annotation bacterial annotation web tool 高速なツール GO term conserved domain protein search de novo transcriptome

2019 8/17 タイトル修正、tips追記ゲノムデータおよびトランスクリプトームデータに生物学的意味を与えることは、特にハイスループットテクノロジーによって生成される大量のデータと、この目的のために開発されたツール、Webサーバー、およびデータベース…

2019-08-10

ヒトゲノムを扱えるハイパフォーマンスなロングリードアセンブラ Shasta

2019 Preprint Nanopore long read 高速なツール human genome assembly large genome docker 2020 Pacbio Nature Biotechnology

2020 3/14 動画追加 2020 9/30 論文引用追加 2022/02/04 v0.9 2022/06/08 アップデートに伴いコマンド修正, help更新ロングリードシーケンシング技術からヒトゲノムアセンブリを作成する現在のワークフローは、大きなコホートへの効率的な拡大を妨げるコス…

2019-08-03

elPrep 4

2019 MInHash PLoS ONE bam/sam 高速なツール SNV PCR filtering human exome human genome mapping

2020, 2021 9/17 追記 elPrep 4はelPrep [ref.1]の大幅に拡張された再実装であり、DNAシーケンシングパイプラインでのバリアントコールのシーケンスアライメント/マップファイル（SAM / BAM）[ref.2]を準備するためのマルチスレッドツールである。パイプライ…

2019-07-03

アセンブリの前処理としてロングリードのキメラ領域（低オーバーラップ領域）を除く yacrd

2019 Preprint fasta/fastqの操作 filtering Nanopore long read Pacbio trimming / preprocessing 高速なツール 2020 Bioinformatics

2019 コマンドの誤り修正 2020 3/30 バージョンによるコマンドの違いを記載 2020 3/31 version0.6.0のコマンドを一番下に追記 2020 4/23 論文追記第三世代DNAシーケンシング法（PacBio、オックスフォードナノポア）は、リファレンスゲノムの構築（デノボア…

2019-07-02

メタゲノムデータセットをタンパク質レベルでアセンブリし、ホモログサーチを行う GRASP2

2019 BMC Bioinformatics 高速なツール protein search assembly assembly graph

メタゲノミクスは、特定の微生物群集のゲノム含有量を研究するための培養に依存しないアプローチである。典型的なメタゲノミクス研究では、環境サンプルから微生物のDNAが抽出され、次世代シークエンシング（NGS）技術を使用してシークエンシングされる。中…

2019-06-28

MMseqs2 コマンド其の2 タンパク質配列のクラスタリング

2017 Nature Biotechnology 高速なツール sequence clustering

インストール以前の記事を参照 > mmseqs $ mmseqs MMseqs2 (Many against Many sequence searching) is an open-source software suite for very fast, parallelized protein sequence searches and clustering of huge protein sequence data sets. Please…

2019-06-26

再現性のあるメタゲノム解析を行うためのモジュール設計された自動パイプライン Sunbeam

2019 Microbiome (Journal) workflow manager automatic pipeline metagenome contamination low complexity error correction quality check filtering assembly SRA download mapping 高速なツール

2019 6/26 誤字修正メタゲノミックショットガンシークエンシングは、関心のある微生物混合群からDNAを抽出し、無作為に抽出されたDNAをディープシーケンシングする。これは、特定の標的遺伝子領域が増幅およびシーケンシングされるマーカー遺伝子シーケンシ…

2019-06-24

ショートリードのマッピングを行う Whisper

2019 mapping 高速なツール Bioinformatics large genome

リファレンスゲノムへのリードのマッピングは、シークエンシングデータ解析パイプラインの最初のステップである。シーケンシングコストが削減していることから、合理的な時間内に増大する量の生成データを処理することができるアルゴリズムに対する必要性が…

2019-06-20

ショートリードによるpolishingも行う高速なロングリードアセンブラ Raven (旧名 Ra)

Nanopore long read Pacbio assembly polish 高速なツール large genome hybrid assembly 2021 2020 Preprint Nature Communications

2020 5/23 タイトル補足、ravenインストール追記 2020 8/11 引用にpreprint追記 2021 5/24 論文引用 2022/06/08 help更新 Ra（現在はRaven）は、第3世代シーケンシングによって生成されたrawシーケンシングリードの高速で使いやすいアセンブラである。以下…

2019-06-18

多機能なNGS分析ツール BBtools　其の３BBMap追加コマンド

高速なツール SNV small indel error correction metagenome annotation

BBMapの追加コマンドについて紹介します。 BBMap Guide https://jgi.doe.gov/data-and-tools/bbtools/bb-tools-user-guide/bbmap-guide/ callvariants.sh Introducing CallVariants, a new variant caller in #BBMap! CallVariants is 81x faster than mpilu…

2019-06-13

ロングリードのドラフトアセンブリをpolishする marginpolish

Nanopore long read polish 高速なツール

2019 6/13 tweetリンク追加、誤字修正 MarginPolishはグラフベースのアセンブリのpolisher。入力としてFASTAアセンブリとインデックス付きBAM（ONTのアセンブリ配列へのアラインメント）を受け取り、polishingしたFASTAアセンブリを生成する。 MarginPolish…

2019-05-29

k-merカウントツール Squeakr

error correction 2018 Bioinformatics k-mer 高速なツール

Massively parallel high-throughput sequencing (HTS) 技術の登場により、シーケンシング能力は劇的に増加している。増加するHTSデータに対処するための新しい計算方法の多くは、k-mer（k塩基の文字列）をシーケンスの分析の最小単位として使用する。例えば…