macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

SARS-CoV-2

大規模な系統樹を探索するためのウェブベースのツール Taxonium

2022/06/11 誤字修正 COVID-19の大流行により、シークエンスデータの規模が一変し、SARS-CoV-2のゲノムは地球上のどの生物よりも多く配列決定された。これまでの系統樹探索のためのウェブベースのツールは、この規模の樹に直接スケールアップすることができ…

シーケンスデータ中のウイルス・微生物検出を高速に行う RabbitV

シークエンスデータに含まれるウイルスや微生物の検出・同定は、病原体の診断や研究において重要な役割を担っている。しかし、この問題のための既存のツールは、しばしば高い実行時間とメモリ消費に悩まされている。本著者らは、ユニークなk-merの高速同定に…

生のシークエンシングリードからスケーラブルな高精度の系統樹を生成する Read2Tree

シーケンスのリードデータから系統樹を推定することは、生物学の基礎となるものである。しかし、最新の系統樹解析では、複雑なパイプラインを実行する必要があり、多大な計算コストと人件費がかかる上、シーケンスのカバレッジ、アセンブリ、アノテーション…

(SARS-CoV-2) シーケンシングリードの迅速なデコンタミネーションを行う ReadItAndKeep

臨床検体から得られたウイルス配列データには、人為的な汚染が含まれていることが多い。これらは、法的・倫理的な理由により、共有する前に除去する必要がある。ホストリードの除去を可能にし、低スペックのノートパソコンでSARS-CoV-2のシーケンスデータを…

ノイズの多いロングリードからの完全長de novoウイルスハプロタイプ再構築を行う Strainline

多様なウイルスゲノムのHaplotype-resolvedアセンブリは、ウイルス性疾患の予防、制御、治療において重要である。しかし、現在の手法では、比較的正確なショートリードデータしか扱えないか、ハプロタイプ特有の変異をコンセンサス配列に折り畳んでしまうか…

包括的な遺伝子セットのエンリッチメント解析ウェブサーバー Enrichr

エンリッチメント解析は、ゲノムワイド実験で得られた遺伝子セットを解析するための一般的な手法である。ここでは、Enrichrと呼ばれるこの分野のツールの1つを大幅に更新した。Enrichrには、現在、解析やダウンロードが可能な多様な遺伝子セットライブラリの…

ウィルスゲノムの株を識別したde novoアセンブリを行う Haploflow

ウィルス感染症では、共同感染や宿主内での進化により、複数の関連するウィルス株が存在することが多い。HaploflowはdeBruijnグラフをベースにしたアセンブラで、新しいフローアルゴリズムを用いて混合されたシークエンシングサンプルからウイルスの株レベル…

ショートリードまたはロングリードのシーケンスデータからウイルスや微生物を迅速に同定する fastv

本論文では、ショートリードまたはロングリードのシーケンスデータからウイルスや微生物を迅速に同定するためのツールセットと関連リソースを紹介する。fastvは、シーケンシングデータ中に存在する微生物の配列を検出し、対象となる微生物を同定し、微生物ゲ…

Genome Detective Coronavirus Typing Tool

Genome detectiveは、次世代シーケンサーのデータセットから既知の全てのウイルスゲノムを迅速かつ正確にアセンブルする、ウェブベースの使いやすいソフトウェアアプリケーションである。このアプリケーションでは、アセンブルされたFASTA形式のゲノム配列か…

ナノポアリード用の新しい高精度メタゲノム分類器 BugSeq

20211114 論文引用 メタゲノム解析にナノポアシーケンサーを使用する機会が増えるにつれ、ロングリードの分類学的な分類を高速かつ正確に実行できるツールが必要となっている。既存のツールは、ショートリードデータ用に設計されているか(例:Centrifuge)…

多様なヒートマップを作図できるwebサービス Heatmapper

2021 1/19 誤字修正 Heatmapperは自由に利用できるWebサーバであり、ユーザーは使いやすいグラフィカルなインターフェースを使って、データをヒートマップの形でインタラクティブに視覚化することができる。既存の非商用のヒートマップパッケージは、グラフ…

CoronaSPAdes

2021 2/2 追記 COVID-19 パンデミックを契機に,コロナウイルス研究への関心が高まっている.コロナウイルスデータセットの解析は、リードアラインメントまたはde novo assemblyを用いて完全長ウイルスゲノム配列を得ることから始まる。リードアラインメント…

様々な種のバリアント情報をまとめたデータベース Genome Variation Map(GVM)

Genome Variation Map (GVM; http://bigd.big.ac.cn/gvm/) は、ゲノム変異の公開データリポジトリである。幅広い種のゲノム変異を収集・統合することを目的としており、世界中から様々な変異タイプの投稿を受け付けており、世界中の研究活動を支援するために…

大規模なウイルスゲノムデータのマルチプルシーケンスアラインメントを行う ViralMSA

分子疫学において、感染クラスターの同定は、典型的にはウイルスゲノム配列データのアラインメントを必要とする。しかし、既存の複数配列のアラインメント手法では、配列数に対してスケールが小さく、その結果、ウイルスの感染クラスターを特定するためには…

Webベースのデータ分析プラットフォーム NASQAR

2020 9/6 追記 次世代シーケンシング(NGS)テクノロジーの急速な進歩により、ゲノムデータは近年大幅に成長している[ref.1、2]。一般的なアプリケーションには、de novoゲノムシーケンス;ゲノム変異、転写因子結合部位、クロマチン修飾、クロマチンアクセシ…