macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

Viruses

ロングリードを使って既存の(メタ)ゲノムアセンブリの改良(ハプロイドやphased assembly作成など)を行う HairSplitter

#2024/02/22 インストール手順修正 ロングリード・アセンブラは、密接に関連したウイルス株や細菌株を識別する際に問題に直面する。この限界は、多様な菌株が重要な機能的違いを保持している可能性のあるメタゲノム解析の妨げとなっている。本著者らは、菌株…

近傍した遺伝子の大規模解析、比較、可視化を行う AnnoView

遺伝子近傍の解析と比較は、微生物ゲノムの構造、機能、進化を探索するための強力なアプローチである。ゲノムの可視化や比較のためのツールは数多く存在するが、大規模なゲノムデータベースやユーザーが作成したデータセットを横断してゲノムを探索すること…

ナノポアのロングリードからウイルスゲノムを検出する VirPipe

ナノポアシークエンシングによるウイルスゲノムの検出と解析は、病原体アウトブレイクのサーベイランスにおいて大きな可能性を示している。しかし、ナノポアシーケンスをサポートするウイルス検出パイプラインの数は非常に限られている。この論文では、Nanop…

昆虫の包括的遺伝子リソース InsectBase 2.0

昆虫は地球上で最大の動物群であり、資源の提供、病気の媒介、農作物生産の被害など、人間の生活に大きな影響を及ぼしている。近年、昆虫のゲノムや遺伝子のデータが大量に生成されている。これらのリソースを管理、共有、マイニングするためには、包括的な…

ファージゲノムのアノテーションと解析のためのウェブサーバー PhaGAA

ファージゲノムアノテーションは、ファージ治療の設計に重要な役割を果たす。これまで、ファージのゲノムアノテーションツールは様々なものがあったが、その多くは単機能のアノテーションに特化したもので、操作プロセスも複雑だった。そのため、ファージゲ…

ウイルスバリアント解析のための統合アプリケーション MALVIRUS

COVID-19のパンデミックでも示されたように、日々増加する複数のウイルス株のシーケンスデータから効率的にバリアントをコールできることは、世界中に広がるウイルス株を追跡するために最も重要なことである。 SARS-CoV-2のようなウイルス集団の解析に必要な…

ノイズの多いロングリードを分類する deSAMBA

ノイズの多いロングリードの分類を特定するための高速かつ正確な分類ツールが未だ存在せず、有望なロングリードメタゲノムシーケンス技術の利用におけるボトルネックとなっている。本発表では、de Bruijn graph-based Sparse Approximate Match Block Analyz…

シーケンスデータ中のウイルス・微生物検出を高速に行う RabbitV

シークエンスデータに含まれるウイルスや微生物の検出・同定は、病原体の診断や研究において重要な役割を担っている。しかし、この問題のための既存のツールは、しばしば高い実行時間とメモリ消費に悩まされている。本著者らは、ユニークなk-merの高速同定に…

ロングリードのウイルスメタゲノミクスアセンブリから宿主を特定する viralFlye

ロングリードシーケンスを用いると、ショートリードに比べてアセンブルされたウイルスゲノムの連続性が向上するが、複雑なウイルスコミュニティのアセンブルには未解決の問題が残っている。本著者らは、メタゲノムでアセンブルされたウイルスをロングリード…

メタゲノムアセンブリやVirSorterで同定されたウイルスコンティグのフルアノテーションを行う DRAM

生物学的エンジンが触媒する特定の反応を解読することは、スケーラブルで代謝的に分解されたアノテーションソフトウェアがないために困難である。ここでは、微生物ベースの膨大なゲノム情報を微生物形質のカタログに変換するためのフレームワークである DRAM…

Serratus Explorer

公開データベースには惑星規模の核酸配列コレクションが含まれているが、このコーパスの効率的な検索方法がないため、体系的な探索が阻害されている。このデータベースは(本稿執筆時点で)20ペタベースを超え、指数関数的に増加している (ref.1)。そこで、…

ノイズの多いロングリードからの完全長de novoウイルスハプロタイプ再構築を行う Strainline

多様なウイルスゲノムのHaplotype-resolvedアセンブリは、ウイルス性疾患の予防、制御、治療において重要である。しかし、現在の手法では、比較的正確なショートリードデータしか扱えないか、ハプロタイプ特有の変異をコンセンサス配列に折り畳んでしまうか…

ウィルスゲノムの株を識別したde novoアセンブリを行う Haploflow

ウィルス感染症では、共同感染や宿主内での進化により、複数の関連するウィルス株が存在することが多い。HaploflowはdeBruijnグラフをベースにしたアセンブラで、新しいフローアルゴリズムを用いて混合されたシークエンシングサンプルからウイルスの株レベル…

ノイズの多いロングリードからの完全長de novoウイルスハプロタイプ再構築を行う Strainline

非常に多様なウイルスゲノムのハプロタイプを解決したデノボアセンブリは、ウイルス疾患の予防、制御、治療に不可欠である。現在の方法では、比較的精度の高いショートリードデータしか扱えないか、ハプロタイプ特有の変異をコンセンサス配列に折り込んでし…

ショートリードまたはロングリードのシーケンスデータからウイルスや微生物を迅速に同定する fastv

本論文では、ショートリードまたはロングリードのシーケンスデータからウイルスや微生物を迅速に同定するためのツールセットと関連リソースを紹介する。fastvは、シーケンシングデータ中に存在する微生物の配列を検出し、対象となる微生物を同定し、微生物ゲ…

Genome Detective Coronavirus Typing Tool

Genome detectiveは、次世代シーケンサーのデータセットから既知の全てのウイルスゲノムを迅速かつ正確にアセンブルする、ウェブベースの使いやすいソフトウェアアプリケーションである。このアプリケーションでは、アセンブルされたFASTA形式のゲノム配列か…

DNAおよびRNAウイルスの分類器 VirSorter2

ウイルスは多くの生物圏や人間の生態系において重要な役割を果たしているが、普遍的な遺伝子マーカー、データベースの代表、および十分に高度な同定ツールがないため、ほとんどのシグナルはメタゲノム/メタトランスクリプトーム配列データセットでは「隠さ…

CoronaSPAdes

2021 2/2 追記 COVID-19 パンデミックを契機に,コロナウイルス研究への関心が高まっている.コロナウイルスデータセットの解析は、リードアラインメントまたはde novo assemblyを用いて完全長ウイルスゲノム配列を得ることから始まる。リードアラインメント…

Viral quasispeciesのアセンブリを行う virus-vg

ウイルスは、遺伝的に関連のある突然変異株のコレクションであるquasispeciesとして宿主に寄生する。Viral quasispeciesのアセンブリは、リードデータから株固有のハプロタイプを再構築することであり、株間の相対的な存在量を予測することは、治療に関連し…

ウィルスゲノムのアノテーションを行う VIGOR

遺伝子予測プログラムVIGOR(Viral Genome ORF Reader)は、2010年にJ.Craig Venter Instituteで開発され、感染症ゲノムシークエンシングセンターのプロジェクトでコロナウイルス、インフルエンザ、ライノウイルス、ロタウイルスの遺伝子コールに成功してい…

タンパク質をコードする遺伝子配列の組換えイベントや正の選択下にある部位を見つける PoSeiDon

2020 10/27 テストデータ結果追記 選択圧力は、遺伝子の進化に継続的に影響を与え、多くの方法で研究することができる(Vittiら、2013)。例えば正の選択、または多様化する選択は、オルソロガスな遺伝子のアラインメントにおける非同義置換(dN)と同義置換…

リアルタイムで 素早くONTシークエンシングのマッピング結果をモニタリングする RAMPART

2020 7/13 誤字修正、説明の誤り修正 アウトブレイク解析では時間が非常に重要である。最近のシーケンス準備の進歩により、多くの病原体ではシーケンスがボトルネックとなっている。多くの病原体のゲノムサイズが小さいため、MinION シーケンシングにより数…

ゲノム配列からウィルス配列を同定してアノテーションをつける VIBRANT

細菌や古細菌に感染するウイルスは世界的に豊富であり、ほとんどの環境で宿主の数を上回っている [ref.1,2,3]。ウイルスは、感染時に宿主細胞の代謝状態を再プログラムすることができる義務的な細胞内病原性遺伝要素であり、多様な環境下で毎日20~40%の微…

メタゲノムのビニング後の解析を行う自動化されたパイプライン MetaSanity

2020 5/29 構成を修正、タイトル変更 2020 6/1 コマンド修正 2021 10/5 ツイート追記 マイクロバイオーム研究の重要性はますます一般的になっており、さまざまな生態系(例:海洋、構築、宿主関連など)を理解するために不可欠である。研究者は、微生物ゲノ…

メタゲノムアセンブリのウイルスゲノム品質を評価する CheckV

2020 5/9 誤字修正 2020 12/22 論文追加 ここ数年の間に、メタゲノミクスにより何百万もの新しいウイルス配列のアセンブルが可能になり、地球上のウイルスの多様性に関する知識が大幅に拡大した。しかし、これらの配列は小さな断片から完全なゲノムまで様々…

publication品質の近傍遺伝子描画webサービス Gene Graphics

遺伝子近傍の検査は比較ゲノミクスの不可欠な部分だが、遺伝子クラスターのpublication品質のグラフィックスを作成するツールはない。 Gene Graphicsは、このようなビジュアルを作成するための簡単なWebアプリケーションである。サポートされている入力には…

viral quasispeciesのハプロタイプを再構成する PEHaplo

高い突然変異率、自然選択および組換えは、RNAウイルス集団の高い遺伝的多様性につながる可能性がある(Domingo-Calap et al、2016)。これらはclosely relatedだが異なるウイルス株で構成されている。ウイルス集団のこれらのグループは、しばしばquasispeci…

メタゲノムシーケンシングリードをアセンブリしてvirusゲノム配列を探す自動パイプライン virMine

真核生物および原核生物とは対照的に、ウイルスゲノムはごく一部のみがシーケンシングされ特徴付けられている。ウイルスのメタゲノム研究は、地球上でのウイルスの多様性についての理解を深めるうえで極めて重要である。海水(Breitbart et al、2002; Yoosep…

(ウィリス向け)高感度なHMMベースのアライナ ngshmmalign

現在のシーケンシンでは、NGSのリードのアラインメントはbwa(http://bio-bwa.sourceforge.net)やbowtie(http://bowtie-bio.sourceforge.net/bowtie2/index.shtml)などのアライナを使用して行われる。 これらのアライナは高速で、大きな真核生物ゲノムの…

Virusの ultra deep NGSのbamからコンセンサス配列を出力する ConsensusFixer

2019 5/14リンク追加 2019 5/30 インストール追記 ConsensusFixerはjavaコマンドラインアプリケーション。virusのウルトラディープNGSのアライメント(インフレーム挿入とあいまいなヌクレオチドを含む)からコンセンサスシーケンスを計算、出力する。Europe…