macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

virus

様々な種のバリアント情報をまとめたデータベース Genome Variation Map(GVM)

Genome Variation Map (GVM; http://bigd.big.ac.cn/gvm/) は、ゲノム変異の公開データリポジトリである。幅広い種のゲノム変異を収集・統合することを目的としており、世界中から様々な変異タイプの投稿を受け付けており、世界中の研究活動を支援するために…

大規模なウイルスゲノムデータのマルチプルシーケンスアラインメントを行う ViralMSA

分子疫学において、感染クラスターの同定は、典型的にはウイルスゲノム配列データのアラインメントを必要とする。しかし、既存の複数配列のアラインメント手法では、配列数に対してスケールが小さく、その結果、ウイルスの感染クラスターを特定するためには…

注釈付きで検索可能な微生物のインベントリ The Microbe Directory

次世代シークエンシング技術の出現により、ここ10年で、ヒトのマイクロバイオームから環境(水や土壌)、都市の表面に至るまで、メタゲノムやマイクロバイオーム研究が急増している。これらの研究はすべて、発見された配列をサンプルに見られる分類学的プロ…

ゲノム配列からウィルス配列を同定してアノテーションをつける VIBRANT

細菌や古細菌に感染するウイルスは世界的に豊富であり、ほとんどの環境で宿主の数を上回っている [ref.1,2,3]。ウイルスは、感染時に宿主細胞の代謝状態を再プログラムすることができる義務的な細胞内病原性遺伝要素であり、多様な環境下で毎日20~40%の微…

メタゲノムデータからウィルスゲノムをアセンブルする metaviralSPAdes

2020 5/25 タイトル修正 2020 11/11 dockerリンク追加 現在知られているウイルスのセットは着実に拡大しているが、これまでのところ、地球上のウイルスのごく一部しかシークエンシングされていない。ショットガンメタゲノムシークエンシングは、新しいウイル…

ベストマッチするリファレンスゲノムを探す ReferenceSeeker

2020 3/8 コメント削除、タイトル修正 公共データベースで利用可能な微生物ゲノムの数は増え続けており、多くのin-silico分析、例えば 一塩基多型の検出、scaffolding、比較ゲノミクス、に必要なリファレンスゲノムの最適な選択がますます困難になってきてい…

NCBIからゲノムをダウンロードしたり、 差分だけ更新する機能を持つ genome_updater

2020 4/25 help追記、タイトル変更 genome_updaterはNCBIゲノム(refseq / genbank)をダウンロードおよび更新するBashスクリプトである。データの更新、詳細ログの保持、ファイル整合性チェック(MD5)、そして並列[2]ダウンロードをサポートする。 インス…

植物のRNA seqデータからvirus配列を検出する Kodoja

ウイルス感染は、食物と燃料のために栽培される作物で特に重要な問題である。ウイルスは収量と品質の大きな損失を引き起こし、その結果、ウイルスは重要な経済的悪影響を及ぼす[ref.1]。英国では、ポテトウイルスYは年間3,000〜4,000万ポンドのジャガイモの…

publication品質の近傍遺伝子描画webサービス Gene Graphics

遺伝子近傍の検査は比較ゲノミクスの不可欠な部分だが、遺伝子クラスターのpublication品質のグラフィックスを作成するツールはない。 Gene Graphicsは、このようなビジュアルを作成するための簡単なWebアプリケーションである。サポートされている入力には…

ゲノムを分類、クラスタリングし、視覚化する JGI-GenomeConstellation

2019 11/3 タイトル修正 これまでに特定されていない分類群を含む分類群の分類は、南極の乾燥した谷にある永久に氷に覆われた湖を含む、記載されていない生息地の微生物群集を特徴付ける重要なタスクである。現在の監視された系統発生ベースの方法は、そのよ…

ウィルス専用の遺伝子予測webツール Vgas

2019 10/22 タイトル修正 ウイルス感染によって引き起こされるヒト感染症の治療のためのウイルスゲノム研究の途方もない価値のために、Webサーバーやデータベースを含む多くのウイルス情報学リソースが開発された(Sharma et al、2015)。 RefSeqデータベー…

ウィルスアノテーションパイプライン VAPiD

シーケンシング技術がより安価でより入手しやすくなるにつれて、ゲノムシーケンシングはますます普及してきている。小規模のグループでは、単独で分析できるよりも多くのシーケンスデータが生成されている。これらのデータから最大の科学的および公衆衛生的…

prokaryotic virusのcontigをクラスタリングしTaxonomic assignmentを行う vContact2

2019 9/25 誤字修正 細菌と古細菌は、海洋と土壌の生態系での栄養とエネルギーのサイクルに役割を果たしており、人間の健康にも重要な役割を果たしている。細菌や古細菌に感染するウイルスは、殺害、代謝再プログラミング、または遺伝子導入によってこれらの…

viral quasispeciesのクラスタリング(binning)ツール VirBin

ウイルス集団内の高い遺伝的多様性が、HIV、HCVなどのRNAウイルスによる慢性感染症の患者において観察されている(Sullivan et al、2007; PerrinおよびTelenti、1998)。遺伝的多様性は、異なる株の多重感染、または宿主内でのウイルス複製中の変異によって…

マッピングベースのメタゲノム存在量プロファイリングを行う MiCoP

微生物は、土壌、海水、人体など、地球上のほとんどすべての生態系に遍在している。単細胞生物はこれらの環境のそれぞれにおいて多くの重要な役割を果たしている[ref.1、2]。サンプル中に存在する微生物を特定することは、これらの生物によってどのような機…

メタゲノムシーケンシングリードをアセンブリしてvirusゲノム配列を探す自動パイプライン virMine

真核生物および原核生物とは対照的に、ウイルスゲノムはごく一部のみがシーケンシングされ特徴付けられている。ウイルスのメタゲノム研究は、地球上でのウイルスの多様性についての理解を深めるうえで極めて重要である。海水(Breitbart et al、2002; Yoosep…

メタゲノムのファージ配列分析webサーバー VirMiner

2019 6/15 誤字修正 ウイルスは、それらの恒常性および進化に寄与する微生物群集の必須の構成要素である。ヒトの腸内細菌叢のウイルス群集はバクテリオファージが支配的である[ref.1]。ファージは遺伝子水平伝播(HGT)[ref.2]によって細菌群集の構造と機能…

viral quasispeciesのアセンブリを行う SAVAGE

2019 5/20 誤字修正、コメント、ヘルプ追加 HIV、Zika、Ebolaなどのウイルスは、一般的にウイルス準種(viral quasispecies, wiki)と呼ばれる、遺伝的に関連しているが異なる変異株の集団として宿主に存在する。それぞれ独自のハプロタイプ配列によって特徴…

ウィルス分類器 viruses_classifier

次世代シーケンシング(NGS)の台頭により、メタゲノムは微生物生態学におけるゴールドスタンダードとなった。その限界、主にウイルス間の普遍的なマーカー遺伝子の欠如にもかかわらず、ウイルスメタゲノミクスはウイルス発見のための主要なツールとなってい…

サンプルのコンタミネーションを見積もる Mash Screen

2019 11/5 論文追加 シーケンシング技術がスループットを高めそしてコストを下げ続けるにつれて、シーケンシングされたゲノムのデータベース(例えばNCBI RefSeq [ref.1])は指数関数的成長を続け、それらに対する検索をさらに複雑にしている[ref.2、3]。さ…

スモールゲノムを可視化したり、複数ゲノムを比較して似た領域、異なる領域を可視化できる Gview

グラフィックなゲノムマップは、ゲノムの特徴および配列の特徴を評価するために広く使用されている。 CGView(Circular Genome Viewer)ソフトウェアファミリーは、バクテリア、オルガネラ、ウイルスのゲノムマップを生成するためのツールの人気のあるコレク…

ショート/ロングシーケンシングデータやcontigからVirulence factorを検出するwebツール VirulenceFinder

病原性細菌は依然として公衆衛生に大きな脅威を与えており、病原性細菌蔓延を制限し、感染症の発生を防ぐためには、正確で迅速な診断および分離株の分類が非常に重要である。現在の日常業務では、単離および同定は大部分が臨床微生物学的検査室で行われ、検…

シーケンシングデータからヒトの病原性細菌かどうかを判定するwebツール PathogenFinder

2019 2/21タイトル修正 2019 2/24 コメント追記 毎年1500万人を超える人が感染症の直接の原因で死亡している。その多くは細菌感染によるものである。毎年推定130万人が結核で死亡し、200万人が百日咳を発症しているが、下痢は250万人以上の死亡の原…

メタゲノムのphage contigからホスト原核生物ゲノムを予測する WIsH

ウイルスは、ほとんどすべての既知の生態系の重要な構成要素である(Edwards and Rohwer、2005)。それらは、優占種を枯渇させることによって海洋から人間の腸までの様々な環境における生物多様性を調節し(De Paepe et al、2014; Lehahn et al、2014)、海…

KrakenUniq

2019 1/17 エラー修正 メタゲノミクス分類手法は、データセット内の各リードに taxonomic identityをアサインすることを試みる。メタゲノミクスデータにはしばしば何千万ものリードが含まれているため、分類は、通常、長さk(k-mers)の短いワードの正確な一…

植物RNA seqシーケンシングデータからvirusリードを検出する kodoja

Kodojaはk-merプロファイリングを使用してRNA-seqまたはsRNA-seのfastq/fasta生データからウイルス配列を特定するツール。 k-merを用いた系統分類ツールKrakenとおよびタンパク質レベルでの配列マッチングのKaijuを組み合わせている(Burrows-Wheeler変換し…

メタゲノムのアセンブル配列からウィルス由来配列を見つける VirSorter

細菌と古細菌に感染するウイルスはこれまでにサンプリングされたあらゆるタイプのバイオームにありふれており、豊富に存在する。ウイルス - 宿主相互作用は地球化学的循環からヒトの健康まで生態系機能を変化させる(Fuhrman, 1999; Wommack & Colwell, 2000…

k-merベースのスケーラブルなメタゲノムの全配列比較ツール Libra

ショットガンメタゲノミクスは、微生物群集の生物多様性と機能に対する強力な洞察を提供する。しかしながら、メタゲノム研究からの推論は、データセットのサイズと複雑さや既存のデータベースの可用性と完全性によって制限される。 de novo比較メタゲノミク…

nrなどのNCBIデータベースをダウンロードする ncbi-blast-dbs

2018 12/10 タイトル訂正 2020 9/6 2020 9/7追記2020 9/11 わかりにくい説明を修正 2020 9/11 簡単な並列処理例追記 2020 9/12.9/15 taxonkit コマンド修正, わかりにくい部分を修正 2020 10/3 taxonkitのコマンドを修正 2020 10/10 コマンド微修正 2020 10/…

NCBI FTPサーバからゲノム配列をダウンロードする ncbi-genome-download

2019 11/8 コマンドのミス修正("Escherichia coli" => "Escherichia") 2019 12/19 関連ツールリンク追加 タイトルの通りの機能をもつスクリプト。 ncbi-genome-downloadに関するツイート インストール mac os10.13のminiconda2-4.0.5環境でテストした。 依…