macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

virus

ウィルス分類器 viruses_classifier

次世代シーケンシング(NGS)の台頭により、メタゲノムは微生物生態学におけるゴールドスタンダードとなった。その限界、主にウイルス間の普遍的なマーカー遺伝子の欠如にもかかわらず、ウイルスメタゲノミクスはウイルス発見のための主要なツールとなってい…

サンプルのコンタミネーションを見積もる Mash Screen

シーケンシング技術がスループットを高めそしてコストを下げ続けるにつれて、シーケンシングされたゲノムのデータベース(例えばNCBI RefSeq [ref.1])は指数関数的成長を続け、それらに対する検索をさらに複雑にしている[ref.2、3]。さらに、rawシーケンス…

スモールゲノムを可視化したり、複数ゲノムを比較して似た領域、異なる領域を可視化できる Gview

グラフィックなゲノムマップは、ゲノムの特徴および配列の特徴を評価するために広く使用されている。 CGView(Circular Genome Viewer)ソフトウェアファミリーは、バクテリア、オルガネラ、ウイルスのゲノムマップを生成するためのツールの人気のあるコレク…

ショート/ロングシーケンシングデータやcontigからVirulence factorを検出するwebツール VirulenceFinder

病原性細菌は依然として公衆衛生に大きな脅威を与えており、病原性細菌蔓延を制限し、感染症の発生を防ぐためには、正確で迅速な診断および分離株の分類が非常に重要である。現在の日常業務では、単離および同定は大部分が臨床微生物学的検査室で行われ、検…

シーケンシングデータからヒトの病原性細菌かどうかを判定するwebツール PathogenFinder

2019 2/21タイトル修正 2019 2/24 コメント追記 毎年1500万人を超える人が感染症の直接の原因で死亡している。その多くは細菌感染によるものである。毎年推定130万人が結核で死亡し、200万人が百日咳を発症しているが、下痢は250万人以上の死亡の原…

メタゲノムのphage contigからホスト原核生物ゲノムを予測する WIsH

ウイルスは、ほとんどすべての既知の生態系の重要な構成要素である(Edwards and Rohwer、2005)。それらは、優占種を枯渇させることによって海洋から人間の腸までの様々な環境における生物多様性を調節し(De Paepe et al、2014; Lehahn et al、2014)、海…

KrakenUniq

2019 1/17 エラー修正 メタゲノミクス分類手法は、データセット内の各リードに taxonomic identityをアサインすることを試みる。メタゲノミクスデータにはしばしば何千万ものリードが含まれているため、分類は、通常、長さk(k-mers)の短いワードの正確な一…

植物RNA seqシーケンシングデータからvirusリードを検出する kodoja

Kodojaはk-merプロファイリングを使用してRNA-seqまたはsRNA-seのfastq/fasta生データからウイルス配列を特定するツール。 k-merを用いた系統分類ツールKrakenとおよびタンパク質レベルでの配列マッチングのKaijuを組み合わせている(Burrows-Wheeler変換し…

メタゲノムのアセンブル配列からウィルス由来配列を見つける VirSorter

細菌と古細菌に感染するウイルスはこれまでにサンプリングされたあらゆるタイプのバイオームにありふれており、豊富に存在する。ウイルス - 宿主相互作用は地球化学的循環からヒトの健康まで生態系機能を変化させる(Fuhrman, 1999; Wommack & Colwell, 2000…

k-merベースのスケーラブルなメタゲノムの全配列比較ツール Libra

ショットガンメタゲノミクスは、微生物群集の生物多様性と機能に対する強力な洞察を提供する。しかしながら、メタゲノム研究からの推論は、データセットのサイズと複雑さや既存のデータベースの可用性と完全性によって制限される。 de novo比較メタゲノミク…

NCBIデータベースをダウンロードする ncbi-blast-dbs

2018 12/10 タイトル訂正 ncbi-blast-dbsはデータベースファイルを並行してダウンロードすることで、NCBIのデータベースをローカルに用意するのにかかる時間を短縮する。使用するスレッド数は自動的に決定される。 MD5チェックサムが検証され、ダウンロード…

NCBI FTPサーバからゲノム配列をダウンロードする ncbi-genome-download

タイトルの通りの機能をもつスクリプト。 ncbi-genome-downloadに関するツイート インストール mac os10.13のminiconda2-4.0.5環境でテストした。 依存 本体 GIthub #anaconda環境ならcondaで導入できるconda install -y -c bioconda ncbi-genome-download >…

QuasiRecomb

次世代シークエンシング(NGS)技術は、以前はあまりにも労働集約的であると考えられていた実験を日常的な作業に変えた(Metzker、2010)。 NGSの1つの用途は、genetic diversityを定量化するために遺伝的にheterogousなpopulationsのシーケンシングである。…

メタゲノムデータのtaxonomy assignmentを行う k-SLAM

微生物群集から直接抽出されたDNAの研究は、全ゲノムショットガンシーケンシングによって革命を起こした。バクテリア、ウイルス、真菌の種から数十億の短いDNA配列をサンプリングする能力は、多様な生態系の分類学的構成ならびにその中で起こっている過程を…

Viral populations分析パイプライン Vipie

臨床試料中の全ウイルス量を研究し、急性および慢性感染時のウイルスquasispeciesの進化を評価する要求が高まっているため、Viromeメタゲノミクス研究分野は急速に増加している。Virome sequencing 技術の応用は、感染症研究だけでなく、主として非感染性条…

バクテリオファージのホストを推測する HostPhinder

2012年、世界保健機関(WHO)は抗生物質時代の終焉の始まりと、ささいな細菌感染でさえ致命的になる時代に戻りうることを発表した[論文より ref.3]。それ以来、抗生物質耐性の問題は増大し続けており、WHOレポート「Antimicrobial resistance: global report…

virusゲノムを同定する GENOME DETECTIVE

Genome Detectiveは、ウイルスのゲノムを迅速かつ正確にアセンブリする使いやすいWebベースのソフトウェアアプリケーションである。提出された入力シーケンスデータ内のすべてのウイルス種について、真核生物ウイルスおよびファージからの配列に分類学的名称…

高感度なバリアントコーラー LoFreq

シーケンシング技術の最近の進歩により、細胞集団におけるheterogeneityおよびsub-populationsのより広範な研究、およびそれらの進化による「コンセンサス配列」からの移行が可能になった。このような‘population perspective’ な視点は、ウイルス性疑似種(…

既知Eukaryotic Virusesのアセンブリツール drVM

ウイルスは地球上で最も豊富な生物学的実体であり、動物、植物、細菌、真菌類を含むあらゆる細胞型の生活の中で発見されている。 4500種以上のウイルス種が発見されてきている(論文執筆時点)。それらの配列情報は研究者によって収集されている[論文より re…

抗生物質耐性遺伝子や病原性遺伝子を素早く検索する ABRicate

2019 3/1 コマンド及びランの流れ更新 2019 3/3 リンク修正 2019 3/14 condaインストール追記 2019 4/12 dockerリンク追加 ABRicateはTorsten SeemannさんがGithubに公開されている抗生物質耐性遺伝子や病原性遺伝子、腸内細菌科プラスミドの検索ツール。web…

メタゲノムを分類し、結果を可視化する Taxonomer

微生物集団のゲノム解析であるMetagenomicsは、環境と人体の微生物群集のプロファイリングを、これまでにない深みと幅で可能にする。その急速に拡大している用途は、自然環境や人工環境における微生物多様性の理解に革命をもたらしており、微生物の地域プロ…

タンパク質を使って高感度にメタゲノムのtaxonomy assignmentを行う kaiju

2018 10/7 タイトル修正 2018 11/20 conda追加 2018 12/12 テスト追記 ランダムDNAショットガンシーケンシングを使用すると、実験室培養を必要とせずに環境サンプルから全ゲノムDNAを直接得ることができる。この「メタゲノミック」アプローチは、細菌や古細…

メタゲノムのtaxonomyアノテーションを行い定量する MGmapper

迅速で効率的なDNAシーケンシング技術の進歩により、堆積物[論文より ref.1] [ref.2]、水[ref.3]、氷[ref.4]、ヒトなど様々な環境から微生物群集を研究することが可能になった[ ref.6]。既知のDNA配列決定プラットフォームの中で、イルミナHiSeqおよびMiSeq…

ウィルスintegration部位を分析するGUIツール ChimericSeq

ウイルスintegration部位の同定は、特定のウイルス感染に関連する疾患の病因および進行を理解する上で重要であるが、ウイルス - ホストjunction部位のNGSデータを解析するための現在の計算方法は、アクセス可能性の点で制限されている。たとえば、現在入手可…

ウィルスコミュニティを検出する viromescan

ウイルスは常にヒトの体に生息している [論文よりref.1]。細菌および真菌のように、ある種のウイルスは、ヒト免疫の調節にとって重要な低レベルの免疫応答を刺激し得るが、代謝ホメオスタシスもまた刺激し得る。これに関して、FoxmanとIwasaki [ref.4]は、一…

ウィルスのintegration部位を検出する Virus-Clip

ウイルス感染は、様々なヒト悪性腫瘍の共通の危険因子である。例えばB型肝炎ウイルス(HBV)は、感染時にヒトゲノムに組み込まれ、発癌にかかりやすい遺伝子機能の破壊をもたらすことがある。過去には、PCRに基づきウィルスを検出していたが、制限が多かった…

kallistoを動かしメタゲノムからウィルスゲノムを高速に検出・定量する FastViromeExplorer

伝統的なウイルス同定法は単離および培養に依存しており、時間がかかるだけでなく、多くのウイルスおよび宿主が培地で増えないため実行不可能なことも多い。 2004年に登場したNGSの技術により、ウイルスとその存在量を迅速に測定することが可能になった。ウ…

メタゲノムデータからvirusゲノムを検出するVIP

VIPはメタゲノムデータからホスト由来のコンタミリードを除き、virus由来のリードをアセンブルしてviursを分類・検出するパイプライン。クオリティトリミングからvirusのデータベースにリードをアライメントして照合することまで自動化されており、シンプル…

deep sequenceされたウィルスのアセンブルツール sparNA

sparNAはウィルスゲノムのアセンブリツール。ウィルスゲノムはRNA ploplymeraseのエラー率の高さなどの要因でhetero genesityが非常に高いため、特別な仕分け方をしない限りpopulation genomeやmeta genomeのデータセットに近い状態でシーケンス解析が行われ…

NCBIからvirusゲノムをダウンロードする

Accession IDを使い、virusのゲノム配列(FASTA)をダウンロードする。 NCBIのvirus Genomesに移動する。 左下の方の"Accession list of all viral genomes"をクリックしてvirusのリストをダウンロードする。 このようなリストが入手できる。 user$ head taxid…