macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

生物種の推定 (taxonomic profiling)

メタゲノムのraw fastqから高速なtaxonomy assignmentを行う FOCUS

微生物は他のどの細胞生物よりも豊富であり(Whitman、Coleman&Wiebe、1998年)、どの生物が存在し、それらが何をしているのかを理解することが重要である(Handelsman、2004)。多くの環境では、微生物群集の大多数は培養できず、メタゲノムは未培養のゲノ…

メタゲノムの既知および未知バクテリアの存在量を推定single-copy phylogenetic marker genesに基づいて見積もる mOTUs2

2019 4/26 mergeエラー修正及び追記 微生物は、地球上の生命や環境中の地球化学的プロセスに影響を与える、相互作用する種の複雑な共同体に住んでいる。したがって、それらが形成するコミュニティの構成を正確にプロファイルし、比較することは基本的な関心…

メタゲノムのコンタミ除去やメタゲノムのサンプル間比較を行って結果を視覚化する Recentrifuge

2019 4/21 タイトル追加 2019 4/21 オーサーのJose Manuel Martíさんのコメント追加 2019 4/23 タイトル修正 2019 4/26 誤字修正 2019 dockerリンク追記 219 5/9 パラメータ追記 メタゲノミクスによる微生物群集の研究は、環境、臨床、食品、法医学の研究な…

病原性細菌の同定とタイピングを行うwebツール PathoBacTyper

生物のゲノムDNAは生物学的にfunctionalな遺伝情報を持っている。生物の全ゲノム配列を解読することは、複雑な生物学研究における基本的なタスクである。以前は、完全なバクテリアゲノム配列を解読するために従来のサンガーシーケンシングが使用されていた。…

サンプルのコンタミネーションを見積もる Mash Screen

シーケンシング技術がスループットを高めそしてコストを下げ続けるにつれて、シーケンシングされたゲノムのデータベース(例えばNCBI RefSeq [ref.1])は指数関数的成長を続け、それらに対する検索をさらに複雑にしている[ref.2、3]。さらに、rawシーケンス…

メタゲノムのアセンブリcontig.fastaに精度の高い系統情報をアサインするCATと、binned.fastaに精度の高い系統情報をアサインするBAT

2019 2/15 タイトル修正 2019 2/26 コマンドの誤り修正 メタゲノミクスは、自然環境における微生物群集からのDNAのダイレクトシーケンシングであり、生物圏の膨大な微生物配列を発見することによって微生物学の分野に革命をもたらした。 DNAシーケンシングの…

メタゲノムデータからrRNAをターゲットアセンブリし、系統アサイン、定量、比較する phyloFlash

2019 5/9 インストール追記 ショットガンメタゲノミクスは、微生物群集の機能を調査し、それらの系統または分類学的な構成を決定するための強力なツールである(Preprintより ref.1、2)。プライマーバイアス(ref.3)やキメラ配列(ref.4、5)など、PCRベー…

バクテリアとアーキアのデータベース EzBioCloud

現代のバクテリアと古細菌の分類学の目標の1つは種の客観的定義である。分類を決定するプロセスは、新しいテクノロジーの出現により、時とともに継続的に改善されてきた。 PCRとそれに続く16S rRNA遺伝子のシークエンシングは、バクテリアと古細菌の系統学に…

Krona

2019 4/26 わかりにくい文章を修正 メタゲノム研究の重要な成果は、分類群または機能群の存在量の推定である。これらのグループへのアサインおける固有の不確実性は、それらの階層的コンテキストとそれらの予測信頼度の両方を考慮することを重要にしている。…

KrakenUniq

2019 1/17 エラー修正 メタゲノミクス分類手法は、データセット内の各リードに taxonomic identityをアサインすることを試みる。メタゲノミクスデータにはしばしば何千万ものリードが含まれているため、分類は、通常、長さk(k-mers)の短いワードの正確な一…

メタゲノムのアセンブル配列からウィルス由来配列を見つける VirSorter

細菌と古細菌に感染するウイルスはこれまでにサンプリングされたあらゆるタイプのバイオームにありふれており、豊富に存在する。ウイルス - 宿主相互作用は地球化学的循環からヒトの健康まで生態系機能を変化させる(Fuhrman, 1999; Wommack & Colwell, 2000…

k-merベースのスケーラブルなメタゲノムの全配列比較ツール Libra

ショットガンメタゲノミクスは、微生物群集の生物多様性と機能に対する強力な洞察を提供する。しかしながら、メタゲノム研究からの推論は、データセットのサイズと複雑さや既存のデータベースの可用性と完全性によって制限される。 de novo比較メタゲノミク…

ゲノムスキミングサンプルから種を同定する Skmer

環境サンプルの分類学的多様性を迅速かつ安価に研究する能力は、急速な気候変動と生物多様性の変化が起きているこの時代において非常に重要である。現在選択されている分子技術は、(meta)Barcoding[論文より ref.1- 3]である。伝統的な(meta)Barcodingは…

メタゲノムデータのtaxonomy assignmentを行う k-SLAM

微生物群集から直接抽出されたDNAの研究は、全ゲノムショットガンシーケンシングによって革命を起こした。バクテリア、ウイルス、真菌の種から数十億の短いDNA配列をサンプリングする能力は、多様な生態系の分類学的構成ならびにその中で起こっている過程を…

NGSデータまたはアセンブリからバクテリアやアーキアのtaxanomic assignmentを行い、ゲノムのnoveltyなどを評価する MIGA

Small subunit ribosomal RNA gene (16S)は、30年以上にわたり、原核生物種およびそのコミュニティの多様性をカタログ化および研究するために首尾よく使用されてきた。しかしながら、16S(論文より ref.1)によって効率的に評価することができない種および…

細菌性髄膜の原因バクテリア種をFASTA配列から検出するBMScan

毎年世界で120万件が発生すると推定される細菌性髄膜炎(bacterial meningitis)は、公衆衛生上の懸念事項として残る、生命を脅かす感染症である [論文より ref.1]。数多くの病原体が細菌性髄膜炎を引き起こす可能性があり、病原体あたりの致命率や病気の有…

virusゲノムを同定する GENOME DETECTIVE

Genome Detectiveは、ウイルスのゲノムを迅速かつ正確にアセンブリする使いやすいWebベースのソフトウェアアプリケーションである。提出された入力シーケンスデータ内のすべてのウイルス種について、真核生物ウイルスおよびファージからの配列に分類学的名称…

小メモリで高速にtaxonomy assignmentを行う metacache

メタゲノム研究の例として、ヒト腸のシーケンシング解析(Korpela et al、2016)、ヒトの皮膚(Bzhalava et al、2014)、水生生態系(Bork et al、2015)、食物(Ripp et al、2014 )、土壌(Fierer et al、2012)および空中の微生物(Barberánet al、2015)…

k-merを使い 進化距離や相同性を高速計算する Kmer-db

Preprintより 何千もの異なる生物のシーケンシング解析の過程で大量のデータが生成された(100K Pathogen Genome Project(Weimer el al、2017、NCBI Pathogen Detection(https://www.ncbi.nlm.nih.gov/ pathogens) )、これは迅速な分析方法を要求する。 …

Serotypeを予測するSerotypeFinder

大腸菌(Escherichia coli)は通常無害な共生菌であるが、特定の病原性メカニズムによってヒトおよび/または動物に病気を引き起こす能力を発達させた種もある。場合によっては、感染は致死的であり得る(論文より ref.1)。Serotyping( wiki)(以後、血清…

既知Eukaryotic Virusesのアセンブリツール drVM

ウイルスは地球上で最も豊富な生物学的実体であり、動物、植物、細菌、真菌類を含むあらゆる細胞型の生活の中で発見されている。 4500種以上のウイルス種が発見されてきている(論文執筆時点)。それらの配列情報は研究者によって収集されている[論文より re…

抗生物質耐性遺伝子や病原性遺伝子を素早く検索する ABRicate

2019 3/1 コマンド及びランの流れ更新 2019 3/3 リンク修正 2019 3/14 condaインストール追記 2019 4/12 dockerリンク追加 ABRicateはTorsten SeemannさんがGithubに公開されている抗生物質耐性遺伝子や病原性遺伝子、腸内細菌科プラスミドの検索ツール。web…

抗生物質耐性遺伝子を検出する KmerResistance

抗生物質は、ヒトおよび家畜の両方で世界中で広く使用されており、疾患の治療または急速な成長を保証している。長年にわたり、これは抗生物質耐性菌の出現、選抜および普及のための好ましい条件を作り出してきた(ref.1)。 バクテリアの耐性プロファイルを…

メタゲノムのリアルタイム分類ツール LiveKraken

ゲノムシーケンシングデータのリアルタイム解析は、シーケンサがまだ稼動している間にデータを分析できるため、過去数年にわたって特に注目を集めている。しかし、Minionシーケンサーをベースにしたライブ解析アプローチの可能性は、これらのデバイスのスル…

メタゲノムを分類し、結果を可視化する Taxonomer

微生物集団のゲノム解析であるMetagenomicsは、環境と人体の微生物群集のプロファイリングを、これまでにない深みと幅で可能にする。その急速に拡大している用途は、自然環境や人工環境における微生物多様性の理解に革命をもたらしており、微生物の地域プロ…

メタゲノム分析ツール Pavian

メタゲノミクスシーケンスは、感染症における病原体の検出に革命を起こす可能性を秘めている。現在、ほとんどの感染症の診断は、時間がかかり労働集約的な伝統的な文化に基づく方法で行われ、オフターゲット病原体を逃す可能性がある。いくつかの最近の研究…

メタゲノムのリードの系統アサインメントを行う Centrifuge

2019 1/17 タイトル修正 2019 4/16 condaインストール 2019 4/19 ダウンロード方法追記 2019 5/9 パラメータ追記 2019 5/13 test追加 アーキアやバクテリアなどの微生物は、土壌や海洋から温泉や深海に至るまで、事実上あらゆる場所で発見されている(Keller…

タンパク質を使って高感度にメタゲノムのtaxonomy assignmentを行う kaiju

2018 10/7 タイトル修正 2018 11/20 conda追加 2018 12/12 テスト追記 2019 4/26 データベース追記 ランダムDNAショットガンシーケンシングを使用すると、実験室培養を必要とせずに環境サンプルから全ゲノムDNAを直接得ることができる。この「メタゲノミック…

MinHashを使い高速にゲノムを比較する MASH

2019 4/12 dockerリンク追加 BLASTが1990年に初めてpublishされたとき、公開されたアーカイブには5000万塩基以下の塩基配列しか存在しなかった[論文より ref.2]。現在では、1つのシーケンシング機器1回の実行で1兆塩基を超えるシーケンス生成が可能である[re…

MinHashを使いfasta / fastqから生物種を高速推定する BBSketch

2019 6/13 追記 以前このブログで紹介したBBtoolsに、Minhashアルゴリズム(リンク)を使ってわずか数秒でゲノムなどの大きな配列を比較し、トップヒットを返してくれる機能が実装されている。Biostarsに使い方が載せてあったので、紹介しておきます。 BBtoo…