macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

metagenome

マッピングベースのメタゲノム存在量プロファイリングを行う MiCoP

微生物は、土壌、海水、人体など、地球上のほとんどすべての生態系に遍在している。単細胞生物はこれらの環境のそれぞれにおいて多くの重要な役割を果たしている[ref.1、2]。サンプル中に存在する微生物を特定することは、これらの生物によってどのような機…

シングルの配列やメタゲノムのbinned.fastaのtaxonomic classificationを行う BASTA

2019 7/13 説明修正 DNAシーケンシング、例えばアンプリコン、メタゲノムおよび全ゲノムシーケンシングは、微生物学および生態学から医学まで、ライフサイエンスの多くの分野において標準的な手順となっている。これらのシークエンシングプロジェクトの大部…

メタゲノムのビニングを行う COCACOLA

アセンブリはコンティグを生成するが、それ以上の分類学的なプロファイリングや機能解析のためには、OTUに分類することが重要である。このOTUクラスタリングはビニングとも呼ばれる。しかしコンティグの正確なビニングは、ゲノム中のリピート配列、シークエ…

FragGeneScan

次世代シーケンシング技術の進歩は、環境試料(すなわちメタゲノム)内の遺伝物質の全コレクションを直接シーケンシングしようと試みるメタゲノム研究を促進した。メタゲノムアセンブリは利用できないことが多いので(論文執筆時点)、ショートリードから直…

再現性のあるメタゲノム解析を行うためのモジュール設計された自動パイプライン Sunbeam

2019 6/26 誤字修正 メタゲノミックショットガンシークエンシングは、関心のある微生物混合群からDNAを抽出し、無作為に抽出されたDNAをディープシーケンシングする。これは、特定の標的遺伝子領域が増幅およびシーケンシングされるマーカー遺伝子シーケンシ…

複数のメタゲノムをその場で分析するための軽量で多機能なメタゲノム分析ツール SqueezeMeta(オフライン使用)

シーケンシング技術の改良によりメタゲノムシーケンシングが一般化し、メタゲノムシーケンシングがマイクロバイオームの構造および機能性を分析するための標準的な手順となった。メタゲノム実験によって生成された膨大な数のショートリード配列に対処するた…

メタバーコディングのデータベース配列キュレーションなどを行うツールキット MetaCurator

配列ベースの生物学的コミュニティの特徴付けの過程において、配列の教師ありのtaxonomic classification は重要な目標である。多数の配列分類ソフトウェアプログラムは、配列類似性を測り、そして配列類似性と分類学的所属との間の関係をモデル化することに…

多機能なNGS分析ツール BBtools 其の3BBMap追加コマンド

BBMapの追加コマンドについて紹介します。 BBMap Guide https://jgi.doe.gov/data-and-tools/bbtools/bb-tools-user-guide/bbmap-guide/ callvariants.sh Introducing CallVariants, a new variant caller in #BBMap! CallVariants is 81x faster than mpilu…

metaplasmidSPAdes

2019 6/7 出力例 プラスミドは、それらの生存および適応にとって重要なさらなる遺伝物質を細菌宿主に提供するクロモソーム外に独立して複製されるDNA分子である。シーケンシング時代より昔は、抗生物質耐性または難治性有機化合物を分解する能力など、それら…

ロングリードのメタゲノムのアセンブリを行う metaFlye

2019 5/28 誤字修正 (Pacific BiosciencesまたはOxford Nanoporeシーケンサーによって生成された)一分子ロングシーケンシングリードによる細菌ゲノムアセンブリは、ショートシーケンシングリードアセンブリと比較して、アセンブリされたゲノムの隣接性を実…

(メタゲノム向け)高効率なプロテインレベルのアセンブリツール PLASS

2019 6/25 twitter追記 メタゲノム研究の主な制限は、ショートリードの大部分(土壌で80% - 90%[1])を、遺伝子およびタンパク質配列の予測を可能にするのに十分な長さの連続した配列(contigs)にアセンブリすることができないことである。 低存在量のゲ…

メタゲノムアセンブリを評価する MetaQUAST

2019 5/27 追記 メタゲノミクスは、環境サンプルから直接採取した遺伝物質を研究する。 NGS技術は、クローニングなしに少量の生物からDNAを抽出しショートリードシーケンシングすることを可能にする。しかし、そのような実験で作成されたデータは膨大でノイ…

RNA seqデータの正規化を行いアセンブリ負荷を軽減する ORNA

2019 5/17 誤字修正 シーケンサのスループットの増加および価格の低下に伴い、高カバレッジシーケンシングデータセットの生成は日常的になっている。これは、ゲノムおよびトランスクリプトームのデノボアセンブリのためのいくつかの異なるアプローチの開発を…

metaSPAdes

メタゲノムシーケンシングは、細菌集団の分析ならびに新規な生物および遺伝子の発見のための選択技術として浮上している(Tyson et al, 2004、Venter et al, 2004、Yooseph et al, 2007、Arumugam et al, 2011)。初期のメタゲノミクス研究の1つにおいて、Ve…

リファレンスフリーで低メモリかつ高速にSNVとsmall indelを予測する DiscoSnp ++

次世代シーケンス(NGS)データは生命メカニズムへの前例のないアクセスを提供する。特に、これらのデータは染色体、個体または種間の遺伝的差異を評価することを可能にする。そのような多型は、農学、環境または医学における多数の用途を有する生物学の多く…

メタゲノムのraw fastqからantibiotic resistance genesを再構成する fARGene

2019 5/20 関連ツール追記 抗生物質耐性菌による感染は世界的に増加しており、公衆衛生に大きな脅威をもたらしている[ref.1]。抗生物質耐性は細菌種の固有の特性である場合があるが、その臨床的意味において、それは既存の染色体DNAの突然変異によって、また…

メタゲノムのアセンブリ配列からプラスミド配列を予測する PlasFlow

プラスミドは、変化する環境条件下で急速な進化とそれらの宿主の適応を促進するmobile genetic elementsである(ref1,2)。プラスミドは、宿主細胞内で自律的に複製するの染色体外のDNA断片であり、細菌種において広く存在している。既知のプラスミドの大部…

メタゲノムのraw fastqから高速なtaxonomy assignmentを行う FOCUS

微生物は他のどの細胞生物よりも豊富であり(Whitman、Coleman&Wiebe、1998年)、どの生物が存在し、それらが何をしているのかを理解することが重要である(Handelsman、2004)。多くの環境では、微生物群集の大多数は培養できず、メタゲノムは未培養のゲノ…

メタゲノムの既知および未知バクテリアの存在量を推定single-copy phylogenetic marker genesに基づいて見積もる mOTUs2

2019 4/26 mergeエラー修正及び追記 2019 7/2 インストール追記 微生物は、地球上の生命や環境中の地球化学的プロセスに影響を与える、相互作用する種の複雑な共同体に住んでいる。したがって、それらが形成するコミュニティの構成を正確にプロファイルし、…

machine leraningも併用するmetagenomeのビニングツール Autometa

2019 4/22 誤字修正 2019 5/6 リンク追記 2019 6/23 ランのstep1,2 の説明修正 微生物は、人間を含む地球上のほとんどすべての生物に繋がることが知られており、そこでは微生物は健康、病気および農業に多大な影響を与えると考えられている(ref.1-3)。しか…

メタゲノムのコンタミ除去やメタゲノムのサンプル間比較を行って結果を視覚化する Recentrifuge

2019 4/21 タイトル追加 2019 4/21 オーサーのJose Manuel Martíさんのコメント追加 2019 4/23 タイトル修正 2019 4/26 誤字修正 2019 dockerリンク追記 219 5/9 パラメータ追記 メタゲノミクスによる微生物群集の研究は、環境、臨床、食品、法医学の研究な…

メタゲノムbinsからHGTを検出する MetaCHIP

非培養微生物のゲノム再構築(ビニング)は、微生物群集DNA(メタゲノムDNA)の包括的なシーケンシングおよび新規の計算手法により最近になって実現可能になった[ref. 1-3]。再構成されたゲノムビンは、以前には特徴付けられていなかった微生物群の生化学…

サンプルのコンタミネーションを見積もる Mash Screen

シーケンシング技術がスループットを高めそしてコストを下げ続けるにつれて、シーケンシングされたゲノムのデータベース(例えばNCBI RefSeq [ref.1])は指数関数的成長を続け、それらに対する検索をさらに複雑にしている[ref.2、3]。さらに、rawシーケンス…

メタゲノムのアセンブリcontig.fastaに精度の高い系統情報をアサインするCATと、binned.fastaに精度の高い系統情報をアサインするBAT

2019 2/15 タイトル修正 2019 2/26 コマンドの誤り修正 2019 7/7 インストール説明修正 メタゲノミクスは、自然環境における微生物群集からのDNAのダイレクトシーケンシングであり、生物圏の膨大な微生物配列を発見することによって微生物学の分野に革命をも…

メタゲノムデータからrRNAをターゲットアセンブリし、系統アサイン、定量、比較する phyloFlash

2019 5/9 インストール追記 ショットガンメタゲノミクスは、微生物群集の機能を調査し、それらの系統または分類学的な構成を決定するための強力なツールである(Preprintより ref.1、2)。プライマーバイアス(ref.3)やキメラ配列(ref.4、5)など、PCRベー…

ラップトップで大量のゲノム比較を可能にする BinHash

ゲノム(メタゲノムを含む)の数は急速に増加している。 近い将来、何百万ものゲノム間のペアワイズ距離を推定する必要があるかもしれない。 クラウドコンピューティングを使用しても、そのような推定を実行できるソフトウェアはほとんどない。マルチスレッ…

Bracken

メタゲノミクスは、急速にそして安価に膨大な量のDNA配列を生成する能力に部分的に起因して、急速に成長している研究分野である。ヒトゲノムが2001年に最初に発表されて以来(The International Human Genome Sequencing Consortium、2001; Venter et al、20…

Krona

2019 4/26 わかりにくい文章を修正 メタゲノム研究の重要な成果は、分類群または機能群の存在量の推定である。これらのグループへのアサインおける固有の不確実性は、それらの階層的コンテキストとそれらの予測信頼度の両方を考慮することを重要にしている。…

KrakenUniq

2019 1/17 エラー修正 メタゲノミクス分類手法は、データセット内の各リードに taxonomic identityをアサインすることを試みる。メタゲノミクスデータにはしばしば何千万ものリードが含まれているため、分類は、通常、長さk(k-mers)の短いワードの正確な一…

メタゲノムのアセンブル配列からウィルス由来配列を見つける VirSorter

細菌と古細菌に感染するウイルスはこれまでにサンプリングされたあらゆるタイプのバイオームにありふれており、豊富に存在する。ウイルス - 宿主相互作用は地球化学的循環からヒトの健康まで生態系機能を変化させる(Fuhrman, 1999; Wommack & Colwell, 2000…