macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

表現型や遺伝子情報からどんな菌かを絞り込めるwebツール BaFF

現在のシナリオでは、生物学的データの大量生成は、特に原核生物のような多数の生物に関していくつかの実験的および計算技術の結果として、ますます一般的になっている。例えば、メタゲノミクス実験からは、所与の試料(例えば、腸、海水など)中でDNA断片か…

HyperLogLogを使って超高速にゲノム距離を計算する Dashing

2019 2/17 テスト環境の誤り修正 Mashツール[ref.1]のリリース以来、MinHashのようなデータスケッチは比較ゲノミクスにおいて有益になっている。それらは大規模データベースからのゲノムのクラスター化[ref.1]、特定のシーケンス内容を持つデータセットの検…

ゲノムのCRISPR座位を見つけるwebツール CRISPRCasFinder

Clustered regularly interspaced short palindromic repeats(CRISPR)および関連タンパク質(Cas)は、CRISPR-Casシステムを形成する。 CRISPRは、スペーサーと呼ばれる同じサイズのユニークな配列で区切られた、24〜50 bpの長さのダイレクトリピートまた…

メタゲノムのアセンブリcontig.fastaに精度の高い系統情報をアサインするCATと、binned.fastaに精度の高い系統情報をアサインするBAT

2019 2/15 タイトル修正 メタゲノミクスは、自然環境における微生物群集からのDNAのダイレクトシーケンシングであり、生物圏の膨大な微生物配列を発見することによって微生物学の分野に革命をもたらした。 DNAシーケンシングのスループットが向上するにつれ…

サンガーシーケンシングリードを自動でアセンブリしてアノテーションを行うwebサーバ deFUME

機能選択は、遺伝子の発見および機能的に検証されたアノテーションのための強力な技術を表す[ref.1、2]。この手法は、ランダムにクローニングされたゲノムDNAまたはメタゲノムDNAを、通常は短い(1〜3 kb)DNA断片として発現ベクターに組み込むことに依存し…

rRNAを使ってバクテリアのゲノム構造を調べる Socru

バクテリアゲノムは構造的リアレンジメントを受けることができるダイナミックな実体(entities)である。これらのリアレンジメントは、リボソームrRNAオペロンおよびファージを含むリピート配列周辺で相同組換えを介して起こる傾向がある(Brüssow, et al., …

メタゲノムデータからrRNAをターゲットアセンブリし、系統アサイン、定量、比較する phyloFlash

ショットガンメタゲノミクスは、微生物群集の機能を調査し、それらの系統または分類学的な構成を決定するための強力なツールである(Preprintより ref.1、2)。プライマーバイアス(ref.3)やキメラ配列(ref.4、5)など、PCRベースのアンプリコンメソッドに…

ゲノムをダウンロードして簡単に総当たりANI比較を実行できる pyani

このモジュールはいくつかの代替方法のうちの1つに従って平均ヌクレオチド同一性ANIを計算する。ANIは、DNA-DNAハイブリダイゼーション(DDH )の適切なin silico代替物であると提案されており、したがって種の境界を描写するのに有用となる。 文献中の種の…

遺伝子水平伝播を検出する kvasirHGT

マイクロバイオームの組成を特徴付けること、そして自然システムの生態学、農業および人間の健康におけるそれらの重要性を理解することにおいて、大きな進歩がなされてきた。しかしながら、これらの進歩にもかかわらず、マイクロビオームの多様性、構造、お…

pacbioのアライナー pbmm2

pbmm2はminimap2のC API用のSMRT C ++ラッパーである。 その目的は、ネイティブのPacBio入出力をサポートし、推奨パラメータセットでソート出力をon-the-fly(複数の処理をまとめて)で生成することである。 BAMがpbmm2への入力として使用されている場合は、…

オルソログデータベース OrthoDB

ゲノムシーケンシングは、遺伝子の完全なレパートリーを明らかにし、分子レベルでの細胞プロセスの研究を可能にする可能性を有する、生物の分子調査のための最も包括的な方法である。相同性、共有された祖先の証拠としての遺伝子配列の類似性認識は、他の種…

ラップトップで大量のゲノム比較を可能にする BinHash

ゲノム(メタゲノムを含む)の数は急速に増加している。 近い将来、何百万ものゲノム間のペアワイズ距離を推定する必要があるかもしれない。 クラウドコンピューティングを使用しても、そのような推定を実行できるソフトウェアはほとんどない。マルチスレッ…

ラージゲノムにも対応した高速に動作するリファレンスガイドアセンブリツール RaGOO

2019 2/12スライド追加 Oxford Nanopore TechnologiesとPacific Biosciencesによって商品化されたロングリードの一分子シーケンシング技術は、高品質の新規真核生物ゲノムアセンブリを促進している[ref.1]。さまざまな動植物種でこれらの技術を使用している…

fusion geneを検出する FuSeq

染色体再編成の一種である遺伝子融合は、発ガンにおいて重要な役割を果たすことがわかっている[ref.1、2]。それはキメラタンパク質の増加、ガンの危険性および腫瘍の表現型と密接に関連しており、それらはすべて臨床解釈の可能性を秘めている[ref.2]。融合遺…

メタゲノムのphage contigからホスト原核生物ゲノムを予測する WIsH

ウイルスは、ほとんどすべての既知の生態系の重要な構成要素である(Edwards and Rohwer、2005)。それらは、優占種を枯渇させることによって海洋から人間の腸までの様々な環境における生物多様性を調節し(De Paepe et al、2014; Lehahn et al、2014)、海…

共通 / 非共通の遺伝子リストなどをベン図やヒートマップで視覚化する intervene

次世代のシークエンシングベースのハイスループットアッセイによって生成されたトランスクリプトームデータ、ゲノムデータ、およびエピゲノムデータの効果的な可視化は、大きな関心の対象となっている。そのようなアッセイによって生成されたデータセットの…

In vitro合成用にゲノムを分割する Genome Partitioner

40年以上前に制限エンドヌクレアーゼが発見されて初めて使用されて以来、DNAを単一および複数のコンストラクトに組み立てる能力が分子生物学を推進してきた[論文より ref.1]。過去10年間で、合成生物学の分野を形作り、ゲノム規模の生物学的オペレーティング…

Bracken

メタゲノミクスは、急速にそして安価に膨大な量のDNA配列を生成する能力に部分的に起因して、急速に成長している研究分野である。ヒトゲノムが2001年に最初に発表されて以来(The International Human Genome Sequencing Consortium、2001; Venter et al、20…

遺伝子水平伝播をシミュレートする HgtSIM

2019 2/9 タイトル誤字修正 Horizontal gene transfer (HGT) は、微生物の進化と適応における重要な力として認識されている(Soucy、Huang&Gogarten、2015)。単離された微生物のドラフトまたはフィニッシュしたゲノム中のHGTを同定する多数のパイプライン…

バクテリアとアーキアのデータベース EzBioCloud

現代のバクテリアと古細菌の分類学の目標の1つは種の客観的定義である。分類を決定するプロセスは、新しいテクノロジーの出現により、時とともに継続的に改善されてきた。 PCRとそれに続く16S rRNA遺伝子のシークエンシングは、バクテリアと古細菌の系統学に…

16S/18S rRNAのV1~V9領域の配列を取り出す V-Xtractor

V-Xtractorは、隠れマルコフモデルを使用して、16S/18S rRNAの定義済みの超可変配列セグメント(V1〜V9)を検索、検証、および抽出する。99.6%の検出効率と低い偽陽性感受性により、このツールはデータの信頼性を向上させ、その後のコミュニティアッセイで…

DADA2

Preprintより 微生物群集の人間および環境への健康への重要性は、それらの効率的な特徴付けのための方法に動機を与えている。最も一般的で費用効果の高い方法は、標的遺伝子エレメントの増幅および配列決定である。 16S rRNA [ref.1]、ITS領域[ref.2]または1…

アンプリコンシーケンシングのアセンブルとクオリティフィルタリングツール moira

16SリボソームRNAなどのマーカー遺伝子のハイスループットシークエンシングは、複雑な微生物群集の分析においてこれまで到達できなかった詳細なレベルの分析を可能にするため、微生物生態の研究者にとって非常に貴重なツールとなっている。 Roche 454、Illum…

EMIRGE

微生物群集構成の特徴付けは、系統発生マーカー遺伝子、最も一般的にはリボソームスモールサブユニットRNA(SSU rRNA)遺伝子[ref.1]を用いて行われることが最も多い。伝統的に、rRNA配列は増幅、クローニング、およびサンガーシーケンシングによって決定さ…

リアルデータから学習したエラープロファイルを割り当てるペアエンドマージツール NGmerge

ハイスループットDNAシーケンス技術の中で、Solexa / Illuminaプラットフォーム[ref.1]は、1回の実行で最大量のシーケンスデータを作成する[ref.2]。この技術の1つのユニークな特質は、与えられたDNA分子の両端からシーケンスリードを生成するその能力である…

haploidスモールゲノムバリアントコーラー; breseqの出力からコントロールの変異を除く breseq-rm-ctrl

タイトルの通りの機能を持つコマンド。コントロール株でもコールされた変異を除くために使う。breseq出力のhtmlファイルを入力に使う。出力もhtmlファイルになる。 Breseq本体 http://barricklab.org/twiki/bin/view/Lab/ToolsBacterialGenomeResequencing …

taxonomy ID、学名、系統情報など相互変換できるツール taxonkit

2019 1/24 リネージュコマンドのミス修正 NCBI taxonomy databaseは、公共のシーケンスデータベースに含まれるすべての生物の分類(以後taxonomy)および命名法をまとめたものである(NCBI、2018)。taxonomyデータベースの一般的な操作には、分類名からのta…

Krona

メタゲノム研究の重要な成果は、分類群または機能群の存在量の推定である。これらのグループへのアサインおける固有の不確実性は、それらの階層的コンテキストとそれらの予測信頼度の両方を考慮することを重要にしている。しかし、メタゲノムデータを視覚化…

multi-omicsデータセットを可視化するCircosのラッパーツール MS-Helios

マイクロアレイ、次世代シークエンシング、および質量分析(MS)などの革新的なハイスループット技術は、生物学的システムに対する我々の理解を大いに進歩させた。これらのすぐに利用可能で費用対効果に優れた包括的なデータ取得方法により、システム生物学…

pblat: マルチスレッドに対応したblat

Blat [論文より ref.1 link]は、DNA、RNAおよびタンパク質配列をリファレンスゲノムにマッピングするように設計された配列アラインメントツールである。これは一般に、リファレンスゲノム内の配列の検索、closely relatedな種のゲノムからの相同配列の発見、…