macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

ゲノム比較 (comparative genomics)

メタゲノムのファージ配列分析webサーバー VirMiner

2019 6/15 誤字修正 ウイルスは、それらの恒常性および進化に寄与する微生物群集の必須の構成要素である。ヒトの腸内細菌叢のウイルス群集はバクテリオファージが支配的である[ref.1]。ファージは遺伝子水平伝播(HGT)[ref.2]によって細菌群集の構造と機能…

contigやシーケンシングリードのリファレンスへのアラインメントを複数の方法で視覚化する Alvis

2019 6/10 誤字修正 2セットの配列間のアラインメントを見つけることは、バイオインフォマティクスにおける基本的な作業である。ロングリードの解析、アセンブリ結果の評価、またはターゲットキャプチャープロトコルの評価では、リファレンスゲノムまたは遺…

OrthoVenn2

相同遺伝子(Homologous genes)は、主に2つのクラス、オルソログおよびパラログに分類できる。オルソログ遺伝子は、種分化イベント中の共通の祖先から発生し(ref.1)、通常、近縁種間ではsyntenicになる。パラログも共通の祖先を共有しているが、種内のシ…

メタゲノムのコンタミ除去やメタゲノムのサンプル間比較を行って結果を視覚化する Recentrifuge

2019 4/21 タイトル追加 2019 4/21 オーサーのJose Manuel Martíさんのコメント追加 2019 4/23 タイトル修正 2019 4/26 誤字修正 2019 dockerリンク追記 219 5/9 パラメータ追記 メタゲノミクスによる微生物群集の研究は、環境、臨床、食品、法医学の研究な…

スモールゲノムを可視化したり、複数ゲノムを比較して似た領域、異なる領域を可視化できる Gview

グラフィックなゲノムマップは、ゲノムの特徴および配列の特徴を評価するために広く使用されている。 CGView(Circular Genome Viewer)ソフトウェアファミリーは、バクテリア、オルガネラ、ウイルスのゲノムマップを生成するためのツールの人気のあるコレク…

ゲノムを比較してstructural rearrangementsを検出する SyRI

同じ種の半数体ゲノムは、典型的にはそれらのゲノム構造において高い類似性を示す広範囲のco-linear(シンテニー)領域を含む。しかし、これらのシンテニー領域は異なるハプロタイプにおける異なる方向および/または位置によって特徴付けられるstructural r…

複数ゲノムのマルチプルアライメントとシンテニーブロック検出を行う SibeliaZ

マルティプルゲノムアラインメントは、集められたゲノム配列の集まり内の全ての高品質のmultiple local alignmentsを同定する問題である。それはバイオインフォマティクスにおける根本的な問題であり、リアレンジメント分析、系統発生再構築、および進化過程…

スモールゲノムのシンテニーブロックを探して可視化する SiberiaとC-Sibelia

2019 6/9 bioconda インストール追記 同じ微生物種内の株を比較することは、病原性の原因となる遺伝子およびゲノム領域の同定、ならびに感染症の診断および治療に有効であることが証明されている。本稿では、Sibeliaという、反復de Bruijnグラフを使用して複…

HyperLogLogを使って超高速にゲノム距離を計算する Dashing

2019 2/17 テスト環境の誤り修正 Mashツール[ref.1]のリリース以来、MinHashのようなデータスケッチは比較ゲノミクスにおいて有益になっている。それらは大規模データベースからのゲノムのクラスター化[ref.1]、特定のシーケンス内容を持つデータセットの検…

ゲノムをダウンロードして簡単に総当たりANI比較を実行できる pyani

このモジュールはいくつかの代替方法のうちの1つに従って平均ヌクレオチド同一性ANIを計算する。ANIは、DNA-DNAハイブリダイゼーション(DDH )の適切なin silico代替物であると提案されており、したがって種の境界を描写するのに有用となる。 文献中の種の…

ラップトップで大量のゲノム比較を可能にする BinHash

ゲノム(メタゲノムを含む)の数は急速に増加している。 近い将来、何百万ものゲノム間のペアワイズ距離を推定する必要があるかもしれない。 クラウドコンピューティングを使用しても、そのような推定を実行できるソフトウェアはほとんどない。マルチスレッ…

ラージゲノムにも対応した高速に動作するリファレンスガイドアセンブリツール RaGOO

2019 2/12スライド追加 Oxford Nanopore TechnologiesとPacific Biosciencesによって商品化されたロングリードの一分子シーケンシング技術は、高品質の新規真核生物ゲノムアセンブリを促進している[ref.1]。さまざまな動植物種でこれらの技術を使用している…

バクテリアとアーキアのデータベース EzBioCloud

現代のバクテリアと古細菌の分類学の目標の1つは種の客観的定義である。分類を決定するプロセスは、新しいテクノロジーの出現により、時とともに継続的に改善されてきた。 PCRとそれに続く16S rRNA遺伝子のシークエンシングは、バクテリアと古細菌の系統学に…

Minhashを使い、genomic DNA / proteinを高速比較する sourmash

sourmashは、ゲノムデータのMinHash sketchesを作成、比較、操作するためのツールボックスである。MinHash sketchは、大規模なDNAまたはRNAシーケンスコレクションの"signatures"を保存し、Jaccard indexを使用してそれらを比較または検索するための軽量な方…

アセンブリ配列を使って全ゲノムMLST (wgMLST) を行い、アレルプロファイルから系統を比較・再構成する fast-GeP

2018 11/16 tips追記 2019 3/9 docker pullリンク追記 Multilocus sequence typing(MLST)などの遺伝子ベースのタイピング法は、バクテリアpopulationsのゲノム研究のための「ゴールドスタンダード」である(Maiden et al、2013; Sheppard et al、2012)。…

複数ゲノムを比較し、結果をインタラクティブに視覚化する AliTV

2018 11/12 リンクエラー修正 2019 3/9 分かりにくい部分を修正 過去10年にわたるショートリードシーケンシング、ロングリードシーケンシングおよびアセンブリの進歩(Salzberg et al、2011; Chin et al、2013; Hackl et al、2014)は、全ゲノムシーケンシン…

たくさんのスモールゲノムを比較したり、複数メタゲノムアセンブリのde-replicationを行う dRep

2019 5/7 インストール追記 20196/16 パラメータ追記 20196/16 upしたdocker イメージのエラー修正 2019 6/18 link追加 メタゲノム研究により、シーケンシングされ、ドラフト品質ゲノムが解読される微生物ゲノムの数は毎年急速に拡大している。大きなゲノム…

ホストゲノムや汚染配列を検出し、分離を助ける PhylOligo

シーケンシング技術の発展により、複雑な非モデル生物ゲノムおよび生物共同体のゲノムをシーケンシングの標的とすることが可能になった。これらの非モデル生物のいくつかは、それらの環境から単離することが困難だったりin vitroでクローン化ができなかった…

MinHashを使った高速なANI計算ツール fastANI

2019 1/09 cocndaインストール追記 2019 2/12 不要な文を削除 2019 4/12 dockerリンク追加 さまざまな生態学的背景と進化の歴史を持つ原核生物ゲノムのコレクションが公開されている。このゲノムデータの大洪水は、微生物生態学と進化における重要な問題をよ…

ゲノムなどの長い配列同士を比較し、違いをレポートする NucDiff

2018 10/13 コマンドエラー修正 全ゲノムシーケンシング戦略およびアセンブリアプローチの進歩により、一連の配列を互いに比較する方法が必要となっている。共通のクエスチョンは、同じリードセットの異なるアセンブリプログラムから得られたアセンブリ配列…

ANItoolsをwebで実行できるANItools web

単離されたバクテリア株の迅速かつ正確な分類は、医療微生物学、特に全国的または全世界的な広がりの脅威を伴う感染症発症中の最も重要な課題である(論文より ref.1)。しかし、現在の分類方法はすべて、表現型の類似性や化学的性質に基づく方法のみならず…

ラージゲノムにも対応したdot plot解析ツール D-GENIES

ドットプロットは、2組のシーケンスを視覚的に比較するために一般的に使用される。それらは挿入、欠失、逆位またはリピートを容易に理解できる方法で提示する。可変の線の太さ、線の形または色を使用して類似点の差異を表すことができる。産生されるゲノムア…

mauveを使いcontigをリファレンスfasta順に並べ替える

2019 6/11追記 http://darlinglab.org/mauve/user-guide/reordering.html より。 インストール mac os 10.13でテストした。 mauveのHPからインストーラーをダウンロードする。 http://darlinglab.org/mauve/download.html ラン 1、起動したらメニューのTools…

既知の二次代謝産物生合成遺伝子クラスターを検出する antiSMASH

2019 6/17 インストール追記 二次代謝産物または特殊代謝産物とも呼ばれる天然の産物(Natural products)は、多くの薬の基礎であり、農業および栄養学の応用にとって重要な分子でもある。さらに、分子生物学および細胞生物学の多くの側面を研究する化学プロ…

k-merを使い 進化距離や相同性を高速計算する Kmer-db

Preprintより 何千もの異なる生物のシーケンシング解析の過程で大量のデータが生成された(100K Pathogen Genome Project(Weimer el al、2017、NCBI Pathogen Detection(https://www.ncbi.nlm.nih.gov/ pathogens) )、これは迅速な分析方法を要求する。 …

ゲノムのドットプロット解析を行うツール Dot

ゲノムをMUMmerのnucmerコマンドで相互にアライメントさせた後、ドットプロット(wiki)形式で視覚化するためのツール。 本体 Github(python3.6) https://github.com/dnanexus/dot また、このリポジトリをcloneし、Webブラウザでindex.htmlファイルを開く…

構造変化のリードアライメント状況やゲノム比較結果を可視化する Ribbon

Visualizationは、現在のゲノム革命において、バリアント、発現パターン、進化による変化、および他の多くの関係を検査し、理解するために非常に重要な役割を果たす(Preprint ref.1~3)。しかし、構造変化可視化時のリードとリファレンス、またはリファレン…

関心のあるバクテリアゲノムのシグネチャを迅速に検出する Neptune

安価かつ迅速に大量のシーケンスを生成する能力は、生物、特にバクテリアのような比較的小さなゲノムを有する生物全体のゲノムを研究する能力を可能にした。計算生物学者は、歴史的に、少数のバクテリアゲノムを比較し、ヌクレオチド、遺伝子およびゲノムス…

CircosをWeb上 で利用できる ClicO FS

Circos(Krzywinski et al、2009)(HP)は、ビジュアルデータを環状形式で表現するPerl言語ベースのツールである。ネイティブのCircosソフトウェアは、コマンドラインインターフェイス(CLI)を介して提供されている。ソフトウェアのインストールと設定は、…

MinHashを使い高速にゲノムを比較する MASH

2019 4/12 dockerリンク追加 BLASTが1990年に初めてpublishされたとき、公開されたアーカイブには5000万塩基以下の塩基配列しか存在しなかった[論文より ref.2]。現在では、1つのシーケンシング機器1回の実行で1兆塩基を超えるシーケンス生成が可能である[re…