macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

ゲノム比較 (comparative genomics)

MAF(Multiple Alignment Format)を様々な条件でフィルタリングする MafFilter

進化的比較ゲノム解析および集団ゲノム解析は、2つ以上のゲノム間の相同なヌクレオチド位置を記録するゲノム配列のアラインメントに基づいている。遺伝子アラインメントは3種類の文字のedit(ミスマッチ、挿入および欠失)のみを用いて記載されているが、ゲ…

ゲノム間のオロソログを予測してシンテシーブロックとして視覚化する Synima

オーソロガス遺伝子は、タンパク質または機能的RNA分子をコードする核酸のセクションであり、単一の祖先遺伝子から派生し、その後に種分化により分岐している[ref.1、2]。対照的に、パラロガスな遺伝子は、単一の種内の重複から生じたものである。 OrthoDB […

(初心者向け)mauveを使ってバクテリアゲノムを比較する

よく似たゲノム同士を直接比較して、変異がある遺伝子を検出したいことがあります。ここでは、コマンドラインのツールや商用ツールに頼らず、GUIで動作するツールを使ってゲノム比較する手順を書いてみます。 1、ソフトのインストール 前にも紹介しましたが…

ゲノムを分類、クラスタリングし、視覚化する JGI-GenomeConstellation

2019 11/3 タイトル修正 これまでに特定されていない分類群を含む分類群の分類は、南極の乾燥した谷にある永久に氷に覆われた湖を含む、記載されていない生息地の微生物群集を特徴付ける重要なタスクである。現在の監視された系統発生ベースの方法は、そのよ…

普遍的な single-copy proteinsに基づいてバクテリアとアーキアを分類するGenome Taxonomy Database (GTDB) とその分類ツール GTDB-Tk

2019 10/28 誤字修正、コメント追加 2019 11/5 誤字修正、捕捉追加 2019 11/6 追記 Preprintより 過去数年のシーケンスされた微生物ゲノムの急速な拡大により、ゲノム配列に基づいた詳細な分類の構築が可能になった(Segata et al、2013; Hugenholtz et al、…

(植物など)ゲノムアセンブリとアノテーションのクオリティを分析するwebサーバー GenomeQC

過去数十年にわたって、Genlisea aureaの63 Mb [ref.1]からPinus taedaの22 Gb [ref.2]までのサイズの多数の植物ゲノムアセンブリが生成された。このようなプロジェクトから生成されたゲノムリソースは、改良された作物品種の開発に貢献し、ゲノムサイズ、構…

コア遺伝子有無など視覚化できるスケーラブルな原核生物間のゲノム比較ツール Chromatiblock

完全な原核生物ゲノム間の構造的変化を視覚化することは、系統の違いの遺伝的基盤を特定するために重要である。これは通常、連続したペアワイズ比較または複数の線形の結果を線形レイアウトまたは環状レイアウトで表示することで実現される。シリアルペアワ…

ゲノムや特定の領域の配列比較結果をシンテニーブロックで視覚化する Easyfig

比較ゲノミクスには、特にシンテニー領域の挿入、欠失、および変異の特定のための、シーケンシングされたゲノムの比較が含まれる。複数のゲノムの特定の領域間のアライメントを視覚化することは、株や種の間の表現型の変化の根底にある遺伝子型の違いを識別…

BWTによる高速なゲノム間アラインメントを行う GSAlign

パーソナルゲノミクスと比較ゲノミクスは、臨床診療とゲノム研究においてますます重要になっている2つの分野である。両方のフィールドは、配列の保存と構造の変化を発見するためにシーケンスアラインメントが必要である。ゲノム配列のアラインメントを処理す…

アセンブリ結果を評価する dnAQET

次世代シーケンス(NGS)テクノロジーの導入により、大量のゲノムシーケンスデータを生成できるようになった。これにより、個人のゲノムをシーケンシングしてde novoアセンブリすることが可能になった。約10年前、NGSテクノロジーにより、二倍体de novoゲノ…

バクテリア/アーキアのゲノム距離を計算するwebツール GGDC

DNA-DNAハイブリダイゼーション(DDH)は、古細菌および細菌種の描写のための分類学的ゴールドスタンダードとして現在も使用されているウェットラボ法である。 2つのそれぞれの生物のゲノムDNAがDDHの類似性が70%未満であることが明らかになった場合、これ…

微生物ゲノムアセンブリの品質と比較ゲノミクス(correspondence要約)

私(論文のオーサー;hereafter、私)の最近の研究では、低品質の細菌ゲノム配列(ここでは「多くのコンティグを含むゲノム配列アセンブリ、最終的には明らかなミスアセンブリと未解決のプラスミド配列」と定義)を扱ってきた。主要な問題は、ゲノムのクオリ…

Genomic featureの座標を変更する UCSC liftOver

ヒトの場合は代表的なリファレンスゲノムもいまだ不完全であり、更新が繰り返されている。また、ゲノムがFinishしているスモールゲノムでも、株や系統の違いによる座標の違いがあり、研究によってはリファレンスゲノムを更新し、coding reginやexonなどのgen…

アラインメントのPAFファイルを扱うユーティリティ paftools

2019,11,15 paftools.js call のコマンドエラー修正 2019 11/26 vatiantコールコマンドのエラー修正 Minimap2には、PAFフォーマットのアライメントを処理する(java)スクリプトpaftools.jsが付属している。paftoolsを使うことで、 アセンブリをリファレンス…

アラインメントフリーの配列比較GUIツール CAFE

配列比較は、分子配列間の関係を研究するために広く使用されている。配列比較のための主なツールは、global(ref.1)およびlocal(ref.2)シーケンスアラインメントを含むアラインメントベースの方法である。 BLAST(ref.3)のようなアラインメントベースの…

PGAPとPGAP-Xを組み込んだバクテリアのパンゲノム解析webサーバー PGAweb

2019 7/21追記 2019 10/2 コードエラー修正 2019 11/2 誤字修正 "PGAP-X: extension on pan-genome analysis pipeline"より パンゲノムの概念は2005年に提案されて以来[ref.1、2]、過去10年間でバクテリアゲノムの進化と動態を調査するために急速に採用され…

メタゲノムのファージ配列分析webサーバー VirMiner

2019 6/15 誤字修正 ウイルスは、それらの恒常性および進化に寄与する微生物群集の必須の構成要素である。ヒトの腸内細菌叢のウイルス群集はバクテリオファージが支配的である[ref.1]。ファージは遺伝子水平伝播(HGT)[ref.2]によって細菌群集の構造と機能…

contigやシーケンシングリードのリファレンスへのアラインメントを複数の方法で視覚化する Alvis

2019 6/10 誤字修正 2019 6/21 リンク追加 2セットの配列間のアラインメントを見つけることは、バイオインフォマティクスにおける基本的な作業である。ロングリードの解析、アセンブリ結果の評価、またはターゲットキャプチャープロトコルの評価では、リファ…

OrthoVenn2

注意 2019 6/24 追記 6/25 編集 すでに比較されているデータについては問題ありませんが、手持ちのmulti-fsstaをアップロードして調べる場合、シングルラインのfastaににしておかないとそれぞれのfastaの先頭行のみ使ってしまうようです。以下のperlスクリプ…

メタゲノムのコンタミ除去やメタゲノムのサンプル間比較を行って結果を視覚化する Recentrifuge

2019 4/21 タイトル追加 2019 4/21 オーサーのJose Manuel Martíさんのコメント追加 2019 4/23 タイトル修正 2019 4/26 誤字修正 2019 dockerリンク追記 219 5/9 パラメータ追記 メタゲノミクスによる微生物群集の研究は、環境、臨床、食品、法医学の研究な…

スモールゲノムを可視化したり、複数ゲノムを比較して似た領域、異なる領域を可視化できる Gview

グラフィックなゲノムマップは、ゲノムの特徴および配列の特徴を評価するために広く使用されている。 CGView(Circular Genome Viewer)ソフトウェアファミリーは、バクテリア、オルガネラ、ウイルスのゲノムマップを生成するためのツールの人気のあるコレク…

ゲノムを比較してstructural rearrangementsを検出する SyRI

同じ種の半数体ゲノムは、典型的にはそれらのゲノム構造において高い類似性を示す広範囲のco-linear(シンテニー)領域を含む。しかし、これらのシンテニー領域は異なるハプロタイプにおける異なる方向および/または位置によって特徴付けられるstructural r…

複数ゲノムのマルチプルアライメントとシンテニーブロック検出を行う SibeliaZ

マルティプルゲノムアラインメントは、集められたゲノム配列の集まり内の全ての高品質のmultiple local alignmentsを同定する問題である。それはバイオインフォマティクスにおける根本的な問題であり、リアレンジメント分析、系統発生再構築、および進化過程…

スモールゲノムのシンテニーブロックを探して可視化する SiberiaとC-Sibelia

2019 6/9 bioconda インストール追記 同じ微生物種内の株を比較することは、病原性の原因となる遺伝子およびゲノム領域の同定、ならびに感染症の診断および治療に有効であることが証明されている。本稿では、Sibeliaという、反復de Bruijnグラフを使用して複…

HyperLogLogを使って超高速にゲノム距離を計算する Dashing

2019 2/17 テスト環境の誤り修正 Mashツール[ref.1]のリリース以来、MinHashのようなデータスケッチは比較ゲノミクスにおいて有益になっている。それらは大規模データベースからのゲノムのクラスター化[ref.1]、特定のシーケンス内容を持つデータセットの検…

ゲノムをダウンロードして簡単に総当たりANI比較を実行できる pyani

このモジュールはいくつかの代替方法のうちの1つに従って平均ヌクレオチド同一性ANIを計算する。ANIは、DNA-DNAハイブリダイゼーション(DDH )の適切なin silico代替物であると提案されており、したがって種の境界を描写するのに有用となる。 文献中の種の…

ラップトップで大量のゲノム比較を可能にする BinHash

ゲノム(メタゲノムを含む)の数は急速に増加している。 近い将来、何百万ものゲノム間のペアワイズ距離を推定する必要があるかもしれない。 クラウドコンピューティングを使用しても、そのような推定を実行できるソフトウェアはほとんどない。マルチスレッ…

ラージゲノムにも対応した高速に動作するリファレンスガイドアセンブリツール RaGOO

2019 2/12スライド追加 2019 10/29 インストール方法修正、論文引用とtwitter追記 2019 10/30 コマンド微修正 2019 11/5 コマンド記載ミス修正 Oxford Nanopore TechnologiesとPacific Biosciencesによって商品化されたロングリードの一分子シーケンシング技…

バクテリアとアーキアのデータベース EzBioCloud

2019 7/5 関連ツール追記について追記 現代のバクテリアと古細菌の分類学の目標の1つは種の客観的定義である。分類を決定するプロセスは、新しいテクノロジーの出現により、時とともに継続的に改善されてきた。 PCRとそれに続く16S rRNA遺伝子のシークエンシ…

Minhashを使い、genomic DNA / proteinを高速比較する sourmash

2019 7/5 インストールエラー修正 2019 10/2 twitter追記 sourmashは、ゲノムデータのMinHash sketchesを作成、比較、操作するためのツールボックスである。MinHash sketchは、大規模なDNAまたはRNAシーケンスコレクションの"signatures"を保存し、Jaccard i…