macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

オルガネラゲノムなどの小さなゲノム配列を比較し、相同/非相同な遺伝子を視覚化するwebサービス geneCo

 

 比較ゲノミクスは、主に生物間の共通の特徴の非常に詳細な視覚化の作成に焦点を当てている。比較ゲノミクスの主な原則は、基本的な生物学的類似性または遺伝子レベルでの生物間のDNAシーケンスから生じるゲノム機能の違いを比較することである。ゲノム機能には、DNA配列、遺伝子の内容、遺伝子の順序、調節配列、その他のゲノム構造が含まれる。したがって、ゲノム配列を具体的に整列させ、生物間でゲノムの特徴を比較するには、比較ゲノムアプローチが必要である。比較ゲノミクスは、生物間の進化的関係を研究し、保存されているか、固有のゲノム機能を表す遺伝子を識別するための強力なツールも提供する。

 Artemis比較ツール(ACT)(Barrell et al、2005)、Mauve(Darling et al、2004)、BLAST ring image generator(BRIG)(Alikhan et al、2011)、Circos( Schnable et al、2009)は、複数のゲノムアセンブリ用に開発された。 ACTは2つ以上のゲノム比較を視覚化し、いくつかのDNA配列を比較するのに最も役立ち、違いのある領域を簡単に見つけてズームインできる。このツールは、GenBankエントリやFASTAシーケンスなど、許可されているさまざまな入力形式からのシーケンスの類似性を表示する。 Mauveは全ゲノムをアラインさせ、SNP、差異のある領域、相同なブロックなどの形式で出力を表示する。 Mauveは、Mauve Contig Metricsを使用してアセンブリの品質をリファレンスに対して評価するためにも使用できる。 BRIGは、BLAST比較を精巧な環状図で視覚化することにより、全ゲノム比較のグローバルビューを提供する。 BRIGは、複数のゲノムの比較に適している。ただし、各ゲノムはGUIから入力する必要があるため、十数個以上を比較することは困難である。 Circosは入力データと設定の両方にプレーンテキストファイルを使用し、後者は各データトラックの配置と形式を制御する。データと構成ファイルの両方を自動的に生成する機能により、CircosはWebベースのデータベースマイニングと視覚化への組み込みを非常に受け入れやすくなる。

 ゲノムを比較するための多くのバイオインフォマティクスのアプローチにもかかわらず、比較DNA分析のためのツールの開発は課題のままである。なぜなら、保存されていない配列である可能性のあるミスマッチ遺伝子の同定は、進化の観点からも意味がある。 GenBankファイル形式のユーザー定義データから得られる複数のゲノム構造を調整および比較するために、視覚化および比較ゲノムツールであるgeneCoを提案する。比較されている複数の生物間の逆位、ゲイン、ロス、重複、および遺伝子再編成に関する情報は、geneCoによって提供される。 geneCoのもう1つの目的は、生物学者が快適に使用できるWebベースのユーザーインターフェイスを提供し、使いやすいオプションを提供し、結果をWebブラウザに表示することである。

 

 

webサービス

https://bigdata.dongguk.edu/geneCo/#/index/main にアクセスする。

f:id:kazumaxneo:20200213000400p:plain

 

1、Draw genome map

f:id:kazumaxneo:20200213000828p:plain


ジョブタイトルを記入し、GenBankファイルを指定する。

f:id:kazumaxneo:20200213001642p:plain

 

ファイルを選択する際は複数同時に読み込む。ここではテストデータ(sample link)の3つのオルガネラゲノムを描画する。

f:id:kazumaxneo:20200213000636p:plain

 

出力形式を指定してsubmitする。

f:id:kazumaxneo:20200213001919p:plain

オルガネラゲノムのような小さなファイルであれば、結果は10秒程度で出力される。ここでは3つのGenBankを指定したため、それぞれが横に並んで描画された。

f:id:kazumaxneo:20200213002702p:plain

 

 

2、Map comparison

f:id:kazumaxneo:20200213003106p:plain

手順は1と変わらない。複数のGenBankファイルを指定してsubmitする。

f:id:kazumaxneo:20200213003805p:plain

出力

f:id:kazumaxneo:20200213004013p:plain

拡大する。遺伝子アノテーションを含むため、ゲノム構造内の一致または不一致の遺伝子を目視で区別できる。

f:id:kazumaxneo:20200213003951p:plain

 

geneCoの重要な重要な特徴の1つは、ミスマッチする遺伝子を識別する機能をサポートしていることである。これは、競合ツールにはない特徴で、 比較対象のゲノム間で保存されていない遺伝子を強調して視覚化できる。

f:id:kazumaxneo:20200213010338p:plain

 

 

 

 

補足

Gap between genome mapsの値を減らして間隔を詰めると見やすくなる。ただし、詰めすぎると表記内容が重なってしまう。調整する必要がある。

f:id:kazumaxneo:20200213004342p:plain

 

引用

geneCo: a visualized comparative genomic method to analyze multiple genome structures
Jaehee Jung, Jong Im Kim, Gangman Yi
Bioinformatics, Volume 35, Issue 24, 15 December 2019, Pages 5303–5305