macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

様々な種のバリアント情報をまとめたデータベース Genome Variation Map(GVM)

 

Genome Variation Map (GVM; http://bigd.big.ac.cn/gvm/) は、ゲノム変異の公開データリポジトリである。幅広い種のゲノム変異を収集・統合することを目的としており、世界中から様々な変異タイプの投稿を受け付けており、世界中の研究活動を支援するために、公開されているすべてのデータへの無料のオープンアクセスを提供している。特に旧バージョンと比較して、現行バージョンのGVMでは、合計22種、115プロジェクト、55 935サンプル、463 429 609バリアント、66 220アソシエーション、56投稿(2020年9月7日現在)が新たに追加されている。現在のリリースでは、GVMは13の動物、25の植物、3のウイルスを含む41の種からの合計約9億6000万のバリアントを格納している。さらに、64,819個の個々の遺伝子型と260,393個の手動でキュレーションされた高品質な遺伝子型間の関連付けが組み込まれている。GVMは設立以来、世界中のユーザーから提出された43,754サンプルのゲノム変異データをアーカイブ化し、100万件以上のデータダウンロードリクエストに対応してきた。GVMは、ナショナル・ゲノミクス・データセンター(NGDC)の中核的なリソースとして、多様な種の貴重なゲノム変異を提供しており、機能的ゲノミクス研究と分子育種の両方において重要な役割を果たしている。

 

webサービス

GVM(https://bigd.big.ac.cn/gvm/)にアクセスする。

f:id:kazumaxneo:20201113230448p:plain

 

ここではデータのサブミット手順などについては触れず、browse、search、そしてDownloadの機能についてだけ簡単に紹介する。

 

Browse

f:id:kazumaxneo:20201113234146p:plain

 

Animalからジャイアントパンダの#sampleの34をクリック。

f:id:kazumaxneo:20201113234259p:plain

 

34サンプルの地理的分布が表示された。

f:id:kazumaxneo:20201113234346p:plain

f:id:kazumaxneo:20201113234349p:plain

表のリンクはNCBI Biosampleや引用元の論文(Pubmed)繋がっている。

 

 

Search

Searchタブでは、シークエンシングのタイプ、遺伝子名、MAF、Clinvar、GWAS-catalogue、Pfamなど様々な方法でバリアントを検索できる。

 

ヒトなど42の生物に対応している。ウィルスにはSARS-CoV-2も含まれている。

f:id:kazumaxneo:20201113230955p:plain

様々な方法で検索できる。以下はヒトのGWAS-Catalogタブ。

f:id:kazumaxneo:20201113231007p:plain

 

humanのGWAS catalogueの1カテゴリーで絞り込んで検索した。dbSNPとMAFのカラムが確認できる。ここからさらにclinvarのeffectやMAFの頻度、領域など指定してバリアントを絞り込める。

f:id:kazumaxneo:20201113231410p:plain

遺伝子名はEnsembl humanにリンクしている。

 

Download

SNPやindelのファイル(VCFやFASTA形式)をダウンロードできる。

f:id:kazumaxneo:20201113232506p:plain

2020年11月現在、37種からのバリアントデータをダウンロード可能。

 

引用

Genome Variation Map: a worldwide collection of genome variations across multiple species
Cuiping Li, Dongmei Tian, Bixia Tang, Xiaonan Liu, Xufei Teng, Wenming Zhao, Zhang Zhang, Shuhui Song
Nucleic Acids Research, Published: 10 November 2020