macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

ゲノムスケールのデータを集めた公開リポジトリ Genome Warehouse

 

 Genome Warehouse (GWH) は、幅広い種のゲノムアセンブリデータを収蔵する公開リポジトリであり、ゲノムデータの提出、保存、公開、共有のための一連のウェブサービスを提供している。China National Center for Bioinformation (CNCB, https://bigd.big.ac.cn/)の一部である National Genomics Data Center (NGDC)のコアリソースの1つとして、GWHはフルゲノムと部分ゲノム(葉緑体ミトコンドリア、プラスミド)の異なるアセンブリレベルの配列の両方を受け入れ、既存のゲノムアセンブリの更新も受け付けている。アセンブリごとに、ゲノム配列やアノテーションに加えて、生物学的プロジェクトやサンプル、ゲノムアセンブリー情報などの詳細なゲノム関連メタデータを収集している。高品質なゲノム配列とアノテーションアーカイブ化するために、GWHでは品質管理のための統一された標準化された手順を備えている。基本的なブラウズ・検索機能に加え、公開されたすべてのゲノム配列・アノテーションをJBrowseで可視化することができる。2020年12月までに、GWHは949種の多様性をカバーする17,264件の直接投稿を受け、そのうち3370件を公開している。GWHは全体として、ゲノムスケールのデータ管理のための重要なリソースとして機能し、世界中の研究活動をサポートするために、無料で一般にアクセス可能なデータを提供している。GWH は https://bigd.big.ac.cn/gwh/ で一般公開されている。

 

Documentation, FAQ

https://bigd.big.ac.cn/gwh/documents

 

webサービス 

http://bigd.big.ac.cn/gwh/にアクセスする。

f:id:kazumaxneo:20210221111929p:plain


キーワード検索できる。”panda”とタイプ。

f:id:kazumaxneo:20210520002927p:plain

 

43件ヒットした。

f:id:kazumaxneo:20210520002953p:plain

 

レッサーパンダ

f:id:kazumaxneo:20210520003317p:plain

Bioproject ID, Biosample ID, Accession No, Submitter、アッセンブリ、Publicationなどの情報などが表示されている。

 

 

Browseタブ

2021年5月現在、8900超のゲノムが登録されている。ゲノムやアノテーションは右端のリンクからダウンロードできる。

Genome Warehouse

f:id:kazumaxneo:20210520004511p:plain

 

Statisticsタブ

統計情報。2021年5月現在、7145の動物ゲノム、1584の植物ゲノムアセンブリ、6681のメタゲノムアセンブリ、などが登録されている(完全長アセンブリはcompleteの行)。

f:id:kazumaxneo:20210520005402p:plain



データをsubmitする流れはDocumentationを確認して下さい。

引用

Genome Warehouse: A Public Repository Housing Genome-scale Data
Meili Chen, Yingke Ma, Song Wu, Xinchang Zheng, Hongen Kang, Jian Sang, Xingjian Xu, Lili Hao, Zhaohua Li, Zheng Gong, Jingfa Xiao, Zhang Zhang, Wenming Zhao, Yiming Bao

bioRxiv, Posted February 10, 2021

 

関連