Genome Warehouse (GWH) は、幅広い種のゲノムアセンブリデータを収蔵する公開リポジトリであり、ゲノムデータの提出、保存、公開、共有のための一連のウェブサービスを提供している。China National Center for Bioinformation (CNCB, https://bigd.big.ac.cn/)の一部である National Genomics Data Center (NGDC)のコアリソースの1つとして、GWHはフルゲノムと部分ゲノム(葉緑体、ミトコンドリア、プラスミド)の異なるアセンブリレベルの配列の両方を受け入れ、既存のゲノムアセンブリの更新も受け付けている。アセンブリごとに、ゲノム配列やアノテーションに加えて、生物学的プロジェクトやサンプル、ゲノムアセンブリー情報などの詳細なゲノム関連メタデータを収集している。高品質なゲノム配列とアノテーションをアーカイブ化するために、GWHでは品質管理のための統一された標準化された手順を備えている。基本的なブラウズ・検索機能に加え、公開されたすべてのゲノム配列・アノテーションをJBrowseで可視化することができる。2020年12月までに、GWHは949種の多様性をカバーする17,264件の直接投稿を受け、そのうち3370件を公開している。GWHは全体として、ゲノムスケールのデータ管理のための重要なリソースとして機能し、世界中の研究活動をサポートするために、無料で一般にアクセス可能なデータを提供している。GWH は https://bigd.big.ac.cn/gwh/ で一般公開されている。
Documentation, FAQ
https://bigd.big.ac.cn/gwh/documents
http://bigd.big.ac.cn/gwh/にアクセスする。
キーワード検索できる。”panda”とタイプ。
43件ヒットした。
Bioproject ID, Biosample ID, Accession No, Submitter、アッセンブリ、Publicationなどの情報などが表示されている。
Browseタブ
2021年5月現在、8900超のゲノムが登録されている。ゲノムやアノテーションは右端のリンクからダウンロードできる。
Statisticsタブ
統計情報。2021年5月現在、7145の動物ゲノム、1584の植物ゲノムアセンブリ、6681のメタゲノムアセンブリ、などが登録されている(完全長アセンブリはcompleteの行)。
データをsubmitする流れはDocumentationを確認して下さい。
引用
Genome Warehouse: A Public Repository Housing Genome-scale Data
Meili Chen, Yingke Ma, Song Wu, Xinchang Zheng, Hongen Kang, Jian Sang, Xingjian Xu, Lili Hao, Zhaohua Li, Zheng Gong, Jingfa Xiao, Zhang Zhang, Wenming Zhao, Yiming Bao
bioRxiv, Posted February 10, 2021
関連