macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

海洋環境ゲノムをマイニングするためのオンラインサービス The Ocean Gene Atlas v2.0

 

 Tara Oceansの海洋メタゲノムやメタトランスクリプトームのような大規模データリソースを用いて遺伝子の生物地理に関する仮説を検証するには、多大なハードウェアリソースとプログラミングスキルが必要になる。今回リリースされた「Ocean Gene Atlas」(OGA2)は、大規模かつ複雑な海洋環境ゲノムデータベースをマイニングするための、自由に利用できる直感的なオンラインサービスである。OGA2のデータセットが拡張され、Tara Oceansのポートフォリオから、(i) 真核生物のMetagenome-Assembled-Genome (MAGs) と Single-cell Assembled Genomes (SAGs) (10.2E+6 coding genes), (ii) Ocean Microbial Reference Gene Catalogue version 2 (46.0E+6 non-redundant genes) 、(iii) 924 MetaGenomic Transcriptomes (7E+6 unigenes), (iv) 530 MAGs from an Arctic MAG catalogue (1E+6 genes) and (v) 1888 Bacterial and Archaeal Genomes (4.5E+6 genes)が追加され、さらにMalaspina 2010世界一周航海からのデータセット: (vi) 317 Malaspina Deep Metagenome Assembled Genomes (0.9E+6 genes)も収録している。OGA2が可能にした新しい分析には、海洋環境データセットとRefSeqデータベースの両方からの配列の相同性という文脈でユーザーのクエリを可視化する系統樹推論が含まれている。アプリケーションプログラミングインターフェース (API) により、ユーザーはコマンドラインツールを使用して OGA2 に問い合わせることができるようになり、ローカルワークフローの統合が可能になった。最後に、遺伝子発現量は、利用可能な環境変数のいずれかを使用して、地図表示上で直接対話的にフィルタリングすることができる。Ocean Gene Atlas v2.0は、https://tara-oceans.mio.osupytheas.fr/ocean-gene-atlas/ で自由に利用できる。

 

help

https://tara-oceans.mio.osupytheas.fr/ocean-gene-atlas/build/pdf/Ocean-Gene-Atlas_User_Manual.pdf

 

webサービス

https://tara-oceans.mio.osupytheas.fr/ocean-gene-atlas/にアクセスする。

 

データベースを選択する。

クエリの配列は、fasta形式の塩基配列(10kb以下)、アミノ酸配列、作成済みのHMMプロファイル、PfamのID、遺伝子名、以前の結果の視覚化(メールアドレスを記入してランするとTSVファイルが入手できる。それを指定する。)に対応している。

E-valueでの閾値はデフォルトで1E-10となっている。HMMプロファイルでのランは相当な時間かかるので、高感度さが重要では無いなら、塩基配列アミノ酸配列による検索が推奨される。

 

ここでは 上のメニューからTry an Example with OM-RGC dataset (prokaryotes)を選択した。

Submitをクリック。

 

出力例

mapが複数あるのは、それぞれのmapに異なる変数を表示させて比較しやすくするため。

 

バブルプロットの変数は図の左上のボタンから変更できる。

 

helpより

  • mapの用語について; DCM: deep chlorophyll maximum layer; SRF: upper layer zone; MES: mesopelagic zone; MIX: marine epipelagic mixed layer, FSW: filtered sea water, ZZZ: marine water layer、をそれぞれ表す。
  • バブルプロットのサンプルの円の大きさは、クエリのホモログの存在量に比例している。円は選択された分数によって色分けされている。Y軸は環境パラメータ値を表す。アルカリ度、アンモニウム5m*、炭素総量、CDOM*、クロロフィル_A、CO2、CO3、密度、深度、沿岸距離、HCO3、鉄5m*、硝酸5m*、亜硝酸5m*、NO2、NO3、NO3_NO2、NPP_C*、O2、PAR、pH、PIC*、PO4、POC*、塩分、Si、温度(submitする時にBubble plotsの数を増やすと出力される)。
  • 海洋モデルから推定された値には星印が付けられている。

 

引用
The Ocean Gene Atlas v2.0: online exploration of the biogeography and phylogeny of plankton genes
Caroline Vernette, Julien Lecubin, Pablo Sánchez, Tara Oceans Coordinators; Shinichi Sunagawa, Tom O Delmont, Silvia G Acinas, Eric Pelletier, Pascal Hingamp, Magali Lescot 

Nucleic Acids Res. 2022 Jun 10;50(W1):W516-W526

 

関連