macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

種の形質をコレクションするデータベース Traitpedia

 

 種はそれらの遺伝子型および表現型によって一義的に定義することができる。この遺伝子型および表現型は非常に密接に絡み合っており、追加の環境コンポーネントがこの関係の広い理解を複雑にしている。表現型、または形質は、生物の遺伝情報にある程度依存しているため、通常は分類学的に駆動されている。 遺伝子進化事象(例えば、遺伝子喪失/重複、水平伝播など)(Koonin、2005)および収束進化から生じる形質(Stayton、2015)は、これらの表現型/分類学的関連の推測を複雑にする。 魅力的な例の1つは、真菌における多細胞性の進化である。これは、異なる系統で独立して11回も起きた可能性がある(Nagy et al、2018)。 そのような例は、分子の特徴を表現型と相関させることを可能にする。 これらの相関関係は進化的収束のメカニズムや複雑な生物学的プロセスに関連する分子機能についての洞察を与える。

 真菌生物が多細胞であるかどうかなどの形質は定義するのが非常に簡単であると考える人もいるかもしれないが、これはそうではない。例として、species Dothistroma septosporumという針葉樹に赤針枯病を起こす真菌を例にあげる。そのゲノムは完全に解読されており(de Wit et al、2012)、EnsemblFungiデータベース(https://fungi.ensembl.org)でカバーされている。また、UniProt proteomes(

https://www.uniprot.org/proteomes/)の真菌リファレンスセットとして選ばれている。驚くべきことに、D.septosporumが単細胞性、多細胞性、またはコロニー性のいずれであるかについての情報は、どのデータベースにも文献にも見当たらない。私たち(著者ら)は、この生物について研究している研究者がこの形質はどの研究者にとっても興味深いものであると考えておらず、そのため報告していないと強く信じている。

 形質情報の欠如は、モデル生物にも当てはまるかもしれない。 ほとんどの場合、形質情報は文献から得られる可能性があるが、一部の種についてこの情報を取得するのは簡単なことではない。 この目的のために、Encyclopedia of Life(http://www.eol.org)、ある程度のTree of Life Webプロジェクト(http://tolweb.org)および種固有のデータベースなどが開発されている。 それらすべてに欠けているのは、テーブルと構文解析に適した形式での特性のバイナリー分類である。 そしてそれらは、形質の関連付けや種間の形質比較を簡単にマイニングする準備ができていない。

 この論文では、Traitpediaという増加している種から種の形質をまとめる共同リポジトリについて説明する。情報は、単純な(ほとんどがバイナリー)値を含む表形式で表示される。

 Traitpediaには現在181の真核生物種の形質情報が含まれている(論文補足ファイルS1)。種ごとに15の特徴があり、4つのカテゴリに分けられる:

  1. 種の一般的な雑多な特徴。
  2. 個体(表現型)、種からの各個体に固有の形質。
  3. 種内(振る舞い)、種の各個体がどのように相互作用するかに関連する形質。
  4. 種間、異なる種の個体間の関係を表す形質。

生物の特性のセットを探すために、ユーザーはそれを一義的に識別するためにNCBI Tax ID、種名または一般名のいずれかを使用することができる。要求された種についてのエントリがあると仮定すると、その種に関する一般情報を含むセクションが表示され、その後にその特性に関する情報が表示される。そうでなければ、その種に関する情報がデータベースにまだないことを示すページが表示される。あるいは、ユーザは、現在の種のセットについて利用可能なすべての形質値を表示するために、形質によってデータベースに問い合わせることができる。

 本著者らが導入した目新しさは、興味のある2つの種の形質を比較する可能性である。ミツバチApis melliferaと黄熱病蚊Aedes aegyptiの例を考えると(論文図1 link)、2つの簡単なステップでそれらの特性のセットを比較することができる。まず、一つの生物のエントリーを探す。次に、追加実行セクションで比較する2番目の生物を選択する。 2つの選択された種の一般的な情報の下に、両方の種のためにすべての利用可能な形質で簡単な表が示される。表は結果ページからダウンロードできる。ペアワイズ比較は、前述のセクションで新しい種を選択することによって繰り返すことができる。元のペアから選択された最後の種は、新しいものと比較される。

(以下略) 

 


使い方

http://cbdm-01.zdv.uni-mainz.de/~munoz/traitpedia/にアクセスする。

f:id:kazumaxneo:20190401101023j:plain

 

種名、taxid、または一般名を入れ、seachボタンをクリックする。現在181種に対応している。

f:id:kazumaxneo:20190401222345p:plain

種名、分類、taxid、uniprot proteome id,  などが先頭に表示される。

f:id:kazumaxneo:20190401222510p:plain

その下に形質が表示される。拡大してみる。

f:id:kazumaxneo:20190402071733p:plain

上のような項目がある(human)。

 

他の種名を追加して検索すれば、2生物の形質を比較できる。

f:id:kazumaxneo:20190402072017p:plain

 

トップページからは形質で検索することもできる。

f:id:kazumaxneo:20190402072413p:plain

Select a traintボタンをクリック。

f:id:kazumaxneo:20190402072246p:plain

 

Sequencedを選んで検索した。

f:id:kazumaxneo:20190402072549p:plain

 

引用

Traitpedia: a collaborative effort to gather species traits
Pablo Mier, Miguel A Andrade-Navarro
Bioinformatics, Volume 35, Issue 6, 15 March 2019, Pages 1079–1081

 

関連