macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

Multiple Sequence Alignmentの結果を視覚化する Sequence Bundles

 

 本研究では、複数の配列アライメント(MSA)を表現するための新しいデータ可視化手法であるSequence Bundlesを紹介する。既存のバイオインフォマティクスのデータ可視化手法(Sequence Logoなど)の主な限界を特定し、解決するために、Sequence Bundlesを用いて、従来は隠されていた配列モチーフやその他のデータの特徴を顕著に視覚的に表現することができる。
 Sequence Bundlesの開発には、研究者主導の情報デザイン手法を採用した。シーケンスは、2次元の再構成可能なグリッド上に描かれた、途切れない半透明の線としてエンコードされる。各線は1つのシーケンスを表す。各位置の各残基におけるスタックの厚さと不透明度は、保存のレベルを示し、線のカーブしたパスは相関性と機能性のパターンを明らかにする。複数のMSAを合成画像で可視化することができる。Sequence Bundles法は、情報を具体的、連続的、直感的に表示することを目的としている。

 

HP

https://www.ebi.ac.uk/research/goldman/software/alvis#dload

 

 

Introduction to Alvis


 

webサービス

https://www.ebi.ac.uk/goldman-srv/sequencebundles/

f:id:kazumaxneo:20210327225825p:plain

 

アミノ酸のMultiple Sequence Alignment後のMSAファイル(FASTA形式)をペーストするかアップロードする(最大1000残基、1000配列)。ここではexaample dataを指定した。

f:id:kazumaxneo:20210327225946p:plain

 

Create Bundleをクリック。

f:id:kazumaxneo:20210327230054p:plain

視覚化された。

f:id:kazumaxneo:20210327230223p:plain

Multiple Sequence Alignmentの各配列が1本の連続した線で表現されている。各位置で、線が同じ残基を共有している場合、これらの線は束ねられる。したがって、線が収束していればその位置で残基が保存されていることを示し、発散していれば変化していることを示す。各配列の連続性が保たれているので、重要な残基の相関関係を観察したり、隠れた配列モチーフを発見したりすることができる。また、Y軸上のアミノ酸文字との位置関係から機能性のパターンがわかる。

 

Visualisation Settingsから設定を変更できる。

f:id:kazumaxneo:20210327233327p:plain

 

Y軸のアミノ酸グループも指定できる。

f:id:kazumaxneo:20210327233436p:plain

 

2つのグループの生物を表す線は、色によって異なる。グラム陽性菌(黒線)とグラム陰性菌(青線)。この図は、1809個のAKLタンパク質配列から作成されています。サンプルの数は グラム陰性菌923配列対グラム陽性菌886配列で、100:96の割合となっている。

 

幅を狭くして、Y軸をアミノ酸の極性、色を青に変更した。

f:id:kazumaxneo:20210327233643p:plain

 

保存されていない残基の線を非表示にする。

f:id:kazumaxneo:20210327233804p:plain

適用した。

f:id:kazumaxneo:20210327233921p:plain

結果はPNG形式でダウンロードできる。

 

引用

Sequence Bundles: a novel method for visualising, discovering and exploring sequence motifs
Marek Kultys, Lydia Nicholas, Roland Schwarz, Nick Goldman & James King
BMC Proceedings volume 8, Article number: S8 (2014)

 

ALVIS: interactive non-aggregative visualization and explorative analysis of multiple sequence alignments
Roland F. Schwarz, Asif U. Tamuri, Marek Kultys, James King, James Godwin, Ana M. Florescu, Jörg Schultz, Nick Goldman
Nucleic Acids Research, Volume 44, Issue 8, 5 May 2016, Page e77