macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

シーケンスアラインメントやHMMER3のHMMプロファイルをlogoで視覚化する skylign

 

 ロゴは、分子生物学において、配列の保存パターンをコンパクトなグラフで表現するためによく用いられる。ロゴは、配列アラインメントや隠れマルコフモデルに含まれる情報を、各位置に文字のスタックを描くことで表現する。スタックの高さはその位置の保存度に対応し、スタック内の各文字の高さはその位置でのその文字の頻度に依存する。

 本著者らはSkylignと呼ばれる新しいツールとウェブサーバーを発表する。このツールは、配列アラインメントとHMMプロファイルの両方のロゴを作成するための統一されたフレームワークを提供する。静的な画像ファイルに加えて、SkylignはWebページに含めるための新しいインタラクティブなロゴプロットを作成する。これらのインタラクティブなロゴは、スクロール、ズーム、および基本的な値の検査が可能になっている。Skylignは、冗長な配列をダウンウェイトし、観測されたカウントをinformed priors(事前承認)と組み合わせることにより、配列アライメントにおけるサンプリングバイアスを回避することができる。また、ギャップパラメータの表現を簡素化し、オプションとして、位置の保存性の代替計算に基づいて文字の高さをスケーリングすることができる。

 Skylignは、ウェブサイト、RESTfulインターフェイスを持つスクリプト可能なウェブサービス、およびダウンロード可能なソフトウェアパッケージとして提供されている。Skylignのインタラクティブなロゴは、数行のHTMLマークアップで簡単にWebページに組み込むことができる。Skylignは、http://skylign.orgで利用できる。

 

Help

http://skylign.org/help/

 

webサービス

http://skylign.org/にアクセスする。

f:id:kazumaxneo:20211211223359p:plain

 

HMMモデルを指定する。ここではKEGGのKofamKOALAのKEGG IDマッピング時に作成されたHMMモデルを使った。

f:id:kazumaxneo:20211211223638p:plain

 

出力例

f:id:kazumaxneo:20211211223751p:plain

 

 

クリックするとその位置のアミノ酸の推定出現確率が表示される。

f:id:kazumaxneo:20211211224055p:plain

HMMを提供した場合、出現確率はHMMから直接抽出される。アラインメントファイルを提供した場合、Probabilityはスタート時に選べる3つの計算方法のいずれかにより推定される。

 

酵素タンパク質であれば、活性部位のアミノ酸残基などに注目して見ていく。ロゴがほぼ見えない部位は、保存されていないアミノ酸残基(ループ構造を形成する部位など)を意味する。結果はPNGSVGなどのフォーマットでダウンロードできる。

引用

Skylign: a tool for creating informative, interactive logos representing sequence alignments and profile hidden Markov models
Travis J Wheeler, Jody Clements & Robert D Finn 
BMC Bioinformatics volume 15, Article number: 7 (2014)