macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

タンパク質配列中の疎水性モジュール性を視覚的に探索するBlobulatorのウェブツール

 

 疎水性残基のクラスターは構造を取っているタンパク質の安定性を促進し、タンパク質の凝集(aggregation)を促進することが知られている。最近の研究で、連続した疎水性残基クラスター("blob "と呼ばれる)を同定することが、内在性無秩序タンパク質(IDP)シミュレーションとヒトゲノム研究の両方で有用であることが証明された。しかし、グラフィカルなインターフェイスはなかった。本発表では、疎水性に基づいてタンパク質配列の内在性モジュラリティを検出するための、対話的で直感的なウェブインターフェースであるblobulatorを紹介する。blobulatorの3つの使用例を示し、生物学的に関連するパラメータを持つblobを同定することで、球状タンパク質、2つのオルソログ膜タンパク質、およびIDPに関する有用な情報が得られることを示す。その他、3次相互作用に重要な役割を持つタンパク質セグメントの予測、明確なエッジを持つ局所的な秩序と無秩序の定義、配列からタンパク質の特徴を予測する補助など、潜在的なアプリケーションについて議論する。blobulatorのGUIはwww.blobulator.branniganlab.org、pipインストール可能なコマンドラインツールを含むソースコードGitHubのwww.GitHub.com/BranniganLab/blobulatorで公開されている。

 

Documentartion

https://www.blobulator.branniganlab.org/#documentation

 

blobulator GUI(web)

http://www.blobulator.branniganlab.org/にアクセスする。

 

タンパク質のUniProt IDかEnsembl IDを入力する。あるいは右のウィンドウにタンパク質配列を入力する。

ヒトの疾患関連変異の位置も見たい場合、ヒトタンパク質のIDを入力しないと認識しない。

 

出力

(マニュアルより)このグラフは残基を個々に示している唯一のグラフとなる、blobulationの最初のステップはデジタル化である。アルゴリズムはまず選択したスケールで各残基の疎水性を計算し、隣接する残基の疎水性に対してこれを平滑化する。青い線は、その平滑化された疎水性と疎水性カットオフで、これを境界に疎水性または非疎水性にデジタイズされる。このカットオフ値は調整可能で、画像では0.4となっている。その下にあるMinimum blob size: 4は、blobを構成する残基の数の閾値を設定するもので、最小ブロブサイズを超える連続した残基のグループが、疎水性カットオフの値を超える平滑化疎水性を個々に持つ場合、そのクラスターは'h'(疎水性)ブロブとみなされる。そうでない場合、長さが最小ブロブサイズ以上であれば「p」(非疎水性)ブロブ、長さが最小ブロブサイズ以下であれば「s」(短い)ブロブとみなされる。

 

(マニュアルより)その下のMutate residue: 1 (M)は、配列内の残基を変更し、ブロブレーション出力にどのような潜在的な影響があるかを確認するために使用する。残基を変異させるには、変異させたい残基を選択し、その残基を変異させたいアミノ酸を選択し、チェックボックスをクリックする。

9 (S)を指定(チェックをつけないと適用されない)

各トラックの下部にある黒い三角形は既知の疾患関連一塩基多型で、これらを選択して変異させることもできる(UniProt IDが使用されている場合のみ表示される)。

 

平滑化後の結果は画面下のプロットで表示される。

青いグラフは、灰色のグラフの計算結果に基づく疎水性ブロブ、短いブロブ、非疎水性ブロブのプロット。その下はブロブごとの荷電状態を表すグラフになっていて、残基の平均電荷に従ってblobを表示する。青が濃いblobほど、正に帯電した残基の割合が高い。また、赤色が濃いブロブほど、負に帯電した残基の割合が高い。プラスまたはマイナスに帯電した残基の割合が均等であるか、またはどのような帯電残基の割合も低い場合は、灰色になる。これらのグラフは、ウィンドウのパラメータを変更するとリアルタイムで変更される。

 

さらに下にも4つのグラフが表示されている。

(マニュアルより)一番上のグラフは、Das-Pappu分類に基づく球状傾向に従って色付けされたblobを示している。Das-Pappu相図はもともと、電荷量に基づいて無秩序配列がどのように振る舞うかを推定するために使われてきた。各ブロブは、Das-Pappu相図のどの領域に位置するかによって色分けされている。

その下のグラフは、疾患関連SNP(dSNP)の濃縮度に従ってブロブを示している。

下から2番目のグラフは、ordered とdisorderedの間の線がプロットされている。オレンジはより秩序があり、青はより無秩序である。

最後のグラフ出力は、予測された無秩序残基の割合に従ってblobを表示している。この無秩序残基の割合には、Database of Disordered protein prediction が利用されている。(UniProt IDを使用した場合のみ利用可能)

 

 

引用

The blobulator: a webtool for identification and visual exploration of hydrophobic modularity in protein sequences
Connor Pitman, Ezry Santiago-McRae,  Ruchi Lohia, Kaitlin Bassi, Thomas T. Joseph, Matthew E.B. Hansen, Grace Brannigan

bioRxiv, Posted January 16, 2024