macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

タンパク質のホモリピートを分析するwebサーバー dAPE

 

 Low Complexity(LC)は、タンパク質中のタンデムリピートおよびcompositionally biased regions(CBR)のようなアミノ酸組成にほとんど多様性がない領域を説明するために使用される一般用語である。ホモリピート、またはpolyX領域は、単一のアミノ酸残基の連続からなるCBRである。ヒトのホモリピートを有するタンパク質の割合はわずかな変動があり、5.7%(Jorda and Kajava、2010)から7.7%(51 778のヒト配列から約4000タンパク質)となっている。この多様性の理由は、偏った領域をホモリピートと見なすための標準化されたカットオフの欠如、およびそれがそのような領域内にミスマッチを含むかどうかということである。ホモリピートを定義するためのいくつかのカットオフが文献に記載されている:少なくとも5つから少なくとも7つまで(Jorda and Kajava、2010)、少なくとも5つの同一残基(Alba andGuigó、2004)、少なくとも6(Lobanov and Galzitskaya、2012)、 10残基ウィンドウで8以上(Schaefer et al、2012)、5つのうち4つ(UniProt、http://www.uniprot.org/help/compbias)。実際、ホモリピート検出のカットオフは、アミノ酸タイプだけでなく種にも依存している可能性がある(Lobanov et al、2016)。

 (一部略)

原核生物よりも真核生物プロテオームにおいてより豊富であると記載されているが(Faux et al、2005; Jorda and Kajava、2010)、ホモリピートがどのように進化するかは明らかではない。それらの経時的な発展はまだ完全には記載されていないので、それらが進化に沿ってそれらの長さおよび機能を増加、減少またはランダムに変化させるかどうかは知られていない。

 本著者らは、ホモリピートの進化とそのタンパク質の状況を評価するのに役立つウェブサーバーとデータベースであるdAPEを開発することによって、これらの問題に取り組む。これは、デフォルトでは弱いカットオフを使用して、出現または消失するホモリピートの識別に役立ち、ユーザーが使いやすい設定で独自のシーケンスを研究することを可能にする。

 

dAPEに関するツイート 


使い方

http://cbdm-01.zdv.uni-mainz.de/~munoz/polyx/ にアクセスする。

f:id:kazumaxneo:20190402173449j:plain

 

f:id:kazumaxneo:20190402230906p:plain


作成中

 

 

 

 

引用

dAPE: a web server to detect homorepeats and follow their evolution
Pablo Mie, Miguel A Andrade-Navarro

Bioinformatics. 2017 Apr 15; 33(8): 1221–1223