転写因子(TF)は遺伝子の発現調節に大きな役割を果たしている。各遺伝子の制御領域に結合するTFを発見することは、長年の研究の焦点であった。TF結合部位(TFBS)の実験的検証は複雑なプロセスであるため、予測を行うウェブツールが開発されてきた。しかし、これらのツールの大半は、データ入力のための使いやすい環境を提供しておらず、また、これらのツールの多くは、多くの偽陽性の結果を生み出している。本研究では、TFBSPredを紹介する。TFBSPredは、隠れマルコフモデルに基づくTFフレキシブルモデル(TFFM)を用いて結合部位を予測するウェブツールであり、自動化された最小限の入力で済むユーザーインターフェースを提供する。TFBSPredは、オープンクロマチン領域を同定するためにENCODEのDNAse I hypersensitivityデータを使用し、予測の真陽性率を高めるためにEnsembl Comparaペアワイズアラインメントを使用することで、ホモサピエンスとムササビの間の保存性を利用している。ユーザーはヒトまたはマウスゲノムの遺伝子名またはゲノム位置を入力し、興味のある細胞タイプを選択すると、TFBSPredは選択された制御配列と細胞タイプの保存されたオープンクロマチン領域をペアワイズアラインメントとして出力し、予測されたTFBSを表示する。本研究では、実験的に検証されたTFBSを用いて、TFBSPredといくつかの類似した機能を持つウェブツールのベンチマークを行った。TFBSPredは、よく研究されているIFNB1エンハンスメントソームの場合には、感度と特異性の間の最適なトレードオフを示し、一方、それ以降の使用例では、他のウェブツールを凌駕した。このようにTFBSPredは、TFBS予測や実験的検証のための仮説提供のための貴重なツールであることが証明された。TFBSPredはまた、将来のTFFMデータの更新により、さらに改良される可能性もある。
Tutorial
https://www.michalopoulos.net/tfbspred/tutorial.php
FAQ
https://www.michalopoulos.net/tfbspred/faq.php
https://www.michalopoulos.net/tfbspred/#にアクセスする。
目的の生物(ヒトまたはマウス)を選択
目的の遺伝子を入力する。遺伝子とその転写産物のEnsemblコードも入力として使用できる。Submitをクリックする。
* カスタムで領域のポジション値を入力することもできる。フォーマットはChr:Location(Strand)。Ensembl 90 リリース、Homo sapiens hg38、Mus musculus mm10 のゲノム位置番号が使用されている。
出力例
転写開始点が複数登録されているので、どれか選択する。
先頭を選択した。
調べる細胞タイプのカテゴリーを選択する。各カテゴリーから少なくとも1つのオプションを選択する必要がある。Submitをクリックする。
続いて、各細胞株の左側にあるチェックボックスにチェックを入れて、目的の遺伝子に関連する細胞株を選択する(選択次第ではこのページで候補がゼロになっている)。
ページの一番下までスクロールし、TFFM の閾値を入力する。デフォルト値は0.9。値が大きいほど厳しい。
結果
結果のページには、プロモーター解析が行われた領域のペアワイズアラインメントが表示される。TSSは赤く着色され、その上の矢印が転写の方向を示している。予測されるTFBS(transcription factor binding sites)も各アラインメントブロックの上に表示される。
引用
TFBSPred: A functional transcription factor binding site prediction webtool for humans and mice
Vasileios L. Zogopoulos Katerina Spaho Chaido Ntouka Gerasimos A. Lappas Ioannis Kyranis Pantelis G. Bagos Demetrios A. Spandidos Ioannis Michalopoulos
September 3, 2021, https://doi.org/10.3892/ije.2021.9
関連