コーディングバリアントの影響予測は大きく進歩したが、ノンコーディングバリアントの評価は依然として困難である。特にプロモーター領域内のバリアントは、遺伝子の過剰発現を引き起こしたり、発現を低下させたり、あるいは消失させたりする可能性があるため、問題となる。転写因子のDNAへの結合は、位置特異的重み行列(PWM)を用いて予測することができる。最近では、transcription factor flexible models(TFFM)が導入され、PWMよりも高精度であることが示されている。TFFMは隠れマルコフモデルに基づいており、複雑な位置依存性を説明することができる。著者らの新しいウェブベースのアプリケーションFABIAN-variantは、1224個のTFFMと3790個のPWMを用いて、DNAバリアントが1387種類のヒト転写因子の結合に影響を与えるか、どの程度影響を与えるかを予測している。各バリアントと転写因子について、このソフトウェアは異なるモデルの結果を組み合わせて、最終的に結合親和性の変化を予測する。ソフトウェアは高速化のためC++で書かれているが、バリアントはウェブインターフェースから入力することができる。また、VCFファイルをアップロードして、ハイスループットなシーケンシングによって同定されたバリアントを評価することも可能である。候補遺伝子の近傍にあるバリアントに限定して検索することもできる。FABIAN-variantは、https://www.genecascade.org/fabian/ で自由に利用できる。
https://www.genecascade.org/fabian/にアクセスする。
転写因子を選択し、検索対象とするモデルを選択する。
バリアントは、テキストフィールドに入力するか、左のメニューからVCFファイルとしてアップロードする。VCFの場合、gnomAD、ExAC、1000 Genomes Projectのデータを用いて、候補遺伝子領域、カスタムゲノム領域、カバレッジ、ホモ接合性、希少バリアントへの制限のフィルターオプションが用意されている。
VCFのフィルタリングオプション
ここではchr1:160001799G>Cと入力(フィールドには複数入力することもできる。その場合は左のメニューからmultiple~を選択)。
Enter sequences directlyをクリックすると、バリアントを塩基配列として入力できる(検索にはより時間がかかる)。
リファレンスはhg19かhg38から選ぶ。
'Known TFBSs' は、ENCODE、Ensembl、FANTOM5 のデータを元に、バリアントの位置に結合することが知られている既知の転写因子を検索する。Known TFBSs ?を選択する。
Select individuallyでは転写因子をユーザーが選択する。
1つのバリアントの問い合わせ結果は直ぐに表示される。100以上のVCFバリアントだと数に応じて時間がかかる。
出力例
バリアントは縦の列で、モデルは横の行で表されている。
色のついたセルは、バリアントごとに異なるモデルの複合予測に基づいて、バリアントによる 転写因子結合部位 の損失(赤)、または獲得(青)の可能性を表している。
セルにマウスポインタをホバーさせると、個々のモデルのスコアが表示される。
バリアントの位置にある既知の転写因子結合部位はセルの周りに黒枠を付けて表示されている。
(ChIP-seq実験から得られたTFBSは数百塩基の領域であり、そのポジションの中のどこに本当の結合部位があるかは分からないことに注意(論文より))
上のメニューから、ソートやフィルタリングを行うことが出来る。
結果はタブ区切りテキストとしてダウンロードできる。
右上から他のアプリケーションへもリンクしている。
これらのリンクは全てweb上で使えるアプリケーションで、DNAバリアント効果予測ツールのMutationTaster(Paper link)、WESの病原性予測のためにMutationTasterの病原性予測に表現型に基づくアプローチを組み合わせたMutationDistiller(PMC link)、連鎖区間からの候補遺伝子の抽出を自動で行うGeneDistiller(PMC link)、タンパク質をコードする転写産物の外に位置するDNAバリアント(extratranscriptic variants)のアノテーションと解釈を行うRegulationSpotter(PMC link)、ホモ接合性マッピングを行うHomozygosityMapper(PMC link)、その他となっている。FABIAN-variantと組み合わせて使うことが出来る。
引用
FABIAN-variant: predicting the effects of DNA variants on transcription factor binding
Robin Steinhaus, Peter N Robinson, Dominik Seelow
Nucleic Acids Research, Published: 26 May 2022