多くのRNA分子にとって、二次構造はRNAの補正機能に欠かせないものである。ヌクレオチド配列からRNAの二次構造を予測することは、ゲノミクスにおける長年の課題であるが、予測性能は時間の経過とともにプラトーに達している。従来のRNA二次構造予測アルゴリズムは、主に自由エネルギー最小化による熱力学モデルに基づいている。ここでは、熱力学的な仮定を一切使用せずに、アノテーションされたデータ上で直接学習し、RNA二次構造を予測するディープラーニングベースの手法であるUFoldを提案している。UFoldは従来の熱力学モデルと比較して約31%、他の学習ベースの手法と比較して約24.5%の改善を示し、従来のモデルと比較して大幅に改善されている。ベースペア予測精度はF1スコア0.96を達成している。UFoldが動作するオンラインウェブサーバは、http://ufold.ics.uci.edu で公開されている。
https://ufold.ics.uci.edu/ にアクセスする。
RNA配列と出力名を入力してサブミットする。
結果
Visualizeを選択するとブラウザ上で視覚化される。
視覚化結果。ノードを引っ張って動かすことが可能。
右上の?マークがヘルプになっている。
ビューアでPDBのファイルを追加することもできる。
ノードの表現や重力などのパラメータは下の歯車から変更できる。
引用
UFold: Fast and Accurate RNA Secondary Structure Prediction with Deep Learning
Yingxin Cao, Laiyi Fu, Jie Wu, Qing Nie, Xiaohui Xie
bioRxiv, Posted August 18, 2020