macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

RNAの二次構造を予測する UFold 

 

 多くのRNA分子にとって、二次構造はRNAの補正機能に欠かせないものである。ヌクレオチド配列からRNAの二次構造を予測することは、ゲノミクスにおける長年の課題であるが、予測性能は時間の経過とともにプラトーに達している。従来のRNA二次構造予測アルゴリズムは、主に自由エネルギー最小化による熱力学モデルに基づいている。ここでは、熱力学的な仮定を一切使用せずに、アノテーションされたデータ上で直接学習し、RNA二次構造を予測するディープラーニングベースの手法であるUFoldを提案している。UFoldは従来の熱力学モデルと比較して約31%、他の学習ベースの手法と比較して約24.5%の改善を示し、従来のモデルと比較して大幅に改善されている。ベースペア予測精度はF1スコア0.96を達成している。UFoldが動作するオンラインウェブサーバは、http://ufold.ics.uci.edu で公開されている。

  

webサービス

https://ufold.ics.uci.edu/ にアクセスする。

f:id:kazumaxneo:20210124232943p:plain

 

RNA配列と出力名を入力してサブミットする。

f:id:kazumaxneo:20210124233159p:plain

 

結果

Visualizeを選択するとブラウザ上で視覚化される。

f:id:kazumaxneo:20210124232910p:plain

 

 視覚化結果。ノードを引っ張って動かすことが可能。

 

f:id:kazumaxneo:20210124232815p:plain

 

右上の?マークがヘルプになっている。

f:id:kazumaxneo:20210124233726p:plain

 

ビューアでPDBのファイルを追加することもできる。

f:id:kazumaxneo:20210124233900p:plain

 

ノードの表現や重力などのパラメータは下の歯車から変更できる。

f:id:kazumaxneo:20210124233917p:plain

引用

UFold: Fast and Accurate RNA Secondary Structure Prediction with Deep Learning
Yingxin Cao, Laiyi Fu, Jie Wu, Qing Nie, Xiaohui Xie

bioRxiv, Posted August 18, 2020