macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

全てのk-mer配列を含み二次構造を作らないRNA配列を設計する CURLCAKE

 

タンパク質とRNAの結合は、RNAの配列と構造の両方を介して媒介され、神経変性疾患を含む多くの細胞プロセスにおいて重要な役割を果たしている。RNA結合タンパク質の配列と構造の結合嗜好性をモデル化することは、計算上の重要な課題である。正確なモデル化を行うことで、新たな相互作用の予測や結合機構の理解を深めることが可能になる。さらに、これらの相互作用を実験的に測定するためのコンパクトで効率的な配列ライブラリを設計することが、新しい結合選好性を発見するために必要である。本講演では、これら2つの課題を解決するための研究成果を紹介する。最初の部分では、k-merに基づいた配列と構造のスコアを学習する効率的なアルゴリズムであるRCKについて説明する。また、RCKをタンパク質-RNA相互作用の最大のデータセットに適用することで得られる新しい生物学的洞察の例を紹介する。第二部では、すべてのk-merをカバーする非構造化RNA配列の最小サイズの集合を生成する問題について考察する。この問題の一般的な定義がNP-hardであることを証明し、この問題を解決するためのgreedyなヒューリスティック手法であるCurlCAKEについて説明する。

 

CURLCAKEは、すべてのK-mErsをカバーするコンパクトな非構造化RNAライブラリを生成するソフトウェアである。de Bruijnグラフ内の不連続なパスを見つけることに基づいたヒューリスティックアルゴリズムを持つ。パスに対応するRNA配列は、抽象化されていない(すなわち、高いフォールディングエネルギーを有する可能性が高い)。

 

CURLCAKEは8つのパラメータを入力として受け取る。
1. k - カバーする k値。
2. length - プローブのユニークな部分の長さ.
3. multiplicity - それぞれのk-merが何回発生するかを指定
4. attempts - ランダムな拡張子の試行回数の制限
5. output_incomplete_file - 不完全なプローブシーケンスを出力するファイル名
6. output_compelte_file - 完全なプローブ配列を出力するためのファイル名
7. RNAshapes 実行形式ファイル (バージョン 2.1.6) 
8. seed (任意) ランダム性調節。デフォルト: 0

 

 

ダウンロード

ubuntu18.04LTSで実行した。

HP

http://wwwee.ee.bgu.ac.il/~cb/software.html

CURLCAKE

 

http://cb.csail.mit.edu/cb/curlcake/

Get the softwareの下にあるリンクからCURLCAKEとRNAshapesのバイナリ(実行形式ファイル)をダウンロードする。

f:id:kazumaxneo:20200727140106p:plain

RNAshapesは実行権をつけておく。

chmod u+x RNAshapes

 

 

実行方法

RNAshapesのバイナリのパスを指定してcurlcake.jarを実行する。

35 merのRNA配列を出力する。

java -jar curlcake.jar 7 35 1 100 incomplete.txt complete.txt ./RNAshapes 0

 2つのシーケンスファイルをテキストファイルとして出力する。 

 

incomplete.txt(不完全)

f:id:kazumaxneo:20200727205322p:plain

 

 complete.txt

f:id:kazumaxneo:20200727205300p:plain

 

引用

https://engineering.biu.ac.il/node/8463

 

RNAshapes

https://bibiserv.cebitec.uni-bielefeld.de/rnashapes

 

ONTのデバイスは5-mer単位で塩基配列の電流変化を測定する。可能性のあるすべての 5-mer組み合わせの配列を含み、さらに二次構造を作らない合成コンストラクト配列を設計するため、以下の論文で使用された(5-merの系統的な違いを調べるため)。

Accurate detection of m 6 A RNA modifications in native RNA sequences | Nature Communications

 

関連