macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

ヒトとマウスの ロングノンコーディングRNAのアノテーションをつける lncFunTK

 

 ロングノンコーディングRNA(lncRNA)とは、200塩基より長いノンコーディング転写物を指す。現在までに、約58,000のlncRNAが様々な細胞型・組織に集積されているが、そのうち79%が新規性の高いものであり、その生物学的機能は未だ解明されておらず(Iyer et al., 2015)、この膨大な数のlncRNAの機能とその基礎となる分子機構を実験的に研究することは不可能である。新たにアセンブルされたlncRNAのアノテーションを試みるために、いくつかのバイオインフォマティクスツールが開発されてきた。例えば、AnnoLncは、新規転写物を受け入れ、クエリlncRNAの潜在的な調節因子を同定するウェブツールを提供する(Hou et al., 2016)。FEELncおよびLncRNAs2Pathwaysは、リファレンスゲノム中の隣接遺伝子またはその共発現パートナーの機能に基づいてlncRNAの機能性を評価するスキームを提供する(Han et al、2017、2;Wucher et al、2017)。しかし、それらのアプローチは、関連するlncRNAの機能に関連する限定的な相互作用のみを考慮していた。lncRNAが複雑なネットワーク中で機能を発揮することを考えると、lncRNAの優先順位付けや機能アノテーションには、包括的で体系的なアプローチが必要である。最近の研究(Zhou et al、2017)で、 著者らはChIP-seq、CLIP-seq、RNA-seqデータを統合し、lncRNAの機能を予測、優先順位付け、アノテーションする計算フレームワークであるlncFunNetを発表した。本報告では、このフレームワークの実装とユーティリティスクリプトを、包括的なツールキットとウェブサーバとして提供することを目的とする。

 lncFunTKはスタンドアロンアプリケーションとしてもウェブサーバとしても動作する。lncFunTKの入力データは、それぞれRNA-seq、ChIP-seqおよびAGO2-CLIP-seqからの、異なるステージ/細胞タイプ/組織の遺伝子発現プロファイル、ゲノム全体の転写因子およびmiRNA結合プロファイルである。LncFunTK解析には、デフォルトでlncFunTKパッケージによって提供されているリファレンスゲノムおよび遺伝子アノテーションデータのような他のサポートデータセットも必要である(論文図1A)。入力ファイルのフォーマットや仕様の詳細は http://sunlab.cpy.cuhk.edu.hk/lncfuntk/example.html に記載されている。 lncFunTKはFunctional Information Score (FIS)を計算し、様々なタイプのシークエンシングデータを統合して構築された遺伝子制御ネットワークの中で、与えられたlncRNAの機能的重要性を定量的に測定する(論文図1A)。簡単に言えば、各lncRNAのFISは、隣接する遺伝子の相互作用の強さをまとめて計算され、遺伝子制御ネットワークのコンテキスト下での各lncRNAの相互作用の程度を表している[論文図1B、詳細なアルゴリズムはZhou et al., (2017)を参照]。その結果、lncFunTKは、クエリlncRNAに対して3つの主要な出力を提供する。(i)関連するFISを有するクエリlncRNAのリスト;(ii)その機能的アノテーションのためにlncRNAに関連する最も重要なGO term;(iii)予測された機能的lncRNAのトップ5およびそれらの主要な隣接遺伝子(例えば、TFおよびmiRNA遺伝子)を含む可視化された遺伝子制御ネットワークであり、これはさらなる実験的検証の出発点として機能する。また、ユーザーがlncFunTKの結果をナビゲートするためのHTMLファイルも作成する(論文図1C)。

 

Github


demo output (Hela cell)

https://sunlab.cpy.cuhk.edu.hk/lncfuntk/hela/07Report/index.html

 

 

webサーバー

https://sunlab.cpy.cuhk.edu.hk/lncfuntk/runlncfuntk.html

f:id:kazumaxneo:20200705182621p:plain

 

ゲノムアセンブリのバージョンを指定する。

f:id:kazumaxneo:20210224210240p:plain

 

入力ファイルの詳細はこちらを確認して下さい。

 

引用

lncFunTK: a toolkit for functional annotation of long noncoding RNAs
Jiajian Zhou, Yile Huang, Yingzhe Ding, Jie Yuan, Huating Wang, Hao Sun
Bioinformatics, Volume 34, Issue 19, 01 October 2018, Pages 3415–3416