macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

DNA・RNA・タンパク質の物理化学的特徴を調べるためのGUIアプリケーション VisFeature

2021 2/2 タイトル変更

 

 遺伝子やタンパク質の一次配列から機能的属性を予測するバイオインフォマティクスアルゴリズムの開発には多くの努力がなされてきた。その際の課題の一つとして、ヒューリスティック手法や反復法によって選択された統計的特徴を直感的に解析し、理解することが挙げられる。本論文では、DNA、RNA、タンパク質を含むあらゆる種類の生物学的配列の統計的特徴を直感的に可視化・解析できる有用なソフトウェアツールを目指したVisFeatureを開発した。VisFeatureには、配列データの検索機能、マルチプル配列アライメント機能、統計的特徴量生成機能が統合されている。
 VisFeatureはJavaScript/ElectronとRを用いて実装されたデスクトップアプリケーションである。VisFeatureのソースコードGitHubリポジトリhttps://github.com/wangjun1996/VisFeature)から自由にアクセスできる。サンプルデータセットを含むバイナリリリースは、同じ GitHub リポジトリhttps://github.com/wangjun1996/VisFeature/releases)から自由にダウンロードできる。

 

 インストール

Github

リリース(Releases · wangjun1996/VisFeature · GitHub)からダウンロードする。win32-x64を選んだ。他に、macosとubuntu16バージョンがある。

f:id:kazumaxneo:20210202095002p:plain



使い方

解凍してVisFeatureをクリックすると起動する。

f:id:kazumaxneo:20210202095217p:plain

manual.pdfも含まれている。

 

 

 起動したところ

f:id:kazumaxneo:20210202095346p:plain

 

ウィンドウ上で右クリックしてexample fastaのDNAを表示する。f:id:kazumaxneo:20210202214425p:plain

 

表示された。配列は直接タイプしたり、コピー&ペーストで貼り付けできる。ファイルから読み込むことも可能。

f:id:kazumaxneo:20210202214534p:plain

 

このDNA配列の物理化学的特性を調べる。1つの配列を調べる時は Single sequence modeを選択する。

Visualization =>  Single sequence mode

f:id:kazumaxneo:20210202220350p:plain

 

出てきたウィンドウで配列を選択、

f:id:kazumaxneo:20210202220739p:plain

Select Sequence Type:を選択。

f:id:kazumaxneo:20210202220747p:plain

 

Select Physicochemical Properties:を選択。 physicochemical indices for dinucleotides (DNA)として分析できる項目には膨大な種類がある。

f:id:kazumaxneo:20210202220904p:plain

 

submitをクリックすると結果が表示される。下はbase stackingの結果。f:id:kazumaxneo:20210202221102p:plain

 

右上からグラフの種類を変えたり、拡大縮小、グラフの保存などが可能。

Bar chartに変換

f:id:kazumaxneo:20210202221313p:plain

上のMain Pageをクリックすると配列ウィンドウに戻る。 

 

次はRNAのexample data

f:id:kazumaxneo:20210202221404p:plain

今度は複数選択、

f:id:kazumaxneo:20210202221558p:plain

視覚化された。

f:id:kazumaxneo:20210202221611p:plain

 

次は複数の配列を同時に分析。

Visualization => Multiple sequence mode

f:id:kazumaxneo:20210202221755p:plain

 

proteinを調べる。

f:id:kazumaxneo:20210202232040p:plain

 Multiple sequence modeを選択、2配列ともチェックをつける。
 

f:id:kazumaxneo:20210202232127p:plain

 

分析したいAAindex(wiki)を選択。

f:id:kazumaxneo:20210202232220p:plain

AAindexについてはこちらを参照(https://www.genome.jp/aaindex/AAindex/list_of_indices)。

 

ARGP820101(Hydrophobicity index)を選択してサブミットした。

f:id:kazumaxneo:20210202232609p:plain

 

 

次はOpen Example Folderを選択

f:id:kazumaxneo:20210202095406p:plain

 

読み込まれたフォルダのORI.fasを選択した。

f:id:kazumaxneo:20210202095548p:plain

 

外部から配列を読み込んだりペーストしたときは、読み込み後にsequence typeを指定しておく。

f:id:kazumaxneo:20210202233810p:plain

 

sequence type指定後

f:id:kazumaxneo:20210202233851p:plain

 

特徴の密度マップを示すDensity mapを使う。

f:id:kazumaxneo:20210202233332p:plain

パラメータを指定(パラメータについてはmanual参照)

f:id:kazumaxneo:20210202233113p:plain

 

ラベルファイルをアップロードする。

f:id:kazumaxneo:20210202233529p:plain

視覚化された。

f:id:kazumaxneo:20210202233156p:plain

 

 

引用

VisFeature: a stand-alone program for visualizing and analyzing statistical features of biological sequences
Jun Wang, Pu-Feng Du, Xin-Yu Xue, Guang-Ping Li, Yuan-Ke Zhou, Wei Zhao, Hao Lin, Wei Chen
Bioinformatics, Volume 36, Issue 4, 15 February 2020, Pages 1277–1278