2021 2/2 タイトル変更
遺伝子やタンパク質の一次配列から機能的属性を予測するバイオインフォマティクスアルゴリズムの開発には多くの努力がなされてきた。その際の課題の一つとして、ヒューリスティック手法や反復法によって選択された統計的特徴を直感的に解析し、理解することが挙げられる。本論文では、DNA、RNA、タンパク質を含むあらゆる種類の生物学的配列の統計的特徴を直感的に可視化・解析できる有用なソフトウェアツールを目指したVisFeatureを開発した。VisFeatureには、配列データの検索機能、マルチプル配列アライメント機能、統計的特徴量生成機能が統合されている。
VisFeatureはJavaScript/ElectronとRを用いて実装されたデスクトップアプリケーションである。VisFeatureのソースコードはGitHubリポジトリ(https://github.com/wangjun1996/VisFeature)から自由にアクセスできる。サンプルデータセットを含むバイナリリリースは、同じ GitHub リポジトリ(https://github.com/wangjun1996/VisFeature/releases)から自由にダウンロードできる。
インストール
リリース(Releases · wangjun1996/VisFeature · GitHub)からダウンロードする。win32-x64を選んだ。他に、macosとubuntu16バージョンがある。
使い方
解凍してVisFeatureをクリックすると起動する。
manual.pdfも含まれている。
起動したところ
ウィンドウ上で右クリックしてexample fastaのDNAを表示する。
表示された。配列は直接タイプしたり、コピー&ペーストで貼り付けできる。ファイルから読み込むことも可能。
このDNA配列の物理化学的特性を調べる。1つの配列を調べる時は Single sequence modeを選択する。
Visualization => Single sequence mode
出てきたウィンドウで配列を選択、
Select Sequence Type:を選択。
Select Physicochemical Properties:を選択。 physicochemical indices for dinucleotides (DNA)として分析できる項目には膨大な種類がある。
submitをクリックすると結果が表示される。下はbase stackingの結果。
右上からグラフの種類を変えたり、拡大縮小、グラフの保存などが可能。
Bar chartに変換
上のMain Pageをクリックすると配列ウィンドウに戻る。
次はRNAのexample data
今度は複数選択、
視覚化された。
次は複数の配列を同時に分析。
Visualization => Multiple sequence mode
proteinを調べる。
Multiple sequence modeを選択、2配列ともチェックをつける。
分析したいAAindex(wiki)を選択。
AAindexについてはこちらを参照(https://www.genome.jp/aaindex/AAindex/list_of_indices)。
ARGP820101(Hydrophobicity index)を選択してサブミットした。
次はOpen Example Folderを選択
読み込まれたフォルダのORI.fasを選択した。
外部から配列を読み込んだりペーストしたときは、読み込み後にsequence typeを指定しておく。
sequence type指定後
特徴の密度マップを示すDensity mapを使う。
パラメータを指定(パラメータについてはmanual参照)
ラベルファイルをアップロードする。
視覚化された。
引用
VisFeature: a stand-alone program for visualizing and analyzing statistical features of biological sequences
Jun Wang, Pu-Feng Du, Xin-Yu Xue, Guang-Ping Li, Yuan-Ke Zhou, Wei Zhao, Hao Lin, Wei Chen
Bioinformatics, Volume 36, Issue 4, 15 February 2020, Pages 1277–1278