macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

スモールゲノムを可視化したり、複数ゲノムを比較して似た領域、異なる領域を可視化できる Gview

 

 グラフィックなゲノムマップは、ゲノムの特徴および配列の特徴を評価するために広く使用されている。 CGView(Circular Genome Viewer)ソフトウェアファミリーは、バクテリア、オルガネラ、ウイルスのゲノムマップを生成するためのツールの人気のあるコレクションである。 このレビューでは、オリジナルのCGViewプログラムの機能と、それ以降のコンパニオンアプリケーション(CGViewサーバやCGView Comparison Tool(紹介)など)の機能について説明する。 また、GView、CGViewのグラフィカルユーザーインターフェイス対応書き換え、および比較ゲノムのコレクションに対して共有または固有のゲノム領域を識別するためのいくつかの統合分析を提供するGViewサーバーについても説明する。 最後に、使いやすさを増しながら新しい機能を追加することを目的とした、CGViewに関連した現在の開発努力についていくつか述べておく。


Gview HP

https://www.gview.ca/wiki/GView/WebHome

Image Gallery

GView

f:id:kazumaxneo:20190302120815p:plain

 

インストール

https://www.gview.ca/wiki/GViewDownload/WebHome

このリンクからGView 1.7をダウンロードする。

java -jar gview.jar -h

$ java -jar gview.jar -h

usage: java -jar gview.jar [OPTION]...

-h, --help                  Print the usage.

-H, --height <integer>      Specifies the height in pixels for the image.

-c, --centerBase <integer>  Specifies the base pair value to center on.

-i, --inputFile <file>      The input file to parse.

-l, --layout <layout>       The layout of the input, 'circular' or 'linear'.

-f, --imageFormat <format>  The format of the output: [png, jpg, svg, svgz] (default:png)

-o, --outputFile <file>     The image file to create.

-v, --viewer                Loads up the input file in the genome viewer.

-s, --style <file>          The file to read the style information from.

-b, --birdsEyeView          Displays a birds eye view of the map.

                              This is ignored if -v is not used.

-g, --gffFile <file>        Specifies a .gff file with additional annotations to include.

                              Can be used multiple times for multiple files.

-W, --width <integer>       Specifies the width in pixels for the image.

-z, --zoomAmount <real>     The factor to zoom in by.

-t, --threads <integer>     The number of threads to use.

                              The default is the maximum threads the JVM can acquire.

-q, --quality <quality>     The initial rendering quality of the display, 'low' or 'high'.

                              The default quality is high.

--version                   Print version information.

 

Example:  java -jar gview.jar -i example_data/NC_007622.gbk -s example_styles/basicStyle.gss -l linear -W 1200 -H 900 -f png -o image.png

Example:  java -jar gview.jar -i example_data/NC_007622.gbk -s example_styles/gssExample.gss -l circular -v -b

またはjava webスタート版(リンク)を起動する。

 

実行方法

方法1

起動し、javaGUIウィンドウ(ガワ)で操作する。

java -jar gview.jar 

起動直後

f:id:kazumaxneo:20190302121443p:plain

Filesにgenbankファイルを指定する。拡張子は".gbk"でないといけない。circularかlinearかを選択してBuildMapをクリックする。

 

可視化された。

f:id:kazumaxneo:20190302132931p:plain

linear表示

f:id:kazumaxneo:20190302133552p:plain

 

上のメニューで拡大縮小したりスクロールできる。左端の二つのボタンが拡大縮小になる。目のアイコンはバードビューで自由に拡大縮小出来る。目のアイコンの左隣のFit map to screenボタンをクリックすると、ウィンドウサイズに合わせ画像サイズがめいいっぱいの大きさに調節される。右端のボタンで画面スクロールできるが、あまり調整できないので、Fit map to screenボタンの方が使いやすい。

f:id:kazumaxneo:20190302133023p:plain

 

 

方法2

コマンドでgenbankファイルを指定する。exampleのgenbankファイルを使ってみる。

java -jar gview.jar -i08-5578.gbk -l linear -W 1200 -H 900 -f png -o image.png

exampleのgenbankファイル(ダイレクトダウンロードリンク

 

GView Style Sheet (GSS)のファイルを指定すると、細かな設定ができる。exampleのgssファイル(ダイレクトダウンロードリンク)をダウンロードして指定してみる。

wget https://www.gview.ca/pub/GViewQuickStart/GViewWebStart/basicstyle.gss
java -jar gview.jar -i08-5578.gbk -f basicstyle.gss -l circular -W 1200 -H 900 -f png -o image1.png

wget https://www.gview.ca/pub/GViewQuickStart/GViewWebStart/gssexample.gss
java -jar gview.jar -i08-5578.gbk -f gssexample.gss -l circular -W 1200 -H 900 -f png -o image2.png

 image1.png

f:id:kazumaxneo:20190302154231p:plainimage2.png

f:id:kazumaxneo:20190302154240p:plain

GSSファイル指定なし

f:id:kazumaxneo:20190302154418p:plain

 

 

 

方法3

オンラインで使用する。https://server.gview.caにアクセスする。

f:id:kazumaxneo:20190302154513p:plain

ガイド

GView Server

 

タイプを選ぶ。

f:id:kazumaxneo:20190302163749p:plain

以下の9つのタイプがある。

  1. Display genome features    Upload a rich sequence file (GenBank or EMBL) to display features in an interactive GView map. 
  2. BLAST atlas    Create a BLAST atlas by uploading a reference genome and one or more related genomes. Regions will be displayed where there is similarity between the reference genome and one of the related genomes.
  3. Core genomes   View the core regions of a genome by uploading a reference genome and a query file containing multiple related genomes. This will highlight the regions in the reference genome that also exist in all of the query genomes. 
  4. Accesory genome   View the accessory regions of a genome by uploading a reference genome and a query file containing multiple related genomes. The resulting regions displayed will be those that had BLAST hits to some sequences in the query file, but not to every sequence in the query file.
  5. Unique genome   View the unique regions of a genome by uploading a reference genome and a query file containing multiple related genomes. The resulting regions displayed will be those that had no BLAST hits to any sequence in the query file.
  6. Signature genome   Find the signature regions of a genome by uploading a reference genome and a set of inclusion and exclusion genomes. The inclusion genomes should be very similar to the reference genome. The exclusion genomes should be similar to the reference genome, but lacking signature characteristics. The resulting regions displayed will be those that are found in the inclusion genomes but not in the exclusion genomes. 
  7. Pangenome analysis   Create a pangenome by uploading a collection of similar query genomes. A seed genome is selected and other query genomes are compared to the seed to locate the unique regions. 
  8. Reciprocal blast   Upload a reference sequence file and a query sequence file to perform a reciprocal BLAST and display features in an interactive GView map.
  9. Custom analysis   Create a fully customized GView analysis.

詳細はリンク先のAnalysis typeを参照して下さい(リンク)。

 

ここでは"Display genome features"と"Pan genome"を試してみる。

まずDisplay genome featuresの流れを確認していく。TypeはDisplay genome featuresを選択、リファレンスのgenbankファイルを指定し、continueボタンをクリック(注 いずれのプログラムのランにもgenbankファイルが必要)。

f:id:kazumaxneo:20190302175719p:plain
メールアドレスを記入するとjob完了時に通知してくれる(未テスト)。

 

表示する項目を指定したり、色を変更する。

f:id:kazumaxneo:20190302175838p:plain
GC content表示にチェックをつけた。

 

featureの色を変えるには、上の画像の下の方にあるカラーボックスの左隣のテレビのようなアイコンをダブルクリックする。↓のウィンドウが出現するので、色を指定する。

f:id:kazumaxneo:20190302170011p:plain

okを押して閉じる。

 

最後にcompleteを押すとジョブが開始される。

f:id:kazumaxneo:20190302170014p:plain

 

テスト時は10分ほどで終わった。

f:id:kazumaxneo:20190302181152p:plain

画像をダウンロードしたり、ここからjava webスタートを立ち上げて、ローカルのGview.jarで編集することもできる。

 

 

次に"Pan genome"を試してみる。

f:id:kazumaxneo:20190302191717p:plainPan genomeを 選択。Pan genomeモードでは親ゲノムというものはないので、そのままContinueをクリック。

 

step2ではgenbankファイルを追加していく。

f:id:kazumaxneo:20190302191801p:plain

緑のボタンを押し、第2、第3..と、全ゲノムのgenbankを追加していく。最後にContinueをクリック。

 

step3でパラメータを設定してジョブを開始する。

 

終わると、比較した図が出力される。

f:id:kazumaxneo:20190302192225p:plain

 

java webスタートを立ち上げて、開き直した。表示項目を変更したい時にも便利です(Style -> Style Editor)。

f:id:kazumaxneo:20190302192417p:plain

 

exampleには様々な例が載ってますね。

https://server.gview.ca/examples

引用

Visualizing and comparing circular genomes using the CGView family of tools
Paul Stothard, Jason R. Grant, Gary Van Domselaar
Briefings in Bioinformatics, bbx081, Published: 26 July 2017

関連