macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

IGVのtips その2

2021 2/17 tips追記

 

IGVをより便利に使う方法はないでしょうかという質問があったので、今日は自分が知っているIGVのtipsをいくつか紹介します。

 

 

 

IGVの公式動画チャンネルがあります。

 

統合TVでもIGVの基本的な使い方について分かりやすく説明されています

 

インストール

IGVのCUIへの導入はcondaで出来ます。ここでは高速なmambaを使います。

mamba install -c bioconda -y igv

> igv --help

Command line options:

Space delimited list of data files to load

--preferences, -o  Path or URL to a preference property file

--batch. -b  Path or url to a batch command file

--port, -p  IGV command port number (defaults to 60151)

--genome, -g  Genome ID (e.g hg19) or path or url to .genome or indexed fasta file

--dataServerURL, -d  Path or url to a data server registry file

--genomeServerURL, -u  Path or url to a genome server registry file

--indexFile, -i  Index file or comma delimited list of index files corresponding to data files

--coverageFile, -c  Coverage file or comma delimited list of coverage files corresponding to data files

--name, -n  Name or comma-delimited list of names for tracks corresponding to data files

--locus, -l  Initial locus

--header, -H http header to include with all requests for list of data files

--igvDirectory Path to the local igv directory.  Defaults to <user home>/igv

--version  Print the IGV version and exit

--help Print this output and exit

様々なオプションが利用できます。たとえば-l (--locus)オプションを使うと、指定の染色体ポジションを初期位置にして起動できます。

 

 

Tips

1、マウスホバーした時にポップアップウィンドウが出ないようにする。

上のメニューの吹き出しマークをクリックしてNever~を選択します。show Details on clickを選ぶと、クリックした時に大型のポップアップウィンドウが表示されます。

f:id:kazumaxneo:20210214005223p:plain



2、読み込んだデータの環境を保存する。

IGVに複数のデータを読み込んで細かく設定を調整したら、後になって再びその環境を再現するのが難しくなります。その時はxmlのセッションファイルをexportしておくと、次回はそれを読み込むだけで環境が完全に再現されます。

 

IGVで表示を色々チューニングしたとします。

f:id:kazumaxneo:20210214010526p:plain

 

File => Save Sessionを選択して、xmlファイルを保存します。 

f:id:kazumaxneo:20210214005859p:plain

xmlファイルを保存したらIGVを終了します。

 

再びIGVを起動してFile => Open Sessionを選択、

f:id:kazumaxneo:20210214010911p:plain

 

カスタムした設定で読み込まれました。ポジションも完全に再現されています。

f:id:kazumaxneo:20210214011022p:plain

 

CUI環境でIGVを起動するなら、オプションなしでxmlを指定します。

igv igv_session.xml 

(前回と同じパスから起動する)

 

 

3、配列をコピーする。

様々なコピー方法が用意されています。まずはリファレンスの特定の領域の塩基配列をコピーするやり方です。メニューのアイコンからDefine regionsを選択します(上辺が赤いフロッピーディスクのようなマーク)。

f:id:kazumaxneo:20210214104720p:plain

 

アイコンの形が変わるので、カバレッジウィンドウ内でコピーしたい領域の左端か右端をクリックします。

f:id:kazumaxneo:20210214105356p:plain

縦に線がつきました。

 

左端を決めたので、次に右端をクリックします。クリックすると、その領域の上に赤いバーがつきます。

f:id:kazumaxneo:20210214105541p:plain

 

赤いバーを右クリックしてコピーします。

f:id:kazumaxneo:20210214110108p:plain

Copy sequences を選択、

 

テキストエディタにペースト。コピーされています。

f:id:kazumaxneo:20210214110208p:plain

赤いバーを右クリックしてremove~を選択するとバーは消えます。

 

 

次はシークエンシングリードの塩基配列をコピーしてしてみます。ここでは、ソフトマスクされた領域を調べることを目的とします。まずはソフトマスク領域を表示するようにIGVの設定を変更します。

View => Preference 、出てきたウィンドウのAlignmentタブを選択します。

f:id:kazumaxneo:20210214110728p:plain

 

show soft-clipped basesにチェックを付けます。これはデフォルトではオフになっています。

f:id:kazumaxneo:20210214110803p:plain

saveして閉じます。

 

末端がソフトクリップされたリードの全長が表示されました。リードの上で右クリックしてCopy read sequenceを選べば、そのリードの塩基配列がコピーされます。

f:id:kazumaxneo:20210214110956p:plain

 

ソフトクリップされた塩基配列だけコピーしたければ、copy left-clipped sequenceを選択します(ソフトクリップ領域がないリードでは表示されない)。ここではリファレンスと異なるGTTGGTTTTという配列だけがコピーされました。

f:id:kazumaxneo:20210214111534p:plain

 

 

次はCopy consensus sequenceです。これを選択すると、現在ウィンドウに表示されている領域のリファレンス配列とポジションごとのアラインメントの全塩基がATGCNそれぞれ集計されてコピーされます。

f:id:kazumaxneo:20210214112143p:plain

 

テキストエディタにペースト。samtools pileupの前半のフィールドと同じようなフォーマットになります。このままRなどで分析できます。

f:id:kazumaxneo:20210214112253p:plain

 

最後です。リファレンスにない塩基が挿入されている時、その挿入配列だけをコピーします。挿入はリードの上でⅠ(アイ)として表されます。

f:id:kazumaxneo:20210214112553p:plain

 

Ⅰ(アイ)のマークの上で右クリックしてCopy insert sequenceを選択するとコピーされます。

f:id:kazumaxneo:20210214112821p:plain

 

 

 

4、表示のカスタマイズ。

標準のリードアラインメントでは画面に収まりきらいない場合、右クリックしてExpandから変更します。collapsedに変えるとリードの厚みを小さくして、より多くのリードを表示できます。Suqalishedだと全てのリードがウィンドウ内に収まるように圧縮されます。

f:id:kazumaxneo:20210214123925p:plain

 

上のメニューresize tracesボタン(Xマーク)をクリックすると、一括でこのSuqalished表示を行えます。

f:id:kazumaxneo:20210214124215p:plain

 

カバレッジトラックの上でshow splice junction trackを選択すると、スプライスジャンクションをブリッジのマークで表示できます。

f:id:kazumaxneo:20210214130330p:plain


表示されました。このshow splice junction trackも1つのトラックです。

f:id:kazumaxneo:20210214130455p:plain

 

左端のトラックをシフトキーを押しながらクリックして、全トラックを選択します。それから右クリックすると、トラックの一括設定が行えます。

f:id:kazumaxneo:20210214124909p:plain

 

change track heightで200にします。

f:id:kazumaxneo:20210214124954p:plain

 

カバレッジトラックの高さが200になりました。

f:id:kazumaxneo:20210214125030p:plain

 

リードトラックを一時的に非表示にするなら、右クリックしてShow alignment Trackのチェックを外します。

f:id:kazumaxneo:20210217123202p:plain

 

リードトラックを完全に消すなら、右クリックしてremove trackを選択します。リードトラックは完全に消えます。

f:id:kazumaxneo:20210214125233p:plain

 

いかにもjavaGUIライクなトラック上下の二重境界線が邪魔なので、トラックをドラッグして1つのトラック内にカバレッジトラックを集めます。

移動しました。

f:id:kazumaxneo:20210214125358p:plain

追記

二重線を最初から非表示にしたければ、Preference => General => Display all tracks in a single panelにチエックをつけるのも手です。

f:id:kazumaxneo:20210215175551p:plain

 


色を変えます。各トラックの上で右クリックしてchange track colorを選択します。

変更しました。

f:id:kazumaxneo:20210214125632p:plain

 

右クリックしてsave imageを選択するとウィンドウ画像を保存できます。

f:id:kazumaxneo:20210214125813p:plain

 

View => set name panelを選択して、ネームパネルの幅を広くします。

f:id:kazumaxneo:20210214131123p:plain

 

ここでは300を選択。

f:id:kazumaxneo:20210214131153p:plain

 

続いてchange fot sizeでフォントサイズを変えます。

f:id:kazumaxneo:20210214131253p:plain

 

ここでは30を選択、

f:id:kazumaxneo:20210214131320p:plain

 

大きくなりました。

f:id:kazumaxneo:20210214131350p:plain

 

色々カスタマイズしたら、セッションを保存しておきます(2参照)。

 

 

 

引用

Integrative Genomics Viewer (IGV): high-performance genomics data visualization and exploration
Helga Thorvaldsdóttir, James T. Robinson, Jill P. Mesirov

Brief Bioinform. 2013 Mar; 14(2): 178–192. Published online 2012 Apr 19

 

参考


 

関連