macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

circosVCF

 

 1000米ドル未満で全ゲノムをシーケンスするという目標が現実になり、医療における全ゲノムシーケンス利用が次第に増えている。 Genomics England (http://www.genomicsengland.co.uk/)などの大規模ゲノムプロジェクトは、数千のゲノムから収集された情報を使用して、健康と病気をよりよく理解することを目的としている。次世代のシーケンス研究から得られたデータを分析するために、さまざまなタイプのソフトウェアが開発されている。全ゲノムVCFファイルは、エクソームVCFファイルの平均10倍の大きさになる。ただし、既存のツールのほとんどは、全ゲノム研究によって生成されるファイルのサイズの増加を無視しているため、大容量メモリなどの余分な要件のために不適切になる。効率的な全ゲノムデータ解析ソフトウェアツールの必要性が高まっている。

 さまざまなプラットフォームが、ヒトNGSデータの分析用に提案されている。(一部略)VarSifter Teer et al (2012)は、グラフィカルユーザーインターフェイスGUI)の助けを借りて幅広い種類のクエリを定義できる、強力な公開ツールである。ただし、メモリでは使いやすさが制限される。 (一部略)

 ここでは、大きなVCFファイルの分析を実行するように設計されたソフトウェアツールであるVCF-Explorerを紹介する。 VCF-Explorerは軽量な構造で、メモリを使い果たすことなく非常に大きなファイルを処理できる。 GUIを使用すると、アノテーションのバリアントを簡単にフィルタリングできる。 ITのバックグラウンドを持たない臨床医と研究者は、簡単にツールを使用できる。初期ファイルのロードや前処理は行われないため、CPU時間とメモリが節約される。シンプルなパーソナルコンピューターや、より大きな機能を備えた大型サーバーで使用できる。

 

  

 

circosVCF demo

 

HP

https://www.ariel.ac.il/wp/fbl/software/

CircosVCF exercise

https://en-lifesci.m.tau.ac.il/sites/lifesci_en.tau.ac.il/files/media_server/all-units/CircosVCF_Ex.pdf

 

 

使い方

http://legolas.ariel.ac.il/~tools/CircosVCF/ にアクセスする。 

種を指定する。

f:id:kazumaxneo:20191121033400p:plain

 ゲノムの バージョンを指定する。

f:id:kazumaxneo:20191121033413p:plain

 描画する染色体を指定する。

f:id:kazumaxneo:20191121033415p:plain

saveをクリック。

 

VCFをアップロードする。

f:id:kazumaxneo:20200117010701p:plain

 

途中からうまく動作しなくなりました。ネットワークが不安定なのか、メンテナンスされていないのか不明ですが、できるようになったら追記します。

 

補足

ローカルのkaryotypeファイルを使う。chr番号とサイズを記載したタブ区切りファイルを用意する。

f:id:kazumaxneo:20200117005944p:plain

これをアップロードする。

 

 

 

引用
CircosVCF: circos visualization of whole-genome sequence variations stored in VCF files

Drori E, Levy D, Smirin-Yosef P, Rahimi O, Salmon-Divon M

Bioinformatics. 2017 May 1;33(9):1392-1393

 

関連