1000米ドル未満で全ゲノムをシーケンスするという目標が現実になり、医療における全ゲノムシーケンス利用が次第に増えている。 Genomics England (http://www.genomicsengland.co.uk/)などの大規模ゲノムプロジェクトは、数千のゲノムから収集された情報を使用して、健康と病気をよりよく理解することを目的としている。次世代のシーケンス研究から得られたデータを分析するために、さまざまなタイプのソフトウェアが開発されている。全ゲノムVCFファイルは、エクソームVCFファイルの平均10倍の大きさになる。ただし、既存のツールのほとんどは、全ゲノム研究によって生成されるファイルのサイズの増加を無視しているため、大容量メモリなどの余分な要件のために不適切になる。効率的な全ゲノムデータ解析ソフトウェアツールの必要性が高まっている。
さまざまなプラットフォームが、ヒトNGSデータの分析用に提案されている。(一部略)VarSifter Teer et al (2012)は、グラフィカルユーザーインターフェイス(GUI)の助けを借りて幅広い種類のクエリを定義できる、強力な公開ツールである。ただし、メモリでは使いやすさが制限される。 (一部略)
ここでは、大きなVCFファイルの分析を実行するように設計されたソフトウェアツールであるVCF-Explorerを紹介する。 VCF-Explorerは軽量な構造で、メモリを使い果たすことなく非常に大きなファイルを処理できる。 GUIを使用すると、アノテーションのバリアントを簡単にフィルタリングできる。 ITのバックグラウンドを持たない臨床医と研究者は、簡単にツールを使用できる。初期ファイルのロードや前処理は行われないため、CPU時間とメモリが節約される。シンプルなパーソナルコンピューターや、より大きな機能を備えた大型サーバーで使用できる。
circosVCF demo
HP
https://www.ariel.ac.il/wp/fbl/software/
CircosVCF exercise
使い方
http://legolas.ariel.ac.il/~tools/CircosVCF/ にアクセスする。
種を指定する。
ゲノムの バージョンを指定する。
描画する染色体を指定する。
saveをクリック。
VCFをアップロードする。
途中からうまく動作しなくなりました。ネットワークが不安定なのか、メンテナンスされていないのか不明ですが、できるようになったら追記します。
補足
ローカルのkaryotypeファイルを使う。chr番号とサイズを記載したタブ区切りファイルを用意する。
これをアップロードする。
引用
CircosVCF: circos visualization of whole-genome sequence variations stored in VCF files
Drori E, Levy D, Smirin-Yosef P, Rahimi O, Salmon-Divon M
Bioinformatics. 2017 May 1;33(9):1392-1393
関連