macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

ゲノムビューア Genomeview

 

 コスト削減と性能向上のために、ハイスループットシークエンシングや次世代シークエンシング(NGS)マシンは世界中の数十のゲノム研究所で数百万の配列を生産している(論文より ref.1-4)。 NGSデータのアプリケーションは多様であり、例えば、NGSは、大規模なメタゲノミクスプロジェクトにおけるウイルスおよびバクテリア集団におけるゲノム多様性を効率的に調べることに使用されている(ref,5)。 NGSのもう一つの応用例は、ヒト1000ゲノムプロジェクト(http://www.1000genomes.org/)またはシロイヌナズナ1001ゲノムプロジェクト(http://www.1001genomes.org/)のようなゲノムリシーケンシングである 。ゲノムゲノムリシーケンシング解析は、多型の検出(ref.6)、構造変異分析(ref.7)およびガンの対立遺伝子検出(ref.8)にとって重要である。RNA-seqでは、ESTまたはcDNAサンプルがシーケンスされ、リファレンスゲノムにマッピングされ、トランスクリプトームに対するユニークな洞察を提供する(ref.10,11)。 ChIP-seqは、in vivoで転写因子結合部位をマッピングするためのチップオンチップマイクロアレイに対する実行可能な代替手段を提供する(ref.12)。

(2段落略)

 大量のシーケンスデータ生成は、視覚化の必要性を大きくしてきている。生物学的データの目視による検査は、研究者が結果を伝え、新しい仮説を生成し、生物学的プロセス(ref.20)に洞察を提供するのに役立つので非常に重要になる。多くの分析は計算によって行われるが、しばしば人間の判断を必要とするステップがある。この場合、ビジュアライゼーションは、新しく生成された結果のサニティチェックとして非常に貴重であるか、または新しい実験を計画するための自動化された方法に貴重な補足を提供する(ref.21)。マッピングされたショート・リード、マルチプル・アライメント、またはゲノム・アノテーション・データをブラウズするのに利用できるリソースがいくつかあるが(論文 表1)、異なるデータ・タイプを包括的にサポートするインタラクティブ・ブラウザはまれで、そこにはスピード、解像度、使いやすさ、ファイル形式、コスト、および限定された統合および拡張オプションも含まれる。データを適切に処理するための適切なソフトウェアツールの選択は非常に限られている(ref.21)。これらの課題に対処するために、著者らは、ゲノムブラウザGenomeViewを紹介する。GenomeViewは、ユーザーフレンドリーで直感的な方法で、NGSの結果を幅広く扱うことができるゲノムブラウザである。 GenomeViewは、シーケンス、アノテーション、複数のリードのアライメント、NGSデータを一度にゲノム規模でブラウズするように設計されている。これは、高速でスタンドアロンインタラクティブなブラウザで、ユーザーはデータの概要を見たり、ズーム機能を使って1塩基解像度までズームインすることもできる。通常のズームとは対照的に、セマンティックズームはグラフィカル表示のサイズを変更するだけでなく、表示するデータの選択と構造を変更するため、ユーザーにとってより有用な情報を提供する。

 

公式HP

http://genomeview.org

wiki

http://genomeview.org/manual/Main_Page

f:id:kazumaxneo:20180629234020p:plain

RNA seqの分析例。公式より転載。

 

Genomeviewはゲノムビューア。fasta、gff、bed、bamファイル等を読み込んで、表示させることができる。かなり昔から使用されており、たくさんの人がツイートしている(一部は下に書いた同名ツールのことと思われる)。


インポート可能なファイルフォーマット。

f:id:kazumaxneo:20180630002046p:plain

 

ローカル版インストール

公式からダウンロードする。

GenomeView

Githubのページはこちら。

https://github.com/GenomeView/genomeview

java -Xmx1g -jar genomeview.jar

 

ラン

Quick start

http://genomeview.org/content/quick-start-guide

ダウンロードをクリックし、java webスタート版を開始する。mac osが起動をブロックしてしまった時は、リンゴの環境設定=> セキュリティから"このまま開く"をクリックする。

f:id:kazumaxneo:20180630001301p:plain

FASTAファイルを指定して起動する。左上のimportからgffやbamをimportする。

f:id:kazumaxneo:20180630001436p:plain

表示の細かいチューニングはできないが、動作が高速なのが特徴で、macbookのtrackpadで左右にフリップすると軽快に移動できる。拡大縮小はメニューバーの虫眼鏡ツールで行う。また環境設定はFile => Configurationから行う。 

 

 

2018年には別の研究者のチームから同名のツールが出てきています(Preprint)。

https://www.biorxiv.org/content/biorxiv/early/2018/06/26/355636.full.pdf

Github

https://github.com/nspies/genomeview

 

引用

GenomeView: a next-generation genome browser

Thomas Abeel, Thomas Van Parys, Yvan Saeys, James Galagan, and Yves Van de Peer

 Nucleic Acids Res. 2012 Jan; 40(2): e12.