macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

BLAST2GOでアノテーションをつける

basic版をここからダウンロード。インストールが終わったら立ち上げる。

統合TVの説明を参考にした。

 

 

BLAST2GOを起動したら、上のメニューからSTART -> Load Sequences -> Broseを選択し読み込むFASTAファイルを選択 -> Openボタンで読み込み。

 

基本的に左のアイコンから順に実行していく。解析が終わるとその色がつく。例えばblastはオレンジアイコンだが、blastがおわった配列はオレンジになってかつTagの列が紫になる。

 

 

 左端から3番目のBLAST

上のメニューからBLAST -> Run blast -> NCBI blast -> blastxを選択。データベースは"nr"。メールアドレスを入れて、そのほかはデフォルトのまま実行。

1配列で10分前後かかる。数千配列あるなら10日くらいかかるかもしれない。ちなみに

 local データベースを作成して高速化も可能らしい。

 ただし、nrのデータベースでもかなり容量がある。2016年頭にダウンロードしたときは解凍後200GBくらいにはなった。ダウンロードにも相当な時間がかかったし、保存場所も確保しないといけない。ローカルサーバーがあれば問題ないが、そうでなく時折しかblast解析しないのであればネットワーク版で問題ないと思う(ローカル版のデータベースの差分更新も既知の方法はありそう)。

 

 左端から4番目のINTERPRO SCAN

BLAST解析と並列化することが可能。役割はこちらのスレッドが分かりやすい。

やってることはモチーフ検索。blastでhypothetical proteinしかヒットしなくてもInterpro scanならみつかるかもしれない。統合TVの説明。

 

 上のメニューからInterpro -> Run interpro -> メールアドレスを記入してそのほかはデフォルトのまま実行。blastより短い傾向にあるがblastx同様1配列で数分かかるので、やはりこれも気長に終わるのを待つ。

 

 

  左端から5番目のmapping

blast情報に従ってgo termを関連付けする作業。

上のメニューからmapping-> Run mapping ->Runボタンをクリック。これだけ。

 

 

  左端から6番目のアノテーション

Go termは複数つくので、適切なものを選ぶ作業。

上のメニューからannotation-> Run annotation-> デフォルトのままRunボタンをクリック。

 

 

  左端から7番目のStatics

様々な情報を見ることができる。

 

 

エンリッチメント解析

特定のサンプルのみ変動している遺伝子群をGo termでまとめることができる。

メニューバーのAnalysis -> Enrichment Analysisを選択。

 

引用

Blast2GO: a universal tool for annotation, visualization and analysis in functional genomics research

Conesa A, Götz S, García-Gómez JM, Terol J, Talón M, Robles M.

Bioinformatics. 2005 Sep 15;21(18):3674-6. Epub 2005 Aug 4.