basic版をここからダウンロード。インストールが終わったら立ち上げる。
統合TVの説明を参考にした。
BLAST2GOを起動したら、上のメニューからSTART -> Load Sequences -> Broseを選択し読み込むFASTAファイルを選択 -> Openボタンで読み込み。
基本的に左のアイコンから順に実行していく。解析が終わるとその色がつく。例えばblastはオレンジアイコンだが、blastがおわった配列はオレンジになってかつTagの列が紫になる。
左端から3番目のBLAST
上のメニューからBLAST -> Run blast -> NCBI blast -> blastxを選択。データベースは"nr"。メールアドレスを入れて、そのほかはデフォルトのまま実行。
1配列で10分前後かかる。数千配列あるなら10日くらいかかるかもしれない。ちなみに
ただし、nrのデータベースでもかなり容量がある。2016年頭にダウンロードしたときは解凍後200GBくらいにはなった。ダウンロードにも相当な時間がかかったし、保存場所も確保しないといけない。ローカルサーバーがあれば問題ないが、そうでなく時折しかblast解析しないのであればネットワーク版で問題ないと思う(ローカル版のデータベースの差分更新も既知の方法はありそう)。
左端から4番目のINTERPRO SCAN
BLAST解析と並列化することが可能。役割はこちらのスレッドが分かりやすい。
やってることはモチーフ検索。blastでhypothetical proteinしかヒットしなくてもInterpro scanならみつかるかもしれない。統合TVの説明。
上のメニューからInterpro -> Run interpro -> メールアドレスを記入してそのほかはデフォルトのまま実行。blastより短い傾向にあるがblastx同様1配列で数分かかるので、やはりこれも気長に終わるのを待つ。
左端から5番目のmapping
blast情報に従ってgo termを関連付けする作業。
上のメニューからmapping-> Run mapping ->Runボタンをクリック。これだけ。
左端から6番目のアノテーション
Go termは複数つくので、適切なものを選ぶ作業。
上のメニューからannotation-> Run annotation-> デフォルトのままRunボタンをクリック。
左端から7番目のStatics
様々な情報を見ることができる。
エンリッチメント解析
特定のサンプルのみ変動している遺伝子群をGo termでまとめることができる。
メニューバーのAnalysis -> Enrichment Analysisを選択。
引用
Blast2GO: a universal tool for annotation, visualization and analysis in functional genomics research
Conesa A, Götz S, García-Gómez JM, Terol J, Talón M, Robles M.
Bioinformatics. 2005 Sep 15;21(18):3674-6. Epub 2005 Aug 4.