DDBJ、EMBL-EBI、NCBIのSRAの 検索エンジンは情報が多く、簡単にシーケンスデータを取ってくるにはやや使いにくい。ExplorerはSRAの検索ツール。Phil Ewels さんが作成されたwebツールで、SRAのAPIを使い、高速にSRAのデータを検索する。シンプルなインターフェイスで使いやすい。bashのダウンロードスクリプトも作ってくれるので、ペーストすればですぐにシーケンスデータのダウンロードを始められる。
公式サイト
http://opensource.scilifelab.se/projects/sra-explorer/
IDが"ERR194146"というヒトのデータを検索してみる。
hitした。Hiseq2000で読んだデータと出ている。チェックボックスにチェックを入れてAdd to collectionを選択。
右上の1 saved datasetsをクリック
ターミナルにペースト。ダウンロードが始まる。
Raw Download URLsを選択すれば、FTPのURLも入手できます。FTPツールを使っている人はこちらをCopyしてください。ブラウザのURLバーboxに貼ってもダウンロードできます。
ギガサイズの生き物だと数日時間がかか場合もあるので、Asperaの利用も検討してみてください。
http://cell-innovation.nig.ac.jp/surfers/Aspera_download.html
他にもキーワード検索できるSRAサイトもあります。
こちらは日本の研究者の方が製作しています。数年前に日本のNGSコミュニティサイトでアナウンスされていたはずです。
引用
https://github.com/ewels/sra-explorer