macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

シンプルなSRA検索webサイト SRA Explorer

 

DDBJ、EMBL-EBI、NCBIのSRAの 検索エンジンは情報が多く、簡単にシーケンスデータを取ってくるにはやや使いにくい。ExplorerはSRAの検索ツール。Phil Ewels さんが作成されたwebツールで、SRAのAPIを使い、高速にSRAのデータを検索する。シンプルなインターフェイスで使いやすい。bashのダウンロードスクリプトも作ってくれるので、ペーストすればですぐにシーケンスデータのダウンロードを始められる。

  

 公式サイト 

http://opensource.scilifelab.se/projects/sra-explorer/

Github

f:id:kazumaxneo:20180118221030j:plain


IDが"ERR194146"というヒトのデータを検索してみる。

f:id:kazumaxneo:20180118223916j:plain

 

 hitした。Hiseq2000で読んだデータと出ている。チェックボックスにチェックを入れてAdd to collectionを選択。

f:id:kazumaxneo:20180118224047j:plain

 

右上の1 saved datasetsをクリック

f:id:kazumaxneo:20180118224131j:plain

 

Bashスクリプトをクリック。Copyボタンを押してf:id:kazumaxneo:20180118224207j:plain

 

ターミナルにペースト。ダウンロードが始まる。

f:id:kazumaxneo:20180118224332j:plain

Raw Download URLsを選択すれば、FTPのURLも入手できます。FTPツールを使っている人はこちらをCopyしてください。ブラウザのURLバーboxに貼ってもダウンロードできます。

 

ギガサイズの生き物だと数日時間がかか場合もあるので、Asperaの利用も検討してみてください。

http://cell-innovation.nig.ac.jp/surfers/Aspera_download.html

 

 

他にもキーワード検索できるSRAサイトもあります。

DBCLS SRA

こちらは日本の研究者の方が製作しています。数年前に日本のNGSコミュニティサイトでアナウンスされていたはずです。

 

引用

Github

https://github.com/ewels/sra-explorer