macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

NCBIデータベースをダウンロードする ncbi-blast-dbs

2018 12/10 タイトル訂正

 

 ncbi-blast-dbsはデータベースファイルを並行してダウンロードすることで、NCBIのデータベースをローカルに用意するのにかかる時間を短縮する。使用するスレッド数は自動的に決定される。 MD5チェックサムが検証され、ダウンロード時にデータベースボリュームが抽出される。 データベースボリュームは特定の順序でダウンロードされない。 新しいバージョンがサーバー上で使用可能な場合はボリュームが更新され、破損している場合は再ダウンロードされる。 中止されたダウンロードは安全に再開される。

 

ncbi-blast-dbsに関するツイート

 

 

インストール

mac os10.14でテストした。

依存(一部)

本体 GIthub

gem install ncbi-blast-dbs

#md5sumコマンドがないならhomebrewで導入
brew install md5sha1sum

 > ncbi-blast-dbs -h

$ ncbi-blast-dbs 

 

refseq_protein, 16SMicrobial, cdd_delta, env_nr, env_nt, est, est_human, est_mouse, est_others, gss, gss_annot, htgs, human_genomic, nr, landmark, nt, other_genomic, pataa, patnt, pdbaa, pdbnt, ref_prok_rep_genomes, ref_viroids_rep_genomes, ref_viruses_rep_genomes, refseq_genomic, refseq_rna, refseqgene, sts, swissprot, taxdb, tsa_nr, tsa_nt, vector, est_human_blob, taxdump

そのまま叩くとダウンロードできるデータベース一覧が表示される。 

 

実行方法

例えばローカル環境にBLAST検索データベースを構築するため、全データベースをダウンロードする。

ncbi-blast-dbs nt nr

 

NCBIは、FTPサーバからダウンロードする際、メールアドレスを送ることになっている(らしい)。メールアドレスを送りダウンロードするには、コマンドを以下のように変える。

email="my email address here" ncbi-blast-dbs nr

 

どのようなデータベースがダウンロードできるかと、blastの使い方についてはこちらのチュートリアルをみて下さい。

引用

GitHub - yeban/ncbi-blast-dbs: Fast download BLAST databases from NCBI.

 

関連ツール