MG-RAST-ToolsはMG-RAST開発者が作成した様々利用ケースに対応するためのAPI アクセスを可能にするスクリプトで、The MG-RAST metagenome portal(リンク)のレポジトリとして公開されています「。多数のスクリプトが含まれていますが、その中で、mg-download.pyは、MG-RASTで公開されているデータをダウンロードするために利用できるスクリプトです。
インストール
condaを使って環境を作ってテストした(ubuntu18使用)。
Github
mamba create -n MG-RAST-Tools python=3.8 -y
conda activate MG-RAST-Tools
git clone http://github.com/MG-RAST/MG-RAST-Tools
cd MG-RAST-Tools
python setup.py build
python setup.py install
> mg-download.py -h
usage:
NAME mg-download VERSION 1 SYNOPSIS mg-download [ --help, --user <user>, --passwd <password>, --token <oAuth token>, --project <project id>, --metagenome <metagenome id>, --file <file id> --dir <directory name> --list <list files for given id>] DESCRIPTION
Retrieve metadata for a metagenome.
optional arguments:
-h, --help show this help message and exit
--url URL communities API url
--user USER OAuth username
--passwd PASSWD OAuth password
--token TOKEN OAuth token
--project PROJECT project ID
--metagenome METAGENOME
metagenome ID
--file FILE file ID for given project or metagenome
--dir DIR directory to do downloads
--list list files and their info for given ID
Output List available files (name and size) for given project or metagenome id. OR Download of file(s) for given project, metagenome, or file id. EXAMPLES mg-download --metagenome mgm4441680.3 --list SEE ALSO - AUTHORS Jared Bischof, Travis Harrison, Folker
Meyer, Tobias Paczian, Andreas Wilke
実行方法
こちらのプロジェクト(国際ジオバイオロジーコース2016)のデータを1つダウンロードしてみる。
ダウンロードするにはMG-RASTのaccession IDを指定する。
mg-download.py --metagenome mgm4709410.3
- --project project ID
- --metagenome METAGENOME
- --dir directory to do downloads
mgm4709410.3/
登録されているデータは、454やilluminaなどのなどのシークエンシングデータをprocessingした配列の場合もあるし(ペアエンドfastqはマージされていたりする)、アッセンブルされた配列である事もあります。また、ユーザー名とパスワードが無いと、従って登録関係者にコンタクトを取って許可を得ないとダウンロードできないデータや、指定期間はpublicではないデータもあります。ダウンロードできない時はデータのアクセス権がそもそもあるのか確認して下さい。
引用
https://github.com/MG-RAST/MG-RAST-Tools
関連