macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

MG-RASTの公開データをダウンロードする mg-download.py 

 

MG-RAST-ToolsはMG-RAST開発者が作成した様々利用ケースに対応するためのAPI アクセスを可能にするスクリプトで、The MG-RAST metagenome portalリンク)のレポジトリとして公開されています「。多数のスクリプトが含まれていますが、その中で、mg-download.pyは、MG-RASTで公開されているデータをダウンロードするために利用できるスクリプトです。

 

インストール

condaを使って環境を作ってテストした(ubuntu18使用)。
Github

mamba create -n MG-RAST-Tools python=3.8 -y
conda activate MG-RAST-Tools
git clone http://github.com/MG-RAST/MG-RAST-Tools
cd MG-RAST-Tools
python setup.py build
python setup.py install

>  mg-download.py -h

usage: 

 

NAME mg-download VERSION 1 SYNOPSIS mg-download [ --help, --user <user>, --passwd <password>, --token <oAuth token>, --project <project id>, --metagenome <metagenome id>, --file <file id> --dir <directory name> --list <list files for given id>] DESCRIPTION

Retrieve metadata for a metagenome.

 

optional arguments:

  -h, --help            show this help message and exit

  --url URL             communities API url

  --user USER           OAuth username

  --passwd PASSWD       OAuth password

  --token TOKEN         OAuth token

  --project PROJECT     project ID

  --metagenome METAGENOME

                        metagenome ID

  --file FILE           file ID for given project or metagenome

  --dir DIR             directory to do downloads

  --list                list files and their info for given ID

 

Output List available files (name and size) for given project or metagenome id. OR Download of file(s) for given project, metagenome, or file id. EXAMPLES mg-download --metagenome mgm4441680.3 --list SEE ALSO - AUTHORS Jared Bischof, Travis Harrison, Folker

Meyer, Tobias Paczian, Andreas Wilke

 

 

実行方法

こちらのプロジェクト(国際ジオバイオロジーコース2016)のデータを1つダウンロードしてみる。


ダウンロードするにはMG-RASTのaccession IDを指定する。

 mg-download.py --metagenome mgm4709410.3
  • --project   project ID
  • --metagenome    METAGENOME
  • --dir   directory to do downloads

mgm4709410.3/

 

登録されているデータは、454やilluminaなどのなどのシークエンシングデータをprocessingした配列の場合もあるし(ペアエンドfastqはマージされていたりする)、アッセンブルされた配列である事もあります。また、ユーザー名とパスワードが無いと、従って登録関係者にコンタクトを取って許可を得ないとダウンロードできないデータや、指定期間はpublicではないデータもあります。ダウンロードできない時はデータのアクセス権がそもそもあるのか確認して下さい。

引用

https://github.com/MG-RAST/MG-RAST-Tools

 

関連