macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

microbiome研究のためのプラットフォーム iMicrobe

 

 iMicrobeは、研究者自身のデータを公開し、精選された微生物のメタゲノムデータセットと分析のための高性能コンピューティング(HPC)メソッドに接続するプラットフォームである[ref.1]。過去10年間で、シーケンシングのコストはムーアの法則をはるかに上回る速度で低下し、生物学的データセットの数とサイズが急速に増加した[ref.2]。現在、研究者は、大規模な「オミックスデータ」からセンサーからのストリーミングデータに至るまで、前例のない規模と多様なデータにアクセスできる。生物学者は、分析を実行するためにHPCクラスターのパワーとストレージをますます必要としている。ただし、ほとんどの生物学者はこれらのリソースへのアクセスが制限されているか、まったくないため、多くの場合、自分のパソコンで分析を実行する必要がある。

 計算生物学におけるHPCの必要性の高まりに対処するために、全米科学財団は、エクストリームサイエンスアンドエンジニアリングディスカバリー環境(XSEDE)[ref.3]や( TACC)テキサス大学オースティン校のTexas Advanced Computing Centerの18ペタフロップススーパーコンピューターStampede2などの共有サイバーインフラリソースにfunded(資金提供)した。 TACCにいる開発者は、Representational State Transfer(REST)[ref.5] APIであるAgave [ref.4]を作成し、アプリケーション(アプリ)の作成と編集、ジョブのスケジューリングと監視、分析結果の表示と取得を含むStampede2のリソースとやり取りする。 iMicrobe Webサイトは、Agave API [ref.6]を使用して、CyVerse [ref.7]データストア[ref.8]およびStampede2 HPCなどのHPCリソースへのWebベースのポータルを無料のCyVerseアカウント経由で作成する。

 iMicrobeユーザーは、Webブラウザを使用して、高度海洋微生物生態学研究および分析(CAMERA)[ref.9]のサイバーインフラストラクチャなどの公開メタゲノムデータセットを検索し、データをカートに保存し、独自の個人データセットをアップロードし、Stampede2などの無料の計算機を使ってプライベートで30以上の分析ツールを実行できる。iMicrobeのすべてのデータは、FTP [ref.10]経由で、またはCyVerseデータストアからiRODS [ref.11](コマンドライン)またはCyVerse Data Commons [ref.12](Webブラウザ)経由でも利用できる。 Agave APIでは、CyVerse Software Development Kit(SDK)[ref.13]を介して、データとパイプラインに直接コマンドラインでアクセスすることもできる。ユーザーは、Stampede2に直接ログインし、Singularity [ref.14]コンテナでiMicrobeの分析ツールを使用するか、ソースからコンテナを構築して自分のコンピューティングリソースで使用できる。最後に、開発者はAgave APIを使用して、iMicrobeに統合できる新しいツールを作成できる。

 

 Documentation

https://hurwitzlab.gitbook.io/imicrobe/

 

 

使い方

https://www.imicrobe.us にアクセスする。

f:id:kazumaxneo:20191022204716p:plain

 

黄色のLOGINボタンからログインする。

 

ここではAppsの流れだけ説明する。

上のメニューからTools => Appsを選択。

f:id:kazumaxneo:20191022223926p:plain

 

 

iMicrobeに組み込まれたツールの一覧が表示される。

f:id:kazumaxneo:20191022224033p:plain

 

ここではcentrifugeを選択。

https://www.imicrobe.us/#/apps/65

f:id:kazumaxneo:20191022224323p:plain

 

解析するデータを指定する。Data storeをクリックする。

f:id:kazumaxneo:20191022224402p:plain

 

自分のcyverseアカウントのhomeにつながっているので、解析に供するファイルを指定する。そのため、データは前もってcyverseにアカウントを作り、ファイルをアップロードしておく必要がある。

f:id:kazumaxneo:20191022223454p:plain

 

cyverseの使用方法やファイルupload手順は下にリンクを貼ったcyverseの紹介参照。

 

 残りの設定を指定したらexecuteをクリックする。

f:id:kazumaxneo:20191022225103p:plain

このアプリケーションは12時間リソースを使うことを許容されている。

 

Browseにはrecommended readingという、オススメのジャーナルへのリンク集もあったりする。

f:id:kazumaxneo:20191022225445p:plain

 

他にもprotein searchやtaxnomy searchなどのサービスがあります。アクセスしてみて下さい。

引用

iMicrobe: Tools and data-driven discovery platform for the microbiome sciences
Ken Youens-Clark, Matt Bomhoff, Alise J Ponsero, Elisha M Wood-Charlson, Joshua Lynch, Illyoung Choi, John H Hartman, Bonnie L Hurwitz
GigaScience, Volume 8, Issue 7, July 2019

 

関連


*1

始めMetaGeneAnnotatorを使おうとすると、スタート後にCyverse permission errorになった。Cyverse側でファイル権限をいじるコマンドがなく、Documentにも記載がないので、構築時のバグかもしれない。