macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

オックスフォードナノポアのシーケンスデータの解析のための統合サーバー NanoForms

 

 次世代シーケンス(NGS)技術は、今日の遺伝学およびゲノミクス研究の展望を支配している。イルミナは依然として世界のシーケンサーを支配しているが、オックスフォード・ナノポアは、現在、生物学者、医学者、遺伝学者がさまざまな用途で使用している主要技術の1つである。Oxford Nanoporeは自動化されており、実験を行うのは比較的簡単だが、何GBもの生データを生成し、しばしば曖昧な代替バイオインフォマティクスコマンドラインツールや、実行するにはバイオインフォマティクスの知識が必要なゲノミクスフレームワークによって処理されなければならない。

 本著者らは、実験者とバイオインフォマティシャンの大学間コラボレーションを確立し、新しいバイオインフォマティクスツールをアカデミックに無料で提供することを目指した。このツールは、バイオインフォマティクスの知識がない人でも、ゲノムの生データを簡単に処理できるようにするものである。現在、ICTリソースのメンテナンスの関係で、我々(著者ら)のサーバーは小さなゲノム(15 Mbまで)しか扱えない。本論文では、Oxford Nanopore社の原核生物ゲノムデータを処理・解析するための直感的な統合ウェブサーバ、NanoFormsを紹介する。NanoFormsは、http://nanoforms.tech(ウェブサーバ)およびhttps://github.com/czmilanna/nanoformsGitHubソースリポジトリ)において、研究者向けに自由に利用することができる。

 

 

NanoForms

FAQ

https://nanoforms.tech/help/

(FAQでは15Gb以下のゲノムを扱えるとありますが、おそらく15Mbの間違いです)

 

インストール

ローカルサーバーを立ててテストした。

依存

  • Linux, recommended Ubuntu 20.04 LTS
  • Docker
  • docker-compose
  • Make

Github

docker-compose.envのユーザー名を修正する。ここではkazuにした。

git clone https://github.com/czmilanna/nanoforms.git
cd nanoforms/

#Step 1. Building images and deploying containers
sudo make deploy
#Step 2. Admin User creation
sudo make create_super_user
#ユーザ名、パスワード、メールアドレスを指定する。

#消すとき
sudo make destroy

 

 

利用方法

http://127.0.0.1:7337/にアクセスする。

右上からログインする。

 

1、シークエンシングリードのアップロード

Datasetsを選択。

ここではNanoporeを選択。名前を決めfastqをアップロードする (.fastq.gzを認識)。

 

2、QC

QCを実行する。アップロードしたデータ名を指定する。ここでは"illumina”という名前でアップロードしたショートリードのQCを実行する。

Qualityテストでは、統計的なサマリーといくつかのプロットを生成し、アップロードされたデータセットの品質を評価することができる(マニュアルより)。

 

Runningのステータスは計算が進行中であることを意味する。

出力例

 

 

3、アセンブリ

ONTアセンブリとハイブリッドアセンブリを選択できる。

ONTアセンブリ

Nanofilt -q: quality, 最小平均読み取り品質スコア(例: 10)でフィルタリング。
Nanofilt -headcrop: リードの先頭から n 塩基を切り詰める (例: 75)。
Filtlong --min_length : 塩基数で指定された割合のリードのみを残す(例:1000 - 1kbp未満のリードを破棄する)。
Filtlong --target_bases : この塩基数までのベストリードのみを残す(例えば 500000000 - 500 Mbp が残るまで最悪のリードを削除、非常に大きなリードセットに対して有効)。入力リードセットが 500 Mbp 未満の場合、この設定は効果がない)。
Prokka --genus : 属名 (デフォルト 'Genus')。
Prokka --species : Species 名 (デフォルトは 'species')。
Prokka --strain : Strain名(デフォルト'strain')。
Prokka --plasmid : プラスミド名または識別子(デフォルトは'')。

 

(一部省略)

(一部省略)

 

引用

NanoForms: an integrated server for processing, analysis and assembly of raw sequencing data of microbial genomes, from Oxford Nanopore technology
Anna Czmil, Michal Wronski, Sylwester Czmil, Marta Sochacka-Pietal, Michal Cmil, Jan Gawor, Tomasz Wołkowicz, Dariusz Plewczynski, Dominik Strzalka, Michal Pietal

PeerJ. 2022 Mar 29;10:e13056

 

関連