macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

ナノポアリードの分析ツール

 

2017年現在、すでにOXford nanoporeの分析ツールは色々発表されている。いくつかインストールとして実際に使ってみた結果を紹介する。

 

NanoOK

 

インストー

マニュアルページ

https://documentation.tgac.ac.uk/display/NANOOK/NanoOK+tutorial

本体以外に必要なものが記載されている。

  1. Java SE runtime environmenta.
  2. R statistical environment 
  3. LaTeX environment
  4. HDF5 tools
  5. LAST
  6. Git 

 

java SE、git、Rはたいていの人が持っているので、他のツールのインストールを行う。詳細は公式ページをみてください。

brew install LAST #ない人だけ
brew cask install mactex #LATEXのインストール 数時間かかった。

HDF5 toolsのbinaryリンク。

Obtaining the HDF5-1.8.7 Software

Mac OS X 10.7.0 (Intel 64-bit) を選んでダウンロードした。ダウンロードが終わったら適切な場所に移動させてhdf5-1.8.7-mac-intel-x86_64-shared/bin/へパスを通す。

 

テストラン

fast5からfastaを抽出し、アライメントしてレポートを出力するまでの流れをテストする。

 

1、NanoOK公式ページfast5テストデータをダウンロードする (約500MB)。

ダウンロードしたデータはE.coliをナノポアでシーケンスしたもので、中にはfast5のディレクトリとリファレンス配列のフォルダが入っている。

 

ダウンロードしたN79596_dh10b_8kb_11022015/のreferenceに移動してLASTのインデックスを作成する。

cd N79596_dh10b_8kb_11022015/references/ #移動
lastdb -Q 0 ecoli_dh10b_cs ecoli_dh10b_cs.fasta #index作成

LASTのindexファイルであるecoli~というファイルが7つできる。

 

2、fast5からfastaを抽出。

nanook extract -s N79596_dh10b_8kb_11022015

-sでfast5のディレクトリN79596_dh10b_8kb_11022015/を指定している。

 

--参考-- N79596_dh10b_8kb_11022015/にはfail/とpass/ディレクトリが入っている。

f:id:kazumaxneo:20170616141826j:plain

 

  passを展開すると、このようにたくさんのファイルが見つかる。

f:id:kazumaxneo:20170616141804j:plain

 

nanookコマンドでfastaの抽出を行うと、fasta/とlogs/ができる。

f:id:kazumaxneo:20170616141958j:plain

 

 

3、aリファレンスへのLASTを使ったアライメントを実行する。1でインデックスをつけたリファレンスを使う。

nanook align -s N79596_dh10b_8kb_11022015 -r references/ecoli_dh10b_cs.fasta

-sでfast5のディレクトリN79596_dh10b_8kb_11022015/を指定

-rでリファレンスを指定。

 N79596_dh10b_8kb_11022015/の中にlastディレクトリができる。

 

 

 

4、

レポートを出力する。

nanook analyse -s N79596_dh10b_8kb_11022015 -r references/ecoli_dh10b_cs.fasta -passonly

 

latex_last_passonly/にN79596_dh10b_8kb_11022015.texができる。これをアプリのtexで開き、

f:id:kazumaxneo:20170616231129j:plain

左上のダイプセットボタンをクリックするとレポートのpdfが現像される。

 

pdfはこのようなファイルになっている。

f:id:kazumaxneo:20170616231243j:plain

 

f:id:kazumaxneo:20170616232406j:plain

f:id:kazumaxneo:20170616232443j:plain

f:id:kazumaxneo:20170616232450j:plain

 

 

 

 

 

 

 

 

 

引用-------------------------------------------------------------------------------------------------------------

NanoOK

NanoOK tutorial - NanoOK - Earlham Institute Documentation