2017年現在、すでにOXford nanoporeの分析ツールは色々発表されている。いくつかインストールとして実際に使ってみた結果を紹介する。
NanoOK
インストール
マニュアルページ
https://documentation.tgac.ac.uk/display/NANOOK/NanoOK+tutorial
本体以外に必要なものが記載されている。
java SE、git、Rはたいていの人が持っているので、他のツールのインストールを行う。詳細は公式ページをみてください。
brew install LAST #ない人だけ
brew cask install mactex #LATEXのインストール 数時間かかった。
HDF5 toolsのbinaryリンク。
Obtaining the HDF5-1.8.7 Software
Mac OS X 10.7.0 (Intel 64-bit) を選んでダウンロードした。ダウンロードが終わったら適切な場所に移動させてhdf5-1.8.7-mac-intel-x86_64-shared/bin/へパスを通す。
テストラン
fast5からfastaを抽出し、アライメントしてレポートを出力するまでの流れをテストする。
1、NanoOK公式ページのfast5テストデータをダウンロードする (約500MB)。
ダウンロードしたデータはE.coliをナノポアでシーケンスしたもので、中にはfast5のディレクトリとリファレンス配列のフォルダが入っている。
ダウンロードしたN79596_dh10b_8kb_11022015/のreferenceに移動してLASTのインデックスを作成する。
cd N79596_dh10b_8kb_11022015/references/ #移動
lastdb -Q 0 ecoli_dh10b_cs ecoli_dh10b_cs.fasta #index作成
LASTのindexファイルであるecoli~というファイルが7つできる。
2、fast5からfastaを抽出。
nanook extract -s N79596_dh10b_8kb_11022015
-sでfast5のディレクトリN79596_dh10b_8kb_11022015/を指定している。
--参考-- N79596_dh10b_8kb_11022015/にはfail/とpass/ディレクトリが入っている。
passを展開すると、このようにたくさんのファイルが見つかる。
nanookコマンドでfastaの抽出を行うと、fasta/とlogs/ができる。
3、aリファレンスへのLASTを使ったアライメントを実行する。1でインデックスをつけたリファレンスを使う。
nanook align -s N79596_dh10b_8kb_11022015 -r references/ecoli_dh10b_cs.fasta
-sでfast5のディレクトリN79596_dh10b_8kb_11022015/を指定
-rでリファレンスを指定。
N79596_dh10b_8kb_11022015/の中にlastディレクトリができる。
4、
レポートを出力する。
nanook analyse -s N79596_dh10b_8kb_11022015 -r references/ecoli_dh10b_cs.fasta -passonly
latex_last_passonly/にN79596_dh10b_8kb_11022015.texができる。これをアプリのtexで開き、
左上のダイプセットボタンをクリックするとレポートのpdfが現像される。
pdfはこのようなファイルになっている。
引用-------------------------------------------------------------------------------------------------------------
NanoOK