macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

ユーザーフレンドリーなナノポアロングリードの転写解析プラットフォーム NanopoReaTA

 

 オックスフォード・ナノポア・テクノロジーズ(ONT)のシーケンスプラットフォームは、シーケンス中にリアルタイム解析を実行する優れた機会を提供する。この機能により、実験データに対する早期の洞察が可能になり、さらなる解析のための潜在的な意思決定プロセスが加速される。DNAシーケンスデータのリアルタイム解析ツールはすでにいくつか存在するが、バイオインフォマティクスの知識が乏しい科学者や医師向けに設計されたトランスクリプトーム差分データ解析用のアプリケーションは今のところ存在しない。ここでは、ONTからのRNAシーケンスデータのための使いやすいリアルタイム解析ツールボックス、NanopoReaTAを紹介する。実行中または終了した実験からのシーケンス結果は、全トランスクリプトームまたは遺伝子特異的解析のための統合Nextflowパイプラインを備えたR ShinyベースのグラフィカルユーザーインターフェースGUI)を通して処理される。NanopoReaTAは、進行中のシーケンス実行の視覚的スナップショットを提供するため、インタラクティブなシーケンスと迅速な意思決定が可能になり、臨床例にも適用できる。

 

マニュアルより

NanopoReaTAは、nextflowに基づくバックエンドの前処理パイプラインと、下流の分析用の複数のRおよびpythonベースのスクリプトで動作する。すべての結果は、R shinyベースのフロントエンドで可視化される。

ワークフロー。NanopoReaTAのトップページより。

 

インストール

Github

#referenceありイメージ(ヒトとマウスの解析用。40GB近く多い)
docker pull stegiopast/nanoporeata:references

#referenceなしイメージ
docker pull stegiopast/nanoporeata:no_reference

 

 

実行方法

A;ヒトとマウスのリファレンス有りイメージのラン

"references "というdocker imageタグを使うと、NanopoReaTAに必要なヒトとマウスのリファレンスファイルがすべてGENCODEから自動的にダウンロードされ(~36GB)、rootに保存される。

docker イメージをランし、ユーザー指定のパスにローカルシステムをマウントする。

#with-reference
docker run -it -p 8080:8080 -v /:/NanopoReaTA_linux_docker stegiopast/nanoporeata:references

http://localhost:8080/にアクセスする。

 

B;リファレンス無しイメージのラン

"no_reference "タグのラン。リファレンスファイルは別に用意する必要がある。

#without-reference
docker run -it -p 8080:8080 -v c:/:/NanopoReaTA_windows_docker stegiopast/nanoporeata:no_reference

http://localhost:8080/にアクセスする。

 

アクセスしたトップページ

スクロールした下の方には、インストール手順の説明やベンチマーク結果がある。Start analysisをクリックする。

 

順番に進めていく。

1,Preprocessing

 

PreprocessingのMetadata createrタブでは、解析に必要なメタデータテーブル(タブ区切り)を生成する。テーブルはダウンロードできる。

 

実験のサンプル、条件、反復を入力し、メタデータファイルをダウンロードする。サンプルがバーコード化されている場合、サンプルの名前はバーコード(barcode01-barcode96)にちなんで命名する必要がある(つまり、MinKNOWが自動的に作成するフォルダー名が一致している必要がある)。Exampleへのリンク

既にメタデータファイルを作成している時は、このステップをスキップして、Configuration(設定)タブでメタデータファイルへのパスを指定する。(マニュアルより)

 

Configurationタブではパラメータを設定できる。過去に実行したNanopoReaTAのyaml形式の既存の設定ファイルがあるなら、アップロードすることができる(example)。シークエンシング方法は、通常のcDNAからのRNA seqに加えてdirect RNA seqも選択できる。

必要なファイルやディレクトリ、出力のパスを選択する。

Barcodedをyesまたはnoを選択(データがmultiplexedの場合はyes)、メインディレクトリへのパスは シーケンス開始時に MinKnow が作成した実験ディレクトリを指定する。

 

Linuxの場合、ホストシステムは/NanopoReaTA_linux_dockerにマウントされている(/NanopoReaTA_linux_docker以下にホストのルート/がある。)。Windowsの場合は/NanopoReaTA_windows_dockerにマウントされている。

 

リファレンスありでdockerイメージを実行している場合、リファレンスは/Reference_data以下にある。

 

/Reference_data/Human_reference_data

 

ここではテストデータ: HEK293_HeLa_Sequencing(link)を使う。メタデータこちら。configファイルはこちらメタデータはcoinfig画面中央のSelect sample description file (tab-separated)で指定する。configファイルはcoinfig画面の一番上のLoad configで指定する。テストデータHEK293_HeLa_Sequencingのディレクトリは、Select path to main MinKNOW output directoryで指定する(4つあるpassしたfastqのサブディレクトリを含むディレクトリを指定)。

 

次のsample settingsタブで入力したデータを確認できる。

 

Settings Overview。Startをクリック。

テストした時はpreprocessingから先に進まなかった。改善されたら追記します。

引用

NanopoReaTA: a user-friendly tool for nanopore-seq real-time transcriptional analysis 
Anna Wierczeiko, Stefan Pastore, Stefan Mündnich, Anne M Busch, Vincent Dietrich, Mark Helm, Tamer Butto, Susanne Gerber Author Notes
Bioinformatics, Published: 07 August 2023