macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

原核生物ゲノムのアセンブリ結果およびアノテーションを改善するためのWebプラットフォーム ReNoteWeb

 

 DNA塩基配列の解読にかかる費用と時間が短縮されたことにより、NCBI(National Center for Biotechnology Information)のような公開データベースへの生物情報の寄託が大幅に増加した。1回の実行で大量のデータが生成されるため、この新しい特徴を持つデータを扱い、原核生物ゲノムのアセンブリアノテーションなどの解析を支援することができるアルゴリズムを開発する必要性に迫られることになった。長年にわたり、この作業を自動化するパイプラインや計算ツールが開発され、その結果、与えられた生物、特に非モデル生物の遺伝的内容を知るための総時間を短縮し、バイオテクノロジーに応用可能なターゲットの同定と連携することができるようになった。自動アノテーションツールの場合、その結果の正確さは文献で広く認められているが、自動プロセスで推測された情報をキュレーターが検証し、充実させるという手動キュレーションプロセスを排除するものではない。この作業には、研究対象生物の遺伝子産物の数に正比例する時間が必要である。この作業を支援するために、シンプルで直感的なインターフェースを備えたウェブツールReNoteWebを提供し、オリジナルのゲノム配列に欠けている産物を特定する可能性を持つアセンブリ強化作業を行う。さらに、ReNoteWebは、高精度な外部データベースから取得した情報をもとに、すべてのプロダクトに対してアノテーション処理を行うことができる。データ処理を担うエンジンはJAVAで開発され、ウェブプラットフォームはYiiフレームワークのリソースを利用している。このプラットフォームで作成されるアノテーションは、手作業によるキュレーションプロセスの全体的な時間を短縮することを目的としている。本ツールの検証には23の生物を使用した。NCBIデータベースで利用可能なこれらの同じ生物のアノテーションとRASTプラットフォームで実行されたアノテーションを比較することにより、効率が検証された。本ツールは、http://biod.ufpa.br/renoteweb/ で利用できる。

 

Guide

http://biod.ufpa.br/renoteweb/files/Guide_ReNoteWeb.pdf

 

webサービス

http://biod.ufpa.br/renoteweb/にアクセスする。

プロジェクトを閲覧したり、新しくプロジェクトを作成することができる。

 

1つプロジェクトを作ってみる。Create Projectタブを選択する。

プロジェクト名、メールアドレス、実行したい内容を選択する。ここではAnnotationを選択。

 

結果はSearchタブでkeyを入力することでダウンロードできる。そのkeyは記載したメールアドレスにジョブを投げたタイミングで送られている。

improved assembly

アセンブリfastaファイルを指定し、次の画面でfastqを指定する(fastq, fastq.tar.xz, fq, fq.tar.xz)。tar.xzに圧縮するなら"tar -Jcf R1.fq.tar.xz R1.fastq"など。

試したfastqデータでは、tar.xzで固めるとtar.gzの2/3くらいのファイルサイズになった。

 

作成中

混雑しているのか1日経っても結果が返ってこないので、また結果が出てきたら追記します。

 

2022/10/07追記

自分の環境では正しくランすることができませんでした。

引用

ReNoteWeb - Web platform for the improvement of assembly result and annotation of prokaryotic genomes

Gislenne da Silva Moia, Antônio Sérgio Cruz Gaia, Mônica Silva de Oliveira, Victória Cardoso Dos Santosa, Jorianne Thyeska Castro Alves, Pablo Henrique Caracciolo Gomes de Sá, Adonney Allan de Oliveira Veras

Gene. 2022 Nov 30;844:146819

 

参考