2020 1/9 タイトル修正
2020 7/19 追記
2020 7/23 追記
Genome Sequence Annotation Server(GenSAS、https://www.gensas.org)は、構造的および機能的アノテーション、および手動キュレーションのための安全なWebベースのゲノムアノテーションプラットフォームである。 GenSASは、ユーザーによるインストールを必要とせず、一般的なコマンドラインベースのアノテーションツールを単一の使いやすいオンラインインターフェイスに統合する。 GenSASはJBrowseとApolloを統合しているため、ユーザーはアノテーションデータを表示し、遺伝子モデルを手動でキュレートできる。埋め込まれた指示とより詳細なGenSASユーザーガイドにより、はアノテーションプロセスを段階的に、ユーザーにガイドする。ゲノムアセンブリファイルに加えて、ユーザーはアノテーションプロセスで使用するために、生物固有の転写産物、タンパク質、およびRNAシーケンスのエビデンスをアップロードすることもできる。 NCBI RefSeq転写産物およびタンパク質データベースの最新バージョンと、SwissProtおよびTrEMBLタンパク質データベースがすべてのユーザーに提供されている。 GenSASプロジェクトを他のGenSASユーザーと共有して、共同アノテーションを有効にすることができる。アノテーションが完了すると、GenSASはアノテーション付き遺伝子モデルの最終ファイルを一般的なファイル形式で生成し、他のアノテーションツールで使用したり、リポジトリに投稿したり、publicationsで使用したりできる。
Available Tools
GenSAS tutorial Jan 2015
注意
GenSASはchromosomeレベルのアセンブリを期待しているため、ショートリードから得たcontig配列などでは動作しません(長い配列だけ取り出せば可能)。注意して下さい。
アノテーションreadyなgenome配列であるかどうかがもっとも重要になります。
https://f1000research.com/articles/7-148あたりを読んで、十分な品質のデータになっているか確認して下さい。
https://www.gensas.orgにアクセスする。
初回はユーザー登録が必要。アカウント申請してから、連絡が来るでしばらくかかる。アカウント申請時はどのようなゲノムプロジェクトなのか、種名などを記載する必要がある。
ログインしてプロジェクトページにアクセスする。
左から右のタブに順番に進めるようになっている。
配列を決定したゲノム配列をアップロードする。Sequecneタブを選択。
配列のタイプを選択する。
アセンブリバージョンも指定する。
配列をアップロードし終えたら、processingジョブがスタートする。終わるまでしばらく時間がかかる。
完了した。
projectタブに進む。Begin a new projectをクリックし、プロジェクトの詳細を記載していく。
GFF3
すでに予測済みの遺伝子情報、RNA seqから取得した転写領域情報があれば、GFF3形式でアップロードする。それ以外の例えばrepetitive regionのGFF3などがあれば、それらもアップロードできる。
Evidence
自身の種のESTや完全長cDNAデータがあったり、closely relatedな種のタンパク質情報があるなら指定する。アラインして使用される。
Rpeats
複雑性の低い配列や反復配列をNでマスクする。
パラメータを指定して実行する。
Repeat options
Masking
Repeat Maskerのジョブが終わったら、このタブでマスクを実行する。
Align
既存のデータベースのタンパク質配列やRNA seqデータアラインメントする。
BLAST、BLAT、PASAを使ってNCBI nrのcDNAをアラインする。
またはTophatやHISAT2を使ってRNA seqデータをマッピングする。
HISAT2はSRAのデータを直接使用することもできる。
Structural
ab initioの遺伝子予測。全てのプログラムを走らせる。
Consensus
予測結果について、EvidenceModelerを使ってコンセンサスセットを作成する。
OGS
ラン中のjobや終わったjobは右端にまとめられる。また登録したメールアドレスにjob完了のメールが届くようになっている。
クリックすると別のタブで開かれる。
この右のジョブリンクをクリックすることで、ジョブ結果を見たり、各ファイルをダウンロードできる。
また、そのジョブそのものを消すことができる。クリックして開いてDelete this jobsを選択。
最後にpublishボタンを押す事でpublishingのジョブが開始される。
引用
Structural and Functional Annotation of Eukaryotic Genomes with GenSAS
Humann JL, Lee T, Ficklin S, Main D
Methods Mol Biol. 2019;1962:29-51
関連