macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

サンガーシーケンシングリードを自動でアセンブリしてアノテーションを行うwebサーバ deFUME

 

 機能選択は、遺伝子の発見および機能的に検証されたアノテーションのための強力な技術を表す[ref.1、2]。この手法は、ランダムにクローニングされたゲノムDNAまたはメタゲノムDNAを、通常は短い(1〜3 kb)DNA断片として発現ベクターに組み込むことに依存している。発現ライブラリーはその後、所望の機能性が選択され得る適切な宿主に形質転換される。所望の表現型を示すクローンからのDNAインサートをシーケンシングでき、これにより新規遺伝子の機能的単離が可能になる。このアプローチは、複雑なメタゲノム情報源からの遺伝子の同定に適用されており、その例としては、DNAポリメラーゼ[ref.3]、抗生物質耐性遺伝子[ref.1、2、4、5]、生体異物分解酵素[ref.6]などがある[ref.7]。

 最も一般的には、1〜3 kbのインサートは、次世代シーケンシング[ref.4、8]または従来の双方向Sangerシーケンシング、それに続くbase call、リードの高品質トリミング、およびリードのコンティグへのアセンブルのいずれかによってシーケンシングされる。最後に、BLAST検索および他の機能的注釈を含むデータ分析が行われる。数日から数千回の実験で数百から数千のクローンを容易に作成することができるが、データの分析は時間がかかり、この分野の実験研究者にとって大きなボトルネックとなる。この課題に取り組むために、著者らははdeFUMEを開発した。これは機能選択によって得られた大量のシーケンスデータを自動的に処理してアノテーションを付ける使いやすいWebサーバーである。

 

Instructions

deFUME-1.0 server

 

使い方

deFUMEにアクセスする。

http://www.cbs.dtu.dk/services/deFUME/

f:id:kazumaxneo:20190212215536p:plain

 

サンガーシーケンシングして得られたクロマトグラム(波形データ: ab1フォーマット)、またはアセンブル済みのcontigのFASTAをアップロードする。

f:id:kazumaxneo:20190213111347j:plain

ここではexample dataを指定。

example dataディレクトリの中身

f:id:kazumaxneo:20190213111544j:plain

 

テスト時はexample dtaを使っても。submitするとfailedになった。仕方ないので、結果のダイレクトリンクから出力のみ確認しておく(link

f:id:kazumaxneo:20190213140353j:plain

 

複数の線の意味は左側で説明されている。

f:id:kazumaxneo:20190213140530j:plain

緑の線がサンガーシーケンシングリード、赤線がblastp hit、 黄色の線はinterproのhitになる。また、上の青線はMetaGeneMarkによって見つかったORFを表している。

 

左端の+をクリックすると、赤線のblastp hit結果が確認できる。

f:id:kazumaxneo:20190213223659p:plain

 

結果はdownlodからfasta、またはgenbankとしてダウンロードできる。

f:id:kazumaxneo:20190213225829p:plain

 

またランできるようになったら追記します。

引用

deFUME: Dynamic exploration of functional metagenomic sequencing data

Eric van der Helm, Henrik Marcus Geertz-Hansen, Hans Jasper Genee, Sailesh Malla, Morten Otto Alexander Sommer
BMC Research Notes 2015 8:328