機能選択は、遺伝子の発見および機能的に検証されたアノテーションのための強力な技術を表す[ref.1、2]。この手法は、ランダムにクローニングされたゲノムDNAまたはメタゲノムDNAを、通常は短い(1〜3 kb)DNA断片として発現ベクターに組み込むことに依存している。発現ライブラリーはその後、所望の機能性が選択され得る適切な宿主に形質転換される。所望の表現型を示すクローンからのDNAインサートをシーケンシングでき、これにより新規遺伝子の機能的単離が可能になる。このアプローチは、複雑なメタゲノム情報源からの遺伝子の同定に適用されており、その例としては、DNAポリメラーゼ[ref.3]、抗生物質耐性遺伝子[ref.1、2、4、5]、生体異物分解酵素[ref.6]などがある[ref.7]。
最も一般的には、1〜3 kbのインサートは、次世代シーケンシング[ref.4、8]または従来の双方向Sangerシーケンシング、それに続くbase call、リードの高品質トリミング、およびリードのコンティグへのアセンブルのいずれかによってシーケンシングされる。最後に、BLAST検索および他の機能的注釈を含むデータ分析が行われる。数日から数千回の実験で数百から数千のクローンを容易に作成することができるが、データの分析は時間がかかり、この分野の実験研究者にとって大きなボトルネックとなる。この課題に取り組むために、著者らははdeFUMEを開発した。これは機能選択によって得られた大量のシーケンスデータを自動的に処理してアノテーションを付ける使いやすいWebサーバーである。
Instructions
使い方
deFUMEにアクセスする。
http://www.cbs.dtu.dk/services/deFUME/
サンガーシーケンシングして得られたクロマトグラム(波形データ: ab1フォーマット)、またはアセンブル済みのcontigのFASTAをアップロードする。
ここではexample dataを指定。
example dataディレクトリの中身
テスト時はexample dtaを使っても。submitするとfailedになった。仕方ないので、結果のダイレクトリンクから出力のみ確認しておく(link)
複数の線の意味は左側で説明されている。
緑の線がサンガーシーケンシングリード、赤線がblastp hit、 黄色の線はinterproのhitになる。また、上の青線はMetaGeneMarkによって見つかったORFを表している。
左端の+をクリックすると、赤線のblastp hit結果が確認できる。
結果はdownlodからfasta、またはgenbankとしてダウンロードできる。
またランできるようになったら追記します。
引用
deFUME: Dynamic exploration of functional metagenomic sequencing data
Eric van der Helm, Henrik Marcus Geertz-Hansen, Hans Jasper Genee, Sailesh Malla, Morten Otto Alexander Sommer
BMC Research Notes 2015 8:328