macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

ゲノムのCRISPR座位を見つけるwebツール CRISPRCasFinder

 

 Clustered regularly interspaced short palindromic repeats(CRISPR)および関連タンパク質(Cas)は、CRISPR-Casシステムを形成する。 CRISPRは、スペーサーと呼ばれる同じサイズのユニークな配列で区切られた、24〜50 bpの長さのダイレクトリピートまたは「リピート」の連続から構成されてる。それらはリーダーに存在するプロモーター(多くの場合100〜200 bpのATに富む配列)から転写されるため、CRISPRのアレイは機能的指向性がある(ref.1)。コミュニティの取り組みにより、CRISPR-Casシステムは、Casタンパク質に応じて、6つのタイプと22のサブタイプの2つのクラスに分類されている(ref.2,3)。 CRISPR-Casシステムの要素に基づくゲノム編集技術の開発以来、これらは多くの注目を集めている。実際、約80%のアーキアと半分のバクテリアに存在するこれらの構成要素は、遺伝子工学における複数の用途に使用することができる(ref.4、5)。特定のCRISPRアレイの急速な進化速度はまた、バクテリア分離株のタイピングにおけるそれらの有効な使用を可能にする(ref.6)。ゲノム配列中のCRISPRアレイを同定するためのいくつかのプログラムが開発されており、最も頻繁に引用されているのはCRISPR Finder(ref.7)、CRT(ref.8)およびPIRER-CR(ref.9)である。 CRISPRDetect(ref.10)、CRISPRdigger(ref.11)、およびCRF(ref.12)などの追加プログラムも利用できる。 CRISPRリピートとリーダーの特性に基づいてCRISPRアレイストランド予測のための3つのプログラムが提案されている:CRISPRDetect(ref.10,13)、CRISPRstrand(ref.14,15)およびCRISPRleader(ref16)。 Casタンパク質および系は、専用モジュール(CasFinder)を有するプログラムMacromolecular System Finder(MacSyFinder)を用いて同定することができる(ref.17)。このプログラムは、隠れマルコフモデル(HMM)および同定された構成要素の遺伝的構成および構成のモデルを用いたタンパク質類似性の検索に基づいている。 HMMCASはCasタンパク質を同定するためにオンラインで問い合わせることができるウェブツールである(rf.18)。ユーザが投稿したデータかるのCRISPRおよびCasの検索は、CRISPRone(ref.19)を使用してウェブ上で、またはローカルでCRISPRdiscoパイプライン(ref.20)を使用して行うことができる。

ここでは、無料で入手可能なサードパーティソフトウェアの依存関係を持つCRISPRFinderとCasFinderの更新、改良、および統合バージョンであるCRISPRCasFinderを紹介する。 CRISPRCasFinderはスタンドアロンバージョンを含み、強化されたCRISPR検出性能を示す。

CRISPRCasFinder Webサーバーは、独立したフロントエンドとバックエンドに基づいている。フロントエンドは、.NET Core(dotnet core)開発プラットフォームとC#(C sharpプログラミング言語を使用して、ユーザーフレンドリーなWebアプリケーションとして実装された。ブートストラップフレームワークは、Webアプリケーションを設計するために使用された。CRISPRCasFinderは、LinuxWindows Subsystem for Linuxを含む)およびMacOSシステムと互換性のあるスタンドアロンプログラムとしても入手できる。プログラムはPerlで書かれている。ワークフローを論文図1および補足図S1に示し、依存関係の詳細を補足資料に記載している。

入力

ウェブサーバは現在、最大100個の配列を含む最大50MBのサイズの(マルチ)FASTAファイルを受け入れる。 スタンドアロンアプリケーションには定義済みの入力サイズ制限はなく、利用可能なコンピュータメモリによってのみ制限される。

出力

Webサーバーは、結果の概要(図2A)と各アレイを別々に視覚化する可能性(図2B)を含む要約表を作成する。CRISPRアレイおよびCasタンパク質解析は、.xls、GFF3、JSON、TSV、およびFasta形式のファイルとして返される。 スタンドアロンプログラムはオプションファイルと同じファイルを返す(詳細については補足資料を参照)。

 f:id:kazumaxneo:20190215141305j:plain

論文より転載

 

help

https://crisprcas.i2bc.paris-saclay.fr/CrisprCasFinder/Help

 

CRISPRCasFinderに関するツイート

  

使い方

CRISPRCasFinderにアクセスする。

f:id:kazumaxneo:20190215195201p:plain

 

exampleデータをランしてみる。右側のMelioribacterRoseus.fasta(ゲノム3.4Mb)をクリック。数秒待つ。

f:id:kazumaxneo:20190215195457p:plain

配列が入力された。

 

他のパラメータを指定する。

f:id:kazumaxneo:20190215195657p:plain

 

ここではdefault設定のままスタート。

f:id:kazumaxneo:20190215200252p:plain

 

10秒ほどで結果が表示された。

f:id:kazumaxneo:20190215195121p:plain

見つかったCRISPR座位は4つあった。

 

CRISPR IDをクリックすると詳細が表示される。24-bpのダイレクトリピートとやや長いスペーサー配列が23-24回繰り返されるCRISPR座位だった。

f:id:kazumaxneo:20190215200656p:plain

検出された配列(DR、spacer)は下のボタンからダウンロードできます。

 

 

CRISPRCasdbでは、どんな菌や株がどれだけCRISPRC座位を持っているか確認することができます。

https://crisprcas.i2bc.paris-saclay.fr/MainDb/Index

f:id:kazumaxneo:20190215202337p:plain

 

引用

CRISPRCasFinder, an update of CRISRFinder, includes a portable version, enhanced performance and integrates search for Cas proteins
David Couvin, Aude Bernheim, Claire Toffano-Nioche Marie Touchon Juraj MichalikBertrand Néron Eduardo P C Rocha Gilles Vergnaud Daniel GautheretChristine Pourcel
Nucleic Acids Research, Volume 46