macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

CircosをWeb上 で利用できる ClicO FS

 

 Circos(Krzywinski et al、2009)(HP)は、ビジュアルデータを環状形式で表現するPerl言語ベースのツールである。ネイティブのCircosソフトウェアは、コマンドラインインターフェイスCLI)を介して提供されている。ソフトウェアのインストールと設定は、コマンドラインの経験を持つユーザーにとっては難しくないが、CLIに精通していないユーザーにはある程度の難しさがある。

 Circoletto、CIRCUS、RCircos(Darzentas、2010; Naquin et al、2014; Zhang et al、2013)を含む環状画像のプロットを可能にするCircosの他の選択肢がある。 CircolettoとCIRCUSは、より特殊化された機能のために開発された。前者(Circoletto)はBLAST(Altschul et al、1990)の結果とCircosをウェブベースのユーザインターフェース(UI)を介して統合する一方で、後者(CIRCUS)はゲノムの構造変異をプロットすることに特化している。しかし異なるデータ型を持つプロット生成に対する柔軟性。を持っていない。RCircosはCircosのdata trackのプロットをサポートしているが、RパッケージのCLIに基づいている。

 上記のアプリケーションの中には、アプリケーションを十分に活用するためにセットアップ、設定、コーディングのスキルが必要なものがある。 CLI環境での経験がほとんどまたはまったくないユーザーは、厳しい学習曲線に遭遇する可能性がある。この問題に対処するために、ClicO FS(Open Circular Layout Interactive Converter)が開発された。 ClicO FSは、ユーザーがCircosプロットを簡単に生成できる、使いやすいWebサービスとなっている。 Circosのすべての機能がClicO FSによって実行されるわけではない(例えば、染色体軸破損など)。

 ClicO FSは、バックエンド技術としてRuby on Railsを使用し、フロントエンドフレームワークとしてTwitter Bootstrapを使用して構築されている。 ClicO FSは、ユーザーアップロードによって必要なファイルを受け取る。 Circosでは、(i)カリオタイプ(karyotype  wiki)、(ii)データおよび(iii)構成ファイルの3種類のファイルが必要だが、ClicO FSでは最初の2種類のファイルのみが必要となる。カリオタイプファイルは、典型的には染色体、配列コンティグ、または生物学的文脈におけるクローンである軸を定義する固有の識別子、ラベル、サイズ、色など、各軸の情報を含む7列のフォーマットファイルである。データファイルは、さまざまなタイプのデータを描画するための別の入力ファイルとなる。現在、ClicO FSでサポートされているデータタイプには、リンク、ヒストグラム、ラインプロット、散布図、ヒートマップ、タイル、テキスト、コネクタおよびハイライトが含まれる。データファイルフォーマットは単純であり、一般的には描画されるデータトラックに応じて3〜7個の列を含む。ファイル形式の詳細な説明は、ClicO FSインターフェイスで指定する。 ClicO FSで受け入れられるすべてのファイルは、2つのプログラムを切り替えるときの使いやすさを高めるため、Circosと同じフォーマットとなっている。

 ClicO FSでは、ユーザーが設定ファイル(configuration file)をアップロードする必要はない。すべての設定はユーザーインターフェイスで設定できる。 ClicO FSはユーザの利便性を重視して設計されているため、一般的ではない設定にはデフォルトのパラメータが与えられる。しかし、上級ユーザは、ClicO FSの特別なテキストボックスに、背景、ルール、軸、ラベルスニグリング、ハイライトなどの多くの設定を入力することができる。

 いくつかの追加の機能が提供されている。例えば、様々なカラースキームをカリオタイプに割り当てることができる。また、設定を保存しなくても、いつでも出力をプレビューできる。登録されたClicO FSユーザーは、複数の独立したプロジェクトを作成できる。関連するすべてのデータおよび構成は、それぞれのプロジェクト専用のデータベースに格納される。したがって、ユーザーは、次回のログイン時にプロジェクトを検索したり、引き続き作業を続けることができるようになっている。それに加えて、ClicO FSは、いくつかの一般的な形式のプレゼンテーションのスピードアップを可能にする、事前設定されたテンプレートベースのアプローチを提供する。例えば、GenBankデータベースは、配列データの最も一般的なソースの1つである。ユーザーはGenBank形式のファイルをClicO FSにアップロードできる。 5回のクリックで、遺伝子、GC含量、ゲノムの構造RNAなどの情報を視覚化することができる。

Circosの機能性は多様でダイナミックである。 Circoの機能に合わせてClicO FSの機能を拡張する。この問題に対処するために、ClicO FSのユーザーは、作成したプロジェクトのすべての構成ファイルとデータファイルをダウンロードすることができる。これらのファイルはテンプレートとして、ClicO FSでサポートされていない要素を追加したり、ローカル端末でCircosを使って実行できるようになる。

 

 

ラン

利用するには、はじめにユーザ登録が必要となる。

ClicO FS | Circular Layout Interactive Converter Free Services

f:id:kazumaxneo:20180531235108j:plain

数分で登録作業は終了する。パスワードを設定したらログインできるようになる。

 

ヘルプ

http://codoncloud.com:3000/help

 

ログインしたら、Create Projectをクリックし、新しいプロジェクトを作成する。

f:id:kazumaxneo:20180531221737j:plain

 

プロジェクト名を記載する。

f:id:kazumaxneo:20180531221943j:plain

右のopenマークをクリックする。

f:id:kazumaxneo:20180531222104j:plain

 

 

karyotypeファイルをアップロードする。

f:id:kazumaxneo:20180531222112j:plain

 

ここでは、circosのlibraryのhumanのファイルを使った(circos/0.67-7/libexec/data/karyotype/karyotype.human.hg38.txt)。ただし性染色体、オルガネラゲノム、bandingなどの行は除いた。

f:id:kazumaxneo:20180531222539j:plain

boxにレ点チェックをつけて、右の→をクリック。

f:id:kazumaxneo:20180531223434j:plain

 

chr名、色などを設定する。手動でもできるが、ここでは設定一覧からUCSCを選んで、Apply & Saveを押し、自動で色を割り振った。上のPreviewを押せばプレビューできる。最後に左上のもう1つあるsaveボタンを押すのを忘れないようにする(忘れると反映されない)。右端の矢印をクリックし、次の設定に進む。

f:id:kazumaxneo:20180531224736j:plain

 

一般設定。設定を変更して、プレビューで確認できるのは非常に便利。saveを押さないと設定は保持されないことに注意する。

f:id:kazumaxneo:20180531224215j:plain

Label settings。右矢印をクリックして、どんどん右の設定に進んでいく。

f:id:kazumaxneo:20180531225851j:plain

 

Ticks settings。

f:id:kazumaxneo:20180531230026j:plain

Chromosome settings。

f:id:kazumaxneo:20180531230309j:plain

 

Chromosomes Ordering。ドラッグして順番を変更できる。

f:id:kazumaxneo:20180531230352j:plain

 

 

カリオタイプの設定が終わったら、次にデータトラックを追加する。データトラックについては、ユーザーによって何を描くかで最適なタイプが異なってくる(例えば染色体間の組み替えならリンクプロット、オーム解析データならヒートマッププロットやスキャッタープロットなど)。

下の画像を参考に、どんな種類のプロットを描画するか決める(例えば、各染色体間で高い相同性を持つ領域を描画したければ "Links" が使える)。

f:id:kazumaxneo:20180531234300j:plain

 

項目のフォーマットの詳細はcircosのHP(リンク)や、画面右上にあるClicO FSのhelpを押して確認できる。

f:id:kazumaxneo:20180601000201j:plain

 

アップロードするタイプを決めて、アップロードする。ここではcircosのexampleのヒートマップをアップロードした(circos/example/data/heatmap.hs.mm.5e6.txt)。

f:id:kazumaxneo:20180601121046j:plain

 

チェックをつけてセッティングに進む。

f:id:kazumaxneo:20180601120719j:plain

 

最後に右上のOutputボタンをクリックして画像を出力する。

f:id:kazumaxneo:20180601121413j:plain

データはSVGadobeツールと互換性はない)かPNGでダウンロードできる。 

 

リンクも追加してみる。

f:id:kazumaxneo:20180601155836j:plain

 

透明度は0.5、リボンをONにした。

f:id:kazumaxneo:20180601155859j:plain

f:id:kazumaxneo:20180601155931j:plain

 さらに別ファイルのリンクを追加。

f:id:kazumaxneo:20180601161435j:plain

追加リンクはリボンオフにして色も変えた。このように、同じリンクでも、別ファイルで追加することで別の設定を適用できる。

 

 

Genbankからuploadするには、上のメニューからGet startを選択する。

f:id:kazumaxneo:20180601122621j:plain

Plot from Genebankを選択。

f:id:kazumaxneo:20180601122629j:plain

テストした時は、エラーが繰り返し出て進めなかった。

 

 

ログイン方式なので、セーブしておけば結果を別の端末で読み込むこともできます。保存期間については規約を確認してください。複雑なCIrcosを使いやすくする良ツールだと思います。

 

 

 

 

追記

Circaというツールもあります(macwindowslinux対応)。100ドルしますが使いやすそうです。

ハンズオンムービー。

引用

ClicO FS: an interactive web-based service of Circos

Wei-Hien Cheong, Yung-Chie Tan, Soon-Joo Yap, and Kee-Peng Ng

Bioinformatics. 2015 Nov 15; 31(22): 3685–3687.