遺伝子近傍の検査は比較ゲノミクスの不可欠な部分だが、遺伝子クラスターのpublication品質のグラフィックスを作成するツールはない。 Gene Graphicsは、このようなビジュアルを作成するための簡単なWebアプリケーションである。サポートされている入力には、National Center for Biotechnology Information遺伝子およびタンパク質識別子が含まれ、近隣情報、GenBankファイル、およびSEEDデータベースから抽出されたデータを自動的に取得する。遺伝子およびゲノムの名前、色、サイズなど、遺伝子表現は多くのパラメーターに合わせてカスタマイズできる。種間の相同な遺伝子の迅速かつユーザーフレンドリーなカスタマイズのために、遺伝子属性をコピーして貼り付けることができる。ポータブルネットワークグラフィックスとスケーラブルベクターグラフィックスに加えて、生成された表現は、タグ付けされた画像ファイル形式またはカプセル化されたPostScript、公開の標準形式としてエクスポートできる。実践的なチュートリアルがトレーニングに利用できる。
Tutorials
https://katlabs.cc/genegraphics/tutorials
使い方
https://katlabs.cc/genegraphics/descriptionにアクセスする。
読み込むデータを指定する。ここではFetch from NCBIを選ぶ。
Gene ID identifierを指定するウィンドウが出現する。
ここではチュートリアルと同じGenBank ID: CP001682.1(link)の5 ORFを描画する。
Organism nameをGenome locationに切り替え、Cryptobacterium curtum DSM 15641とタイプ。
対応するゲノムが表示されたので、こちらをクリックして選択。
1429479 から 1436151までを描画する。数値を入力してSubmitする。
描画された。
文字がORFのboxからはみ出てしまっているので、サイズを変更する。Graph settings => size settigsを選ぶ。
横1500px、縦40pxとした。
修正された。
もう1つ追加する。Search byでProtein IDを選び、ID: ABI68735.1を追加する。
合計5000 bpのORFを含む領域が取り込まれる。
ORFをクリックすると、ORF毎の個別編集ができる。ここではORFの表記を下にずらす。
Swol_1427を下にずらした。
さらにもう1つ追加する。今度はSearch byでGene symbol~を選ぶ。Gene symbolはduf208、OrgansimはEggerthellaとタイプし、~DSM2243を選択した。
追加された。
IDから遺伝子名に変更。
Graph Settings => Gene shape => arrow on
Label Settings =>Gene labels
一括で中央配置に変更。
図はExportから指定フォーマットで出力できる。
チュートリアル1では、この他にも相同なタンパク質をコードするORFの色を揃える説明などがあります。チュートリアル2-3はより実践的な内容になっています。
https://katlabs.cc/genegraphics/tutorials
引用
Gene Graphics: a genomic neighborhood data visualization web application
Katherine J Harrison, Valérie de Crécy-Lagard, Rémi Zallot
Bioinformatics. 2018 Apr 15; 34(8): 1406–1408.