macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

バクテリアの保存されたgene clusterを探し、結果をビジュアル表示する Gecko3

Gecko3は複数ゲノムを比較して、保存された遺伝子クラスターを検出する方法論。ユーザーが指定した特定の遺伝子群について関連のある遺伝子や遺伝子クラスターを検索することができるSTRINGなどのデータベースと異なり、Gecko3は調べたい生物群の全遺伝子を入力値として、推定遺伝子クラスターをp-value付きで全て検出する。Gecko3はGecko2の改良版で、Gecko2よりメモリ使用量が大きく削減されている。GUI版とコマンドライン版がある。ここではGUI版を紹介する。

 

テストデータ: クラスター探索済みのデータと探索前のデータがある(リンク先の中盤にある "Sample data~")

Gecko3 | Lehrstuhl Bioinformatik Jena

Synechocystis sp. PCC6803のクラスター探索済みデータがあるので、S6803やそれに近いラン藻の遺伝子クラスターを探したいなら、このデータをそのまま使って解析をスタートすることができます(S6803とSTRINGデータベースから関連が見いだされた677ゲノムとの比較 => リンク先のSynechocystis.Default.zip

 

インストール

依存

  • java7

本体のダウンロード

https://bio.informatik.uni-jena.de/software/gecko3/ 

 

 

ラン

./Gecko3

実行するとwindowが立ち上がる。

 

f:id:kazumaxneo:20171211211154j:plain

ダウンロードしたテストデータstring_5genomes_default.gckを開く。

f:id:kazumaxneo:20171211211252j:plain

 

5ゲノム分のgeneが並んで表示されている。

f:id:kazumaxneo:20171211211404j:plain

虫眼鏡のアイコンで拡大縮小ができる。

f:id:kazumaxneo:20171211211443j:plain

 

中央の青い矢印アイコンをクリックしてcluster探索を開始する。

f:id:kazumaxneo:20171211211617j:plain

デフォルトでは以下のようなパラメータ設定になっている。クラスターと定義する最小遺伝子数(トータル)、どの程度近い遺伝子をクラスターと見なすか、などを設定することができる。

f:id:kazumaxneo:20171211211557j:plain

OKで比較開始。ゲノム数が少ないので、10秒程度で計算は終わる。

 

5つのクラスターが検出された。

f:id:kazumaxneo:20171211212153j:plain

 

5遺伝子見つかるクラスターを選択 (ID番号をダブルクリック)。 

f:id:kazumaxneo:20171211212257j:plain

ATP合成酵素のF0F1のサブユニットをコードする遺伝子群だった。

ゲノムが増えるとそれなりの時間がかかります。

 

入力ファイルのフォーマットがやや特殊です。新規に検索セットを作成する場合はREADMEを読んでみてください。

 

オペロンを探すなら、DOORなどが利用できます(予測精度90%以上らしい)。

=> DOOR検索

 

引用

Finding approximate gene clusters with GECKO 3

Sascha Winter, Katharina Jahn, Stefanie Wehner, Leon Kuchenbecker, Manja Marz, Jens Stoye and Sebastian Bo ̈cker

9600–9610 Nucleic Acids Research, 2016, Vol. 44, No. 20 Published online 26 September 2016 doi: 10.1093/nar/gkw843

 

Efficient Computation of Approximate Gene Clusters Based on Reference Occurrences

Katharina Jahn.

Journal of Computational Biology. September 2011, 18(9): 1255-1274. https://doi.org/10.1089/cmb.2011.0132

 

Gecko2

http://bibiserv2.cebitec.uni-bielefeld.de/gecko

 

javaの複数バージョンの使い分けについて

複数バージョンのJavaを切り替えて使用できるようにする。 - Qiita