Gecko3は複数ゲノムを比較して、保存された遺伝子クラスターを検出する方法論。ユーザーが指定した特定の遺伝子群について関連のある遺伝子や遺伝子クラスターを検索することができるSTRINGなどのデータベースと異なり、Gecko3は調べたい生物群の全遺伝子を入力値として、推定遺伝子クラスターをp-value付きで全て検出する。Gecko3はGecko2の改良版で、Gecko2よりメモリ使用量が大きく削減されている。GUI版とコマンドライン版がある。ここではGUI版を紹介する。
テストデータ: クラスター探索済みのデータと探索前のデータがある(リンク先の中盤にある "Sample data~")
Gecko3 | Lehrstuhl Bioinformatik Jena
Synechocystis sp. PCC6803のクラスター探索済みデータがあるので、S6803やそれに近いラン藻の遺伝子クラスターを探したいなら、このデータをそのまま使って解析をスタートすることができます(S6803とSTRINGデータベースから関連が見いだされた677ゲノムとの比較 => リンク先のSynechocystis.Default.zip)。
インストール
依存
- java7
本体のダウンロード
https://bio.informatik.uni-jena.de/software/gecko3/
ラン
./Gecko3
実行するとwindowが立ち上がる。
ダウンロードしたテストデータstring_5genomes_default.gckを開く。
5ゲノム分のgeneが並んで表示されている。
虫眼鏡のアイコンで拡大縮小ができる。
中央の青い矢印アイコンをクリックしてcluster探索を開始する。
デフォルトでは以下のようなパラメータ設定になっている。クラスターと定義する最小遺伝子数(トータル)、どの程度近い遺伝子をクラスターと見なすか、などを設定することができる。
OKで比較開始。ゲノム数が少ないので、10秒程度で計算は終わる。
5つのクラスターが検出された。
5遺伝子見つかるクラスターを選択 (ID番号をダブルクリック)。
ATP合成酵素のF0F1のサブユニットをコードする遺伝子群だった。
ゲノムが増えるとそれなりの時間がかかります。
入力ファイルのフォーマットがやや特殊です。新規に検索セットを作成する場合はREADMEを読んでみてください。
オペロンを探すなら、DOORなどが利用できます(予測精度90%以上らしい)。
=> DOOR検索
引用
Finding approximate gene clusters with GECKO 3
Sascha Winter, Katharina Jahn, Stefanie Wehner, Leon Kuchenbecker, Manja Marz, Jens Stoye and Sebastian Bo ̈cker
Nucleic Acids Research, 2016, Vol. 44, No. 20 Published online 26 September 2016 doi: 10.1093/nar/gkw843
Efficient Computation of Approximate Gene Clusters Based on Reference Occurrences
Katharina Jahn.
Journal of Computational Biology. September 2011, 18(9): 1255-1274. https://doi.org/10.1089/cmb.2011.0132
Gecko2
http://bibiserv2.cebitec.uni-bielefeld.de/gecko
javaの複数バージョンの使い分けについて
複数バージョンのJavaを切り替えて使用できるようにする。 - Qiita