Gene Neighbourhood Analysis Tool(GNAT)は、タンパク質配列を与えられた微生物(細菌、古細菌、真菌)またはウイルスデータベース内の相同遺伝子を同定し、それらのゲノム近傍(GN)を類似性に基づいてアラインメントおよびクラスタリングし、一致したゲノムの分類学的分布を報告する。さらに、カスタマイズ可能な注釈、色、表示オプション、そしてカテゴリ別および定量的な要約分析を備えた、インタラクティブで出版品質の視覚化を生成する。GNATの直感的なインターフェースにより、幅広い研究者コミュニティが計算専門知識を必要とせずにGNから生物学的知見を得ることができ、生命の様々な領域にわたってGNを容易に比較できる包括的かつ多用途なプラットフォームとして機能する。GNATはhttps://gnat.usask.caでアクセスできる。
help
https://gnat.usask.ca/ にアクセスする。
GNATは、細菌オペロンなどのクラスター化する傾向がある遺伝子のゲノム近傍を調査する。
目的のタンパク質のFASTA ファイル、または GNAT によって生成された PSI-BLAST .out ファイルのいずれかを指定する。FASTAのヘッダーに特殊文字が含まれるとエラーが起きる可能性があるので注意。できるだけシンプルな名前にする。

データベースを指定する。デフォルトはviralとなっている。

ゲノム近傍は、クエリタンパク質に対する一致率(デフォルト=30%)およびサイズ(デフォルト=20%)に基づいてフィルタリングされる。

上記の条件でフィルタリングされたゲノム近傍は約 5-15 genomesずつの似たグループに3-mer aaを特徴量としてk-meansでクラスタリングされ、clinker修正版を使用して視覚化される。また、データベース全体にわたる一致の分布を示し系統樹と円グラフが生成される。
出力例

クラスタ1つを表示

クエリは中央の遺伝子座で注釈が付けられている。
コメント
PSI-BLASTにはかなりの時間がかかります。結果が出てくるまでに複数のジョブを投げないように注意してください。
引用
GNAT: An Interactive Web Tool for Gene Neighbourhood Analysis
Nolen J. Timmerman, Malcolm Thakurdeen, Robert E.J. Wilson, Beatrice C.M. Fung, Brett Trost, Alan R. Davidson, Chantel N. Trost, Lingling Jin
bioRxiv, Posted November 05, 2025.
関連
