KaKs_Calculator 3.0は、コーディング配列と非コーディング配列の両方に対する選択圧を計算することができるように更新されたツールキットである。コーディング配列の非同義/同義置換率の比率と同様に、非コーディング配列に対する選択は、非コーディング塩基置換率を隣接するコーディング配列の同義置換率で正規化して定量化することができる。実証データにより、分子配列に作用した選択の強さとモードを検出する効果が示されており、多様な配列に対する自然選択をゲノムワイドにスキャンし、潜在的な機能要素を全ゲノムスケールで同定するための大きな可能性が示されている。KaKs_Calculator 3.0のパッケージは、学術目的に限り、https://ngdc.cncb.ac.cn/biocode/tools/BT000001で自由に使用することができる。
BioCode
https://ngdc.cncb.ac.cn/biocode/tools/BT000001
Manual
https://ngdc.cncb.ac.cn/biocode/tools/BT000001/manual
Ka: Nonsynonymous substitution rate
Ks: Synonymous substitution rate
Ka/Ks: Selective strength
インストール
windows10でテストした。
https://ngdc.cncb.ac.cn/biocode/tools/BT000001/releases/3.0からKaKs_Calculator3.0.zipをダウンロードする。
解凍後、GUI/にあるインストーラーのexeファイルを実行する。
指示に従ってインストールする。GUIアプリケーション開発にはVisual C++ 6.0が使用されている。
立ち上げたところ。ウィンドウの左半分はcoding、右半分はnoncodingとなる。
1、coding
examples/coding.axt(quasi-AXT sequence format;リンク先の”Input Sequence Format”を参照)を指定した。
methodを指定する。KaKs_Calculatorに組み込まれている近似法と最尤法はこちらで紹介されている。
(レポジトリより)
KaとKsの計算には通常3つの段階がある。比較した2つのDNA配列の長さをn、その間の置換数をmとすると、KaとKsを計算するには、同義(S)と非同義(N)のサイト数(S+N=n)、同義置換(Sd)と非同義置換(Nd)の数(Sd+Nd=m)を数える必要がある。そうすると、観測された置換数は、配列の時間的な分岐に伴う実際の置換数を過小評価するため、(Nd/N)および(Sd/S)はそれぞれKaおよびKsを表す可能性があり、多重置換補正後の値であることがわかる。したがって、これらの方法は通常、SとNのカウント、SdとNdのカウント、多置換の補正の3つのステップを経てKaとKsを推定していると結論づけられる。
KaとKsを計算する方法は,それぞれ異なる置換モデルを採用しており,微妙な違いがあるが,大きな違いがある。これらは近似法と最尤法に分類される.最尤法は近似法とは異なり、確率論を用いて上記の3つのステップを一度に終わらせる。
出力例
2、Non-coding
ユーザーがアップロードした隣接するコーディング配列から計算する方法と、ユーザーが単純に指定する方法の2種類の方法で、中立変異率(Ks)の値を得ることができる。
examples/noncoding.axtを指定した。隣接CDSはcoding.axtを指定した。
出力例
非同義置換率(Kn)と同義置換率(Ks)が計算される。
引用
KaKs_Calculator 3.0: calculating selective pressure on coding and non-coding sequences
Zhang Zhang
bioRxiv, Posted November 29, 2021
KaKs_calculator 3.0: Calculating selective pressure on coding and non-coding sequences
Zhang Zhang
Genomics Proteomics Bioinformatics. 2022 Jan 3
参考