2024/05/10 誤字修正
(2010年の論文)
KaKs_Calculator 2.0と名付けた統合スタンドアローンソフトウェアパッケージのアップデート版を発表する。このパッケージには、非同義置換率と同義置換率を計算するための17の手法が組み込まれている。その中で、ガンマシリーズとして広く使われているいくつかの手法(ガンマ-NG、ガンマ-LWL、ガンマ-MLWL、ガンマ-LPB、ガンマ-MLPB、ガンマ-YN、ガンマ-MYNなど)の改良版を追加したが、これらは特定の条件下で元の形式よりも優れた性能を発揮することが実証されており、旧バージョンでは実装されていない。このパッケージは、タンパク質をコードする配列の5'から3'方向の興味のある配列を横切るスライディングウィンドウに基づいた正選択部位の同定に容易に使用でき、進化研究のための配列解析の全体的なパフォーマンスを向上させた。C++とJavaのソースコードとWindowsとLinuxの両プラットフォームで実行可能なファイルを含むツールボックスとユーザーインストラクションは、学術目的のためにウェブサイト(https://sourceforge.net/projects/kakscalculator2/)からダウンロードできる。
インストール
#conda(link)
mamba install -c bioconda kakscalculator2
> KaKs_Calculator -h
****************************************************************************************
Program: KaKs_Calculator Toolbox
Version: 2.0, June. 2009
Description: A toolbox based on integrating gamma methods and sliding window strategy.
****************************************************************************************
Usage: Kaks_Calculator <options>
-i Axt file name for calculating Ka & Ks.
-o Output file name for saving results.
-c Genetic code table (Default = 1-Standard Code).
1-Standard Code 2-Vertebrate Mitochondrial Code
3-Yeast Mitochondrial Code 4-Mold Mitochondrial Code
5-Invertebrate Mitochondrial Code 6-Ciliate, Dasycladacean and Hexamita Code
9-Echinoderm and Flatworm Mitochondrial Code 10-Euplotid Nuclear Code
11-Bacterial and Plant Plastid Code 12-Alternative Yeast Nuclear Code
13-Ascidian Mitochondrial Code 14-Alternative Flatworm Mitochondrial Code
15-Blepharisma Nuclear Code 16-Chlorophycean Mitochondrial Code
21-Trematode Mitochondrial Code 22-Scenedesmus obliquus mitochondrial Code
23-Thraustochytrium Mitochondrial Code
(More information about the Genetic Codes: http://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi?mode=c)
-m Methods for estimating Ka and Ks and theirs references(Default = MA)
NG Nei, M. and Gojobori, T. (1986) Mol. Biol. Evol., 3, 418-426.
LWL Li, W.H., Wu, C.I. and Luo, C.C. (1985) Mol. Biol. Evol., 2, 150-174.
LPB Li, W.H. (1993) J. Mol. Evol., 36, 96-99. Pamilo, P. and Bianchi, N.O. (1993) Mol. Biol. Evol., 10, 271-281.
MLWL Tzeng, Y.H., Pan, R. and Li, W.H. (2004) Mol. Biol. Evol., 21, 2290-2298.
MLPB Tzeng, Y.H., Pan, R. and Li, W.H. (2004) Mol. Biol. Evol., 21, 2290-2298.
GY Goldman, N. and Yang, Z. (1994) Mol. Biol. Evol., 11, 725-736.
YN Yang, Z. and Nielsen, R. (2000) Mol. Biol. Evol., 17, 32-43.
MYN Zhang, Z., Li, J. and Yu, J. (2006) BMC Evolutionary Biology, 6, 44.
MS Model Selection according to the AICc
MA Model Averaging on a set of candidate models
GNG Wang, DP., Zhang, S., He, FH., Zhu, J.,Hu, SN. and Yu, J.(2009) Genomics, Proteomics and Bioinformatics. In press.
GLWL Wang, DP., Zhang, S., He, FH., Zhu, J.,Hu, SN. and Yu, J.(2009) Genomics, Proteomics and Bioinformatics. In press.
GLPB Wang, DP., Zhang, S., He, FH., Zhu, J.,Hu, SN. and Yu, J.(2009) Genomics, Proteomics and Bioinformatics. In press.
GMLWL Wang, DP., Zhang, S., He, FH., Zhu, J.,Hu, SN. and Yu, J.(2009) Genomics, Proteomics and Bioinformatics. In press.
GMLPB Wang, DP., Zhang, S., He, FH., Zhu, J.,Hu, SN. and Yu, J.(2009) Genomics, Proteomics and Bioinformatics. In press.
GYN Wang, DP., Zhang, S., He, FH., Zhu, J.,Hu, SN. and Yu, J.(2009) Genomics, Proteomics and Bioinformatics. In press.
GMYN Wang, DP., Wan, HL., Zhang, S. and Yu, J. (2009) Biology Direct, 4:20 (16 June 2009)
Example:
./KaKs_Calculator -i test.axt -o test.axt.kaks -m GMYN //use Gamma-MYN method
For help information: KaKs_Calculator -h
Please send bugs or advice to Da-Peng Wang at wangdp@big.ac.cn or Yu-Bin Zhang at ybzhang@big.ac.cn.
テストラン
axt形式のアラインメントファイルと出力テキスト、コドン表、置換モデルを指定する。置換モデルについては論文で説明されている。
git clone https://github.com/kullrich/kakscalculator2.git
cd kakscalculator2/
KaKs_Calculator -i ./examples/example.axt -o ./examples/example.axt.kaks -m YN
-
-i Axt file name for calculating Ka & Ks.
-
-o Output file name for saving results.
- -c Genetic code table (Default = 1-Standard Code).
出力
左端拡大(2行目は見かけ上の改行)
右側拡大
以下の通り
説明は以下の通り(https://ngdc.cncb.ac.cn/tools/kaks/docより、18行以降、1行ずれあり)
- Sequence: Name of Pairwise sequence
- Method: Name of method for calculation of Ka and Ks
- Ka: Nonsynonymous substitution rate
- Ks: Synonymous substitution rate
- Ka/Ks: Selective strength
- P-Value(Fisher): The value computed by Fisher exact test
- Length: Sequence length (after removing gaps and stop codon(s))
- S-Sites: Synonymous sites
- N-Sites: Nonsynonymous sites
- Fold-Sites(0:2:4): 0,2,4-fold degenerate sites
- Substitutions: Substitutions between sequences
- S-Substitutions: Synonymous substitutions
- N-Substitutions: Nonsynonymous substitutions
- Fold-S-Substitutions(0:2:4): Synonymous substitutions at 0,2,4-fold
- Fold-N-Substitutions(0:2:4): Nonsynonymous substitutions at 0,2,4-fold
- Divergence-Time: Divergence time
- Substitution-Rate-Ratio(rTC:rAG:rTA:rCG:rTG:rCA/rCA): Ratios of six substitution
- rates to the substitution rate between C and A
- GC(1:2:3): GC content of entire sequences and of three codon positions
- ML-Score: Maximum likelihood score
- AICc: Value of AICc
- Akaike-Weight: Value of Akaike weight for model selection
- Model: Selected model for the method of MS
参考
axt形式の配列アラインメント例(kakscalculator2/examples/example.axt)
Biostarで書かれている方法でfasta形式の配列アラインメントからaxtに変換する。
Fasta to axt - KaKs Calculator
https://www.biostars.org/p/139371/
引用
KaKs_Calculator 2.0: a toolkit incorporating gamma-series methods and sliding window strategies
Dapeng Wang, Yubin Zhang, Zhang Zhang, Jiang Zhu, Jun Yu
Genomics Proteomics Bioinformatics. 2010 Mar;8(1):77-80
関連