macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

KaKs_Calculator 2.0

2024/05/10 誤字修正

 

(2010年の論文)

KaKs_Calculator 2.0と名付けた統合スタンドアローンソフトウェアパッケージのアップデート版を発表する。このパッケージには、非同義置換率と同義置換率を計算するための17の手法が組み込まれている。その中で、ガンマシリーズとして広く使われているいくつかの手法(ガンマ-NG、ガンマ-LWL、ガンマ-MLWL、ガンマ-LPB、ガンマ-MLPB、ガンマ-YN、ガンマ-MYNなど)の改良版を追加したが、これらは特定の条件下で元の形式よりも優れた性能を発揮することが実証されており、旧バージョンでは実装されていない。このパッケージは、タンパク質をコードする配列の5'から3'方向の興味のある配列を横切るスライディングウィンドウに基づいた正選択部位の同定に容易に使用でき、進化研究のための配列解析の全体的なパフォーマンスを向上させた。C++JavaソースコードWindowsLinuxの両プラットフォームで実行可能なファイルを含むツールボックスとユーザーインストラクションは、学術目的のためにウェブサイト(https://sourceforge.net/projects/kakscalculator2/)からダウンロードできる。

 

インストール

SourceForge

Github

#conda(link)
mamba install -c bioconda kakscalculator2

> KaKs_Calculator -h

 

****************************************************************************************

  Program: KaKs_Calculator Toolbox

  Version: 2.0, June. 2009

  Description: A toolbox based on integrating gamma methods and sliding window strategy.

****************************************************************************************

 

Usage: Kaks_Calculator <options>

-i Axt file name for calculating Ka & Ks.

-o Output file name for saving results.

-c Genetic code table (Default = 1-Standard Code).

  1-Standard Code   2-Vertebrate Mitochondrial Code

  3-Yeast Mitochondrial Code   4-Mold Mitochondrial Code

  5-Invertebrate Mitochondrial Code   6-Ciliate, Dasycladacean and Hexamita Code

  9-Echinoderm and Flatworm Mitochondrial Code   10-Euplotid Nuclear Code

  11-Bacterial and Plant Plastid Code   12-Alternative Yeast Nuclear Code

  13-Ascidian Mitochondrial Code   14-Alternative Flatworm Mitochondrial Code

  15-Blepharisma Nuclear Code   16-Chlorophycean Mitochondrial Code

  21-Trematode Mitochondrial Code   22-Scenedesmus obliquus mitochondrial Code

  23-Thraustochytrium Mitochondrial Code

  (More information about the Genetic Codes: http://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi?mode=c)

-m Methods for estimating Ka and Ks and theirs references(Default = MA)

  NG Nei, M. and Gojobori, T. (1986) Mol. Biol. Evol., 3, 418-426.

  LWL Li, W.H., Wu, C.I. and Luo, C.C. (1985) Mol. Biol. Evol., 2, 150-174.

  LPB Li, W.H. (1993) J. Mol. Evol., 36, 96-99.    Pamilo, P. and Bianchi, N.O. (1993) Mol. Biol. Evol., 10, 271-281.

  MLWL Tzeng, Y.H., Pan, R. and Li, W.H. (2004) Mol. Biol. Evol., 21, 2290-2298.

  MLPB Tzeng, Y.H., Pan, R. and Li, W.H. (2004) Mol. Biol. Evol., 21, 2290-2298.

  GY Goldman, N. and Yang, Z. (1994) Mol. Biol. Evol., 11, 725-736.

  YN Yang, Z. and Nielsen, R. (2000) Mol. Biol. Evol., 17, 32-43.

  MYN Zhang, Z., Li, J. and Yu, J. (2006) BMC Evolutionary Biology, 6, 44.

  MS Model Selection according to the AICc

  MA Model Averaging on a set of candidate models

  GNG Wang, DP., Zhang, S., He, FH., Zhu, J.,Hu, SN. and Yu, J.(2009) Genomics, Proteomics and Bioinformatics. In press.

  GLWL Wang, DP., Zhang, S., He, FH., Zhu, J.,Hu, SN. and Yu, J.(2009) Genomics, Proteomics and Bioinformatics. In press.

  GLPB Wang, DP., Zhang, S., He, FH., Zhu, J.,Hu, SN. and Yu, J.(2009) Genomics, Proteomics and Bioinformatics. In press.

  GMLWL Wang, DP., Zhang, S., He, FH., Zhu, J.,Hu, SN. and Yu, J.(2009) Genomics, Proteomics and Bioinformatics. In press.

  GMLPB Wang, DP., Zhang, S., He, FH., Zhu, J.,Hu, SN. and Yu, J.(2009) Genomics, Proteomics and Bioinformatics. In press.

  GYN Wang, DP., Zhang, S., He, FH., Zhu, J.,Hu, SN. and Yu, J.(2009) Genomics, Proteomics and Bioinformatics. In press.

  GMYN Wang, DP., Wan, HL., Zhang, S. and Yu, J. (2009) Biology Direct, 4:20 (16 June 2009)

 

Example:

./KaKs_Calculator -i test.axt -o test.axt.kaks -m GMYN //use Gamma-MYN method

 

For help information: KaKs_Calculator -h

Please send bugs or advice to Da-Peng Wang at wangdp@big.ac.cn or Yu-Bin Zhang at ybzhang@big.ac.cn.

 

 

テストラン

axt形式のアラインメントファイルと出力テキスト、コドン表、置換モデルを指定する。置換モデルについては論文で説明されている。

git clone https://github.com/kullrich/kakscalculator2.git
cd kakscalculator2/
KaKs_Calculator -i ./examples/example.axt -o ./examples/example.axt.kaks -m YN
  • -i    Axt file name for calculating Ka & Ks.

  • -o   Output file name for saving results. 

  • -c   Genetic code table (Default = 1-Standard Code).

出力

左端拡大(2行目は見かけ上の改行)

右側拡大

 

以下の通り

 

説明は以下の通り(https://ngdc.cncb.ac.cn/tools/kaks/docより、18行以降、1行ずれあり)

  1. Sequence: Name of Pairwise sequence
  2. Method: Name of method for calculation of Ka and Ks
  3. Ka: Nonsynonymous substitution rate
  4. Ks: Synonymous substitution rate
  5. Ka/Ks: Selective strength
  6. P-Value(Fisher): The value computed by Fisher exact test
  7. Length: Sequence length (after removing gaps and stop codon(s))
  8. S-Sites: Synonymous sites
  9. N-Sites: Nonsynonymous sites
  10. Fold-Sites(0:2:4): 0,2,4-fold degenerate sites
  11. Substitutions: Substitutions between sequences
  12. S-Substitutions: Synonymous substitutions
  13. N-Substitutions: Nonsynonymous substitutions
  14. Fold-S-Substitutions(0:2:4): Synonymous substitutions at 0,2,4-fold
  15. Fold-N-Substitutions(0:2:4): Nonsynonymous substitutions at 0,2,4-fold
  16. Divergence-Time: Divergence time
  17. Substitution-Rate-Ratio(rTC:rAG:rTA:rCG:rTG:rCA/rCA): Ratios of six substitution
  18. rates to the substitution rate between C and A
  19. GC(1:2:3): GC content of entire sequences and of three codon positions
  20. ML-Score: Maximum likelihood score
  21. AICc: Value of AICc
  22. Akaike-Weight: Value of Akaike weight for model selection
  23. Model: Selected model for the method of MS

 

参考

axt形式の配列アラインメント例(kakscalculator2/examples/example.axt)

Biostarで書かれている方法でfasta形式の配列アラインメントからaxtに変換する。

Fasta to axt - KaKs Calculator

https://www.biostars.org/p/139371/

 

引用

KaKs_Calculator 2.0: a toolkit incorporating gamma-series methods and sliding window strategies

Dapeng Wang, Yubin Zhang, Zhang Zhang, Jiang Zhu, Jun Yu

Genomics Proteomics Bioinformatics. 2010 Mar;8(1):77-80

 

関連

KaKs_Calculator 3.0