マイクロサテライト不安定性(MSI)は、より大きなゲノム不安定性の重要な指標であり、リンチ症候群をはじめとする多くの遺伝病と関連している。また、MSIの状態は、大腸がんや子宮内膜がんなどの複数のがん種において、良好な生存率を示す独立した予後因子でもある。また、化学療法剤の選択にも影響を与える。しかし、現在のPCR-電気泳動法に基づく検出方法は手間と時間がかかり、サンプルを分類するために目視検査を必要とすることが多い。著者らは、体細胞のマイクロサテライトの変化を自動的に検出するC++プログラム、MSIsensorを開発した。このプログラムは、ペアになった腫瘍と正常のシークエンシングデータにおいて、部位ごとのマイクロサテライトの長さ分布を計算し、それを用いて両サンプルで観測された分布を統計的に比較する。包括的なテストにより、MSIsensorは、標準的な腫瘍と正常のペアシーケンスデータからMSIステータスを導出するための効率的かつ効果的なツールであることが示された。
Input Files format
https://github.com/xjtu-omics/msisensor-pro/wiki/Input-Files-format
インストール
mamba (conda)の仮想環境(python3.9)に導入した。
#conda (link)
mamba install -c bioconda msisensor -y
> msisensor scan
$ msisensor scan
Usage: msisensor scan [options]
-d <string> reference genome sequences file, *.fasta format
-o <string> output homopolymer and microsatelittes file
-l <int> minimal homopolymer size, default=5
-c <int> context length, default=5
-m <int> maximal homopolymer size, default=50
-s <int> maximal length of microsate, default=5
-r <int> minimal repeat times of microsate, default=3
-p <int> output homopolymer only, 0: no; 1: yes, default=0
-h help
> msisensor msi
$ msisensor msi
Usage: msisensor msi [options]
-d <string> homopolymer and microsates file
-n <string> normal bam file
-t <string> tumor bam file
-o <string> output distribution file
-e <string> bed file, optional
-f <double> FDR threshold for somatic sites detection, default=0.05
-i <double> minimal comentropy threshold for somatic sites detection (just for tumor only data), default=1
-c <int> coverage threshold for msi analysis, WXS: 20; WGS: 15, default=20
-r <string> choose one region, format: 1:10000000-20000000
-l <int> minimal homopolymer size, default=5
-p <int> minimal homopolymer size for distribution analysis, default=10
-m <int> maximal homopolymer size for distribution analysis, default=50
-q <int> minimal microsates size, default=3
-s <int> minimal microsates size for distribution analysis, default=5
-w <int> maximal microstaes size for distribution analysis, default=40
-u <int> span size around window for extracting reads, default=500
-b <int> threads number for parallel computing, default=1
-x <int> output homopolymer only, 0: no; 1: yes, default=0
-y <int> output microsatellite only, 0: no; 1: yes, default=0
-h help
実行方法
msisensor scan
msisensor scan -d ref.fasta -o out
引用
MSIsensor: microsatellite instability detection using paired tumor-normal sequence data
Beifang Niu, Kai Ye, Qunyuan Zhang, Charles Lu, Mingchao Xie, Michael D McLellan, Michael C Wendl, Li Ding
Bioinformatics. 2014 Apr 1;30(7):1015-6