macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

MSIsensor

 

 マイクロサテライト不安定性(MSI)は、より大きなゲノム不安定性の重要な指標であり、リンチ症候群をはじめとする多くの遺伝病と関連している。また、MSIの状態は、大腸がんや子宮内膜がんなどの複数のがん種において、良好な生存率を示す独立した予後因子でもある。また、化学療法剤の選択にも影響を与える。しかし、現在のPCR-電気泳動法に基づく検出方法は手間と時間がかかり、サンプルを分類するために目視検査を必要とすることが多い。著者らは、体細胞のマイクロサテライトの変化を自動的に検出するC++プログラム、MSIsensorを開発した。このプログラムは、ペアになった腫瘍と正常のシークエンシングデータにおいて、部位ごとのマイクロサテライトの長さ分布を計算し、それを用いて両サンプルで観測された分布を統計的に比較する。包括的なテストにより、MSIsensorは、標準的な腫瘍と正常のペアシーケンスデータからMSIステータスを導出するための効率的かつ効果的なツールであることが示された。

 

Input Files format

https://github.com/xjtu-omics/msisensor-pro/wiki/Input-Files-format

 

インストール

mamba (conda)の仮想環境(python3.9)に導入した。

Github

#conda (link)
mamba install -c bioconda msisensor -y

> msisensor scan

$ msisensor scan

 

Usage: msisensor scan [options]

 

-d <string> reference genome sequences file, *.fasta format

-o <string> output homopolymer and microsatelittes file

 

-l <int> minimal homopolymer size, default=5

-c <int> context length, default=5

-m <int> maximal homopolymer size, default=50

-s <int> maximal length of microsate, default=5

-r <int> minimal repeat times of microsate, default=3

-p <int> output homopolymer only, 0: no; 1: yes, default=0

 

 

-h help

> msisensor msi

$ msisensor msi

 

Usage: msisensor msi [options]

 

-d <string> homopolymer and microsates file

-n <string> normal bam file

-t <string> tumor bam file

-o <string> output distribution file

 

-e <string> bed file, optional

-f <double> FDR threshold for somatic sites detection, default=0.05

-i <double> minimal comentropy threshold for somatic sites detection (just for tumor only data), default=1

-c <int> coverage threshold for msi analysis, WXS: 20; WGS: 15, default=20

-r <string> choose one region, format: 1:10000000-20000000

-l <int> minimal homopolymer size, default=5

-p <int> minimal homopolymer size for distribution analysis, default=10

-m <int> maximal homopolymer size for distribution analysis, default=50

-q <int> minimal microsates size, default=3

-s <int> minimal microsates size for distribution analysis, default=5

-w <int> maximal microstaes size for distribution analysis, default=40

-u <int> span size around window for extracting reads, default=500

-b <int> threads number for parallel computing, default=1

-x <int> output homopolymer only, 0: no; 1: yes, default=0

-y <int> output microsatellite only, 0: no; 1: yes, default=0

 

-h help

 

 

実行方法

msisensor scan

msisensor scan -d ref.fasta -o out

 

 

引用
MSIsensor: microsatellite instability detection using paired tumor-normal sequence data
Beifang Niu, Kai Ye, Qunyuan Zhang, Charles Lu, Mingchao Xie, Michael D McLellan, Michael C Wendl, Li Ding

Bioinformatics. 2014 Apr 1;30(7):1015-6