tmhmm.pyはPython 3.5+で実装された transmembrane helix hidden Markov model (TMHMM) 。以下の理由で公開されている。
公開されているのはいくつかの理由がある:
- ソースコードが出版物の一部として入手できない、
- ダウンロード可能なバイナリはLinux専用である、
- 大規模なデータセットで膜貫通らせんを予測する必要があるため、ウェブサービスは使えない。
- このPython実装には、モデルを記述するために使用される文書化されていないファイルフォーマットのパーサーと、アノテーションを実行するために使用されるViterbi アルゴリズムのかなり高速なCython実装が含まれている。このツールは、オリジナルのTMHMM実装によって生成されたファイルに似たファイルを出力する。
(レポジトリのまま)
インストール
mamba create -n tmhmm python=3.5 -y
conda activate tmhmm
git clone https://github.com/dansondergaard/tmhmm.py.git
python setup.py install
#pip
pip install tmhmm.py
#conda(link)
mamba install dansondergaard::tmhmm.py -y
> tmhmm -h
usage: tmhmm [-h] -f SEQUENCE_FILE [-m MODEL_FILE]
optional arguments:
-h, --help show this help message and exit
-f SEQUENCE_FILE, --file SEQUENCE_FILE
path to file in fasta format with sequences
-m MODEL_FILE, --model MODEL_FILE
path to the model to use
DTUのライセンスにより、モデルはtmhmm.pyと一緒に公開して配布できない。DTUのウェブサイトからダウンロードする。
https://services.healthtech.dtu.dk/services/TMHMM-2.0/
OSを選択後、所属を書いて申請する。記載したメールアドレスにダウンロードリンクが届く。
tmhmm-2.0c/
modelファイルを使う。
実行方法
モデルとfastaファイルを指定する。
tmhmm -m TMHMM2.0.model -f test.fa
引用
https://github.com/dansondergaard/tmhmm.py
関連