macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

TMHMMのpython3実装 tmhmm.py

 

tmhmm.pyはPython 3.5+で実装された transmembrane helix hidden Markov model (TMHMM) 。以下の理由で公開されている。

 

公開されているのはいくつかの理由がある:

  • ソースコードが出版物の一部として入手できない、
  • ダウンロード可能なバイナリはLinux専用である、
  • 大規模なデータセットで膜貫通らせんを予測する必要があるため、ウェブサービスは使えない。
  • このPython実装には、モデルを記述するために使用される文書化されていないファイルフォーマットのパーサーと、アノテーションを実行するために使用されるViterbi アルゴリズムのかなり高速なCython実装が含まれている。このツールは、オリジナルのTMHMM実装によって生成されたファイルに似たファイルを出力する。

(レポジトリのまま)

 

インストール

Github

mamba create -n tmhmm python=3.5 -y
conda activate tmhmm
git clone https://github.com/dansondergaard/tmhmm.py.git
python setup.py install

#pip
pip install tmhmm.py

#conda(link)
mamba install dansondergaard::tmhmm.py -y

> tmhmm -h

usage: tmhmm [-h] -f SEQUENCE_FILE [-m MODEL_FILE]

 

 

 

optional arguments:

 

  -h, --help            show this help message and exit

 

  -f SEQUENCE_FILE, --file SEQUENCE_FILE

 

                        path to file in fasta format with sequences

 

  -m MODEL_FILE, --model MODEL_FILE

 

                        path to the model to use

 

 

DTUのライセンスにより、モデルはtmhmm.pyと一緒に公開して配布できない。DTUのウェブサイトからダウンロードする。

 

https://services.healthtech.dtu.dk/services/TMHMM-2.0/

OSを選択後、所属を書いて申請する。記載したメールアドレスにダウンロードリンクが届く。

tmhmm-2.0c/

modelファイルを使う。

 

 

実行方法

モデルとfastaファイルを指定する。

tmhmm -m TMHMM2.0.model -f test.fa

 

引用

https://github.com/dansondergaard/tmhmm.py

 

関連

膜貫通領域を予測する TMHMM