macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

DNA解析ソフトに近い機能を提供するwebツール集 SMS

2019 8/7リンク追加

2021 10/3リンクエラー修正

 

SMSは、NGSの登場よりずっと以前から使われているDNA/プロテインの編集や変換ができるツール集である。昔からあるDNA解析ソフトの大半の機能をカバーしている。webサーバー版とオフラインで動くローカル版がある。いずれもhtmlベースで動作する(内部でjavaが動いている)。登場は古いが現在でも管理されている。ローカル版でもHTMLベースで解析できるので、コマンドラインに不慣れなユーザーも使いやすいと思われる。

 

トップページ

http://www.bioinformatics.org/sms2/index.html

できること一覧

http://www.bioinformatics.org/sms2/about.html

SMS version1

http://www.bioinformatics.org/sms/

 

  

プライマー結合サイトのツールを例に説明する。

Primer Map

f:id:kazumaxneo:20170906013115j:plain

exampleデータをランする。制限酵素サイトを示すチェックを入れ、1行に105行表示に変えてラン。

 ↓

プライマー結合サイトと制限酵素サイトが表示された。

f:id:kazumaxneo:20170906013343j:plain

 

このようにHTMLベースでデータ処理することが可能である。このようなツールが50近く利用できる。よく使いそうな機能に限定して機能を見ていく。

 

 

 シーケンス解析 

 

DNA配列の指定した領域を抽出する。

http://www.bioinformatics.org/sms2/range_extract_dna.html

アミノ酸配列の指定した領域を抽出する。

http://www.bioinformatics.org/sms2/range_extract_protein.html

DNA配列の逆相補鎖(reverse complementary)を表示する。

http://www.bioinformatics.org/sms2/rev_comp.html

DNAのcodon usageを計算する。

http://www.bioinformatics.org/sms2/codon_usage.html

CpGアイランド探す。

CpG Islands

DNAの分子量(ダルトン)を求める。

http://www.bioinformatics.org/sms2/dna_mw.html

タンパク質の分子量(ダルトン)を求める。

Protein Molecular Weight

 あるパターンの配列を探す(e.g., CTTで次がC or Tを探す)。

http://www.bioinformatics.org/sms2/dna_pattern.html

 似た塩基配列を探す(search homology)。

Fuzzy Search DNA 

似たアミノ酸配列を探す。

http://www.bioinformatics.org/sms2/fuzzy_search_protein.html

逆翻訳してdegenerate DNAを作成。

Multi Rev Trans

少しの変異導入で制限酵素サイトになるDNA配列を探す。

Mutate for Digest

コード領域を探す。

ORF Finder

プライマーのTmやプライマーダイマーの可能性を調べる。

PCR Primer Stats

塩基配列とプライマー配列を入力することでPCR増幅後の塩基配列を返す。

http://www.bioinformatics.org/sms2/pcr_products.html

タンパク質の等電点(pH)を計算。

http://www.bioinformatics.org/sms2/protein_iep.html

制限酵素処理後の配列を表示する。

Restriction Digest

DNAをタンパク質に変換(翻訳)する。

http://www.bioinformatics.org/sms2/translate.html

 (* 6-frameで翻訳するならこちらも便利じゃないでしょうか。)

タンパク質をDNAに逆変換(逆翻訳)する。

http://www.bioinformatics.org/sms2/rev_trans.html

 

Sequence Figures

アライメント結果を入力してマッチする部位に色をつける。

Color Align Properties

指定文字数で改行やスペースを入れ、DNA配列のポジションをわかりやすくする。

http://www.bioinformatics.org/sms2/group_dna.html

指定文字数で改行やスペースを入れ、タンパク質のポジションをわかりやすくする。

Group Protein

制限酵素サイト一覧を表示。

http://www.bioinformatics.org/sms2/rest_map.html

3-frameで翻訳する。

Translation Map

 

ランダム変異

指定頻度でDNAに変異を導入する。

http://www.bioinformatics.org/sms2/mutate_dna.html

指定頻度でタンパク質のアミノ酸残基を変化させる。

http://www.bioinformatics.org/sms2/mutate_protein.html

コード領域全長サイズのランダムなDNA配列を発生させる(ネガコンに使える)。

Random Coding DNA

DNAの指定した領域をランダムな塩基配列に置換する。

http://www.bioinformatics.org/sms2/random_dna_regions.html

タンパク質の指定した領域をランダムなアミノ酸配列に置換する。

Random Protein Sequence

DNA配列をランダムにシャッフルする。

http://www.bioinformatics.org/sms2/shuffle_dna.html

アミノ酸配列をランダムにシャッフルする。

Shuffle Protein

genetic code一覧。

http://www.bioinformatics.org/sms2/genetic_code.html

2つの配列をマージする(500000文字まで)。

http://www.bioinformatics.org/sms2/combine_fasta.html

 

フォーマット変換

EMBLをfastaに変換する。

http://www.bioinformatics.org/sms2/embl_fasta.html

EMBLのDNA配列をアミノ酸配列に変換する。

http://www.bioinformatics.org/sms2/embl_trans.html

Genbankfastaに変換する。

GenBank to FASTA

GenbankのDNA配列をアミノ酸配列に変換する。

http://www.bioinformatics.org/sms2/genbank_trans.html

DNAから数値などの余計な文字を消去する。

http://www.bioinformatics.org/sms2/filter_dna.html

アミノ酸配列から数値などの余計な文字を消去する。

Filter Protein

アミノ酸1文字表記を3文字表記に変換する。

http://www.bioinformatics.org/sms2/one_to_three.html

アミノ酸3文字表記を1文字表記に変換する。

Three to One

fastaを指定した長さに分割する。

http://www.bioinformatics.org/sms2/split_fasta.html

 

マルチプルアライメントを行い分子系統樹を作成したければ、以下のMAFFT onlineを利用して下さい。全てオンラインでできます。

引用

The Sequence Manipulation Suite: JavaScript programs for analyzing and formatting protein and DNA sequences

Stothard P

Biotechniques. 2000 Jun;28(6):1102, 1104.

Fri Jun 17 16:17:06 2016 Valid XHTML 1.0; Valid CSS

http://www.bioinformatics.org/sms2/acknowledgments.html

 

関連


Genbankから遺伝子配列を簡単に取り出す