2019 8/7リンク追加
2021 10/3リンクエラー修正
SMSは、NGSの登場よりずっと以前から使われているDNA/プロテインの編集や変換ができるツール集である。昔からあるDNA解析ソフトの大半の機能をカバーしている。webサーバー版とオフラインで動くローカル版がある。いずれもhtmlベースで動作する(内部でjavaが動いている)。登場は古いが現在でも管理されている。ローカル版でもHTMLベースで解析できるので、コマンドラインに不慣れなユーザーも使いやすいと思われる。
トップページ
http://www.bioinformatics.org/sms2/index.html
できること一覧
http://www.bioinformatics.org/sms2/about.html
SMS version1
http://www.bioinformatics.org/sms/
プライマー結合サイトのツールを例に説明する。
exampleデータをランする。制限酵素サイトを示すチェックを入れ、1行に105行表示に変えてラン。
↓
プライマー結合サイトと制限酵素サイトが表示された。
このようにHTMLベースでデータ処理することが可能である。このようなツールが50近く利用できる。よく使いそうな機能に限定して機能を見ていく。
シーケンス解析
DNA配列の指定した領域を抽出する。
http://www.bioinformatics.org/sms2/range_extract_dna.html
アミノ酸配列の指定した領域を抽出する。
http://www.bioinformatics.org/sms2/range_extract_protein.html
DNA配列の逆相補鎖(reverse complementary)を表示する。
http://www.bioinformatics.org/sms2/rev_comp.html
DNAのcodon usageを計算する。
http://www.bioinformatics.org/sms2/codon_usage.html
CpGアイランド探す。
DNAの分子量(ダルトン)を求める。
http://www.bioinformatics.org/sms2/dna_mw.html
タンパク質の分子量(ダルトン)を求める。
あるパターンの配列を探す(e.g., CTTで次がC or Tを探す)。
http://www.bioinformatics.org/sms2/dna_pattern.html
似た塩基配列を探す(search homology)。
似たアミノ酸配列を探す。
http://www.bioinformatics.org/sms2/fuzzy_search_protein.html
逆翻訳してdegenerate DNAを作成。
少しの変異導入で制限酵素サイトになるDNA配列を探す。
コード領域を探す。
プライマーのTmやプライマーダイマーの可能性を調べる。
塩基配列とプライマー配列を入力することでPCR増幅後の塩基配列を返す。
http://www.bioinformatics.org/sms2/pcr_products.html
タンパク質の等電点(pH)を計算。
http://www.bioinformatics.org/sms2/protein_iep.html
制限酵素処理後の配列を表示する。
DNAをタンパク質に変換(翻訳)する。
http://www.bioinformatics.org/sms2/translate.html
タンパク質をDNAに逆変換(逆翻訳)する。
http://www.bioinformatics.org/sms2/rev_trans.html
Sequence Figures
アライメント結果を入力してマッチする部位に色をつける。
指定文字数で改行やスペースを入れ、DNA配列のポジションをわかりやすくする。
http://www.bioinformatics.org/sms2/group_dna.html
指定文字数で改行やスペースを入れ、タンパク質のポジションをわかりやすくする。
制限酵素サイト一覧を表示。
http://www.bioinformatics.org/sms2/rest_map.html
3-frameで翻訳する。
ランダム変異
指定頻度でDNAに変異を導入する。
http://www.bioinformatics.org/sms2/mutate_dna.html
指定頻度でタンパク質のアミノ酸残基を変化させる。
http://www.bioinformatics.org/sms2/mutate_protein.html
コード領域全長サイズのランダムなDNA配列を発生させる(ネガコンに使える)。
DNAの指定した領域をランダムな塩基配列に置換する。
http://www.bioinformatics.org/sms2/random_dna_regions.html
タンパク質の指定した領域をランダムなアミノ酸配列に置換する。
DNA配列をランダムにシャッフルする。
http://www.bioinformatics.org/sms2/shuffle_dna.html
アミノ酸配列をランダムにシャッフルする。
genetic code一覧。
http://www.bioinformatics.org/sms2/genetic_code.html
2つの配列をマージする(500000文字まで)。
http://www.bioinformatics.org/sms2/combine_fasta.html
フォーマット変換
EMBLをfastaに変換する。
http://www.bioinformatics.org/sms2/embl_fasta.html
EMBLのDNA配列をアミノ酸配列に変換する。
http://www.bioinformatics.org/sms2/embl_trans.html
http://www.bioinformatics.org/sms2/genbank_trans.html
DNAから数値などの余計な文字を消去する。
http://www.bioinformatics.org/sms2/filter_dna.html
アミノ酸配列から数値などの余計な文字を消去する。
アミノ酸1文字表記を3文字表記に変換する。
http://www.bioinformatics.org/sms2/one_to_three.html
アミノ酸3文字表記を1文字表記に変換する。
fastaを指定した長さに分割する。
http://www.bioinformatics.org/sms2/split_fasta.html
マルチプルアライメントを行い分子系統樹を作成したければ、以下のMAFFT onlineを利用して下さい。全てオンラインでできます。
引用
The Sequence Manipulation Suite: JavaScript programs for analyzing and formatting protein and DNA sequences
Stothard P
Biotechniques. 2000 Jun;28(6):1102, 1104.
Fri Jun 17 16:17:06 2016 Valid XHTML 1.0; Valid CSS
http://www.bioinformatics.org/sms2/acknowledgments.html
関連
Genbankから遺伝子配列を簡単に取り出す