macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

DNA解析ソフトに近い機能を提供するwebツール集 SMS

GUIツール DNA解析ソフト format conversion 2000 Biotechniques (Journal) web tool 初心者向けインフォマティクス解析をサポートするツール

2019 8/7リンク追加

2021 10/3リンクエラー修正

SMSは、NGSの登場よりずっと以前から使われているDNA/プロテインの編集や変換ができるツール集である。昔からあるDNA解析ソフトの大半の機能をカバーしている。webサーバー版とオフラインで動くローカル版がある。いずれもhtmlベースで動作する（内部でjavaが動いている）。登場は古いが現在でも管理されている。ローカル版でもHTMLベースで解析できるので、コマンドラインに不慣れなユーザーも使いやすいと思われる。

トップページ

http://www.bioinformatics.org/sms2/index.html

できること一覧

http://www.bioinformatics.org/sms2/about.html

SMS version1

http://www.bioinformatics.org/sms/

プライマー結合サイトのツールを例に説明する。

f:id:kazumaxneo:20170906013115j:plain

exampleデータをランする。制限酵素サイトを示すチェックを入れ、１行に105行表示に変えてラン。

　↓

プライマー結合サイトと制限酵素サイトが表示された。

f:id:kazumaxneo:20170906013343j:plain

このようにHTMLベースでデータ処理することが可能である。このようなツールが50近く利用できる。よく使いそうな機能に限定して機能を見ていく。

シーケンス解析

DNA配列の指定した領域を抽出する。

http://www.bioinformatics.org/sms2/range_extract_dna.html

アミノ酸配列の指定した領域を抽出する。

http://www.bioinformatics.org/sms2/range_extract_protein.html

DNA配列の逆相補鎖（reverse complementary）を表示する。

http://www.bioinformatics.org/sms2/rev_comp.html

DNAのcodon usageを計算する。

http://www.bioinformatics.org/sms2/codon_usage.html

CpGアイランド探す。

DNAの分子量（ダルトン）を求める。

http://www.bioinformatics.org/sms2/dna_mw.html

タンパク質の分子量（ダルトン）を求める。

Protein Molecular Weight

あるパターンの配列を探す（e.g., CTTで次がC or Tを探す）。

http://www.bioinformatics.org/sms2/dna_pattern.html

似た塩基配列を探す（search homology）。

Fuzzy Search DNA

似たアミノ酸配列を探す。

http://www.bioinformatics.org/sms2/fuzzy_search_protein.html

逆翻訳してdegenerate DNAを作成。

Multi Rev Trans

少しの変異導入で制限酵素サイトになるDNA配列を探す。

Mutate for Digest

コード領域を探す。

プライマーのTmやプライマーダイマーの可能性を調べる。

PCR Primer Stats

塩基配列とプライマー配列を入力することでPCR増幅後の塩基配列を返す。

http://www.bioinformatics.org/sms2/pcr_products.html

タンパク質の等電点（pH）を計算。

http://www.bioinformatics.org/sms2/protein_iep.html

制限酵素処理後の配列を表示する。

Restriction Digest

DNAをタンパク質に変換（翻訳）する。

http://www.bioinformatics.org/sms2/translate.html

(* 6-frameで翻訳するならこちらも便利じゃないでしょうか。)

タンパク質をDNAに逆変換（逆翻訳）する。

http://www.bioinformatics.org/sms2/rev_trans.html

Sequence Figures

アライメント結果を入力してマッチする部位に色をつける。

Color Align Properties

指定文字数で改行やスペースを入れ、DNA配列のポジションをわかりやすくする。

http://www.bioinformatics.org/sms2/group_dna.html

指定文字数で改行やスペースを入れ、タンパク質のポジションをわかりやすくする。

制限酵素サイト一覧を表示。

http://www.bioinformatics.org/sms2/rest_map.html

3-frameで翻訳する。

Translation Map

ランダム変異

指定頻度でDNAに変異を導入する。

http://www.bioinformatics.org/sms2/mutate_dna.html

指定頻度でタンパク質のアミノ酸残基を変化させる。

http://www.bioinformatics.org/sms2/mutate_protein.html

コード領域全長サイズのランダムなDNA配列を発生させる（ネガコンに使える）。

Random Coding DNA

DNAの指定した領域をランダムな塩基配列に置換する。

http://www.bioinformatics.org/sms2/random_dna_regions.html

タンパク質の指定した領域をランダムなアミノ酸配列に置換する。

Random Protein Sequence

DNA配列をランダムにシャッフルする。

http://www.bioinformatics.org/sms2/shuffle_dna.html

アミノ酸配列をランダムにシャッフルする。

Shuffle Protein

genetic code一覧。

http://www.bioinformatics.org/sms2/genetic_code.html

２つの配列をマージする（500000文字まで）。

http://www.bioinformatics.org/sms2/combine_fasta.html

フォーマット変換

EMBLをfastaに変換する。

http://www.bioinformatics.org/sms2/embl_fasta.html

EMBLのDNA配列をアミノ酸配列に変換する。

http://www.bioinformatics.org/sms2/embl_trans.html

Genbankをfastaに変換する。

GenBank to FASTA

GenbankのDNA配列をアミノ酸配列に変換する。

http://www.bioinformatics.org/sms2/genbank_trans.html

DNAから数値などの余計な文字を消去する。

http://www.bioinformatics.org/sms2/filter_dna.html

アミノ酸配列から数値などの余計な文字を消去する。

アミノ酸１文字表記を３文字表記に変換する。

http://www.bioinformatics.org/sms2/one_to_three.html

アミノ酸３文字表記を１文字表記に変換する。

fastaを指定した長さに分割する。

http://www.bioinformatics.org/sms2/split_fasta.html

マルチプルアライメントを行い分子系統樹を作成したければ、以下のMAFFT onlineを利用して下さい。全てオンラインでできます。

引用

The Sequence Manipulation Suite: JavaScript programs for analyzing and formatting protein and DNA sequences

Stothard P

Biotechniques. 2000 Jun;28(6):1102, 1104.

Fri Jun 17 16:17:06 2016 Valid XHTML 1.0; Valid CSS

http://www.bioinformatics.org/sms2/acknowledgments.html

関連

Genbankから遺伝子配列を簡単に取り出す