macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

マイクロサテライトの高速検索を行うGUIツール Krait

 

 一般にsimple sequence repeats(SSR)またはsimple tandem repeats(STR)とも呼ばれるマイクロサテライトは、1〜6bpの単位長の短いタンデム反復DNA配列である。マッピングや集団遺伝学、法医学検査および系統解析(Ellegren 2004; Vieira et al、2016)における強力な分子マーカーとして広範囲に利用されてきた。マイクロサテライト突然変異は、多数のヒトの遺伝病に関与し、様々な調節機構および進化において重要な役割を果たす組織内および世代にわたる動的プロセスである(Kelkar et al、2011)。例えば、マイクロサテライトは主に家庭犬の形態進化とvoles(ハタネズミ)の独特の社会行動に関与していると報告されている(Merkel and Gemmell、2008)。

 ゲノムデータの利用可能性が急速に高まっているため、コストと労働集約的な従来のアプローチを使用する代わりに、コンピュータツールに基づく新しいインシリコアプローチがマイクロサテライトマーカーを抽出するために広く使用されている。MISA (Thiel et al、2003)、SciRoKo(Kofler et al、2007)、msatcommander(Faircloth、2008)、MSDB(MSDB)などの多数のアルゴリズムバイオインフォマティクスソフトウェアがマイクロサテライト検索と調査のために開発されている。それらのほとんどはゲノムワイドマイクロサテライト検索において優れた性能を示す。一般的に、ゲノム内のマイクロサテライトの探索は、それらの分布および存在量を研究するために使用されるだけでなく、その後の生物学的分析のための有用で安定なマーカーを得るために使用される。残念なことに、動植物ゲノムは非常に大きく、膨大な数のマイクロサテライトを含んでいるため、プライマー設計の要件を満たす巨大なデータセットからのマイクロサテライトマーカーをスクリーニングすることは難題になる。例えば、ヒトゲノムは、200万個のマイクロサテライト遺伝子座を含む(Subramanian et al、2003)。さらに、以前に開発されたすべての検索ツールは、生物学者が下流の分析を行い、マイクロサテライト検索結果を視覚化することを制限する独自の出力形式を持っている(論文 supplementary table S1)。

 この論文では、利用可能なツールの限界を克服しようとする、マイクロサテライトのゲノムワイドな調査のためのユーザーフレンドリーなグラフィックインターフェイスを備えた堅牢で超高速なツールKraitを紹介する。 Kraitは、完全保存、または不完全な複合マイクロサテライトの検索を可能にし、その後のプライマー設計のためにマイクロサテライトマーカーをスクリーニングすることを可能にする。

 

マニュアルPDF

krait/Manual.pdf at master · lmdu/krait · GitHub

 

インストール

Github リリースよりmac版をダウンロードする。

Krait-0.10.2-mac.tar.xzを解凍するとappファイルができるので、Applicationフォルダ(command + shift + A)に移動しておく。

f:id:kazumaxneo:20180401000408j:plain

 

ラン

起動直後のウィンドウ。perfect microsatellites (SSRs)、compound SSRs、imperfect SSRs、A variable number tandem repeat (VNTR)、primer設計、statistics解析ができる。

f:id:kazumaxneo:20180401000637j:plain

 

f:id:kazumaxneo:20180401001404j:plain

 

FASTAファイルをインポートする。

f:id:kazumaxneo:20180401000644j:plain

NCBIから直接インポートすることも可能。

f:id:kazumaxneo:20180401002239j:plain

 

perfect microsatellites (SSRs)の検索は左端のSSRsボタンをクリックする。

GRCh38のchr20検索結果。

f:id:kazumaxneo:20180401002738j:plain

 

その隣のをクリックすれば、パラメータ変更が可能になっている。

f:id:kazumaxneo:20180401001359j:plain

パラメータ変更画面。

f:id:kazumaxneo:20180401001404j:plain

 

compound SSRs

f:id:kazumaxneo:20180401003249j:plain

 

imperfect SSRs

f:id:kazumaxneo:20180401003331j:plain

 

A variable number tandem repeat (VNTR

f:id:kazumaxneo:20180401003642j:plain

 

Locateボタンでは、検出された部位がgene内のUTRか、exonかなどを色分けできる。使用するには、リファレンスのgtfファイルを指定する。

解析後のSSRs一覧。色がついている。色はLocateから確認できる。

f:id:kazumaxneo:20180401013808j:plain

 

Primerボタンでは、PCR増幅するためのprimerを設計できる。SSRs解析で見つかった1のSSRのprimerを設計する。1にチェックをつける。

f:id:kazumaxneo:20180401004653j:plain

 PrimerをクリックするとPrimerが設計される。

f:id:kazumaxneo:20180401004557j:plain

 

検索結果のまとめのレポートを作成するには、Statisticsをクリックする。

f:id:kazumaxneo:20180401004057j:plain

f:id:kazumaxneo:20180401004059j:plain

f:id:kazumaxneo:20180401004102j:plain

f:id:kazumaxneo:20180401004104j:plain

f:id:kazumaxneo:20180401004107j:plain

このように解析が終わったデータ分が表示される。 

 

引用

Krait: an ultrafast tool for genome-wide survey of microsatellites and primer design.

Du L, Zhang C, Liu Q, Zhang X, Yue B, Hancock J

Bioinformatics. 2018 Feb 15;34(4):681-683.