ウイルスintegration部位の同定は、特定のウイルス感染に関連する疾患の病因および進行を理解する上で重要であるが、ウイルス - ホストjunction部位のNGSデータを解析するための現在の計算方法は、アクセス可能性の点で制限されている。たとえば、現在入手可能なプログラムのほとんどは、コマンドライン引数とLinuxベースの知識を必要とするため、Linuxのディストリビューションに精通していないMacユーザーや生物学者のアクセシビリティが制限されている。
ChimericSeqは、WGS、RNA-seq、およびtargeted sequencingを含むNGSデータから2生物間のキメラjunction配列を同定できるツールとして開発された。WindowsとMacの両方のオペレーティングシステムとの互換性を備えたグラフィカルユーザーインターフェイスを提供する最初のプログラムである。見つかったウイルスintegration部位の配列の位置および方向の情報、melting temperature (Tm) の分析、遺伝子情報および相同性分析を提供する。
インストール
pyenvでanaconda3-4.2.0環境に切り替えて動作を確認した。
本体(JBS ChimericSeq™ Software)の他、テストデータとリファレンスをJBS SCIENCE社(リンク)のHPからダウンロードできる。
http://www.jbs-science.com/ChimericSeq.php
ダウンロードしたzipファイルを解凍して内部で以下のように打つ。
python ChimericSeq.py
sudo chmod -R 0777 ./ChimericSeq_Mac
sudo chmod a+x ./ChimericSeq_Mac/JBS_ChimericSeq.tool
本体を叩いて起動する。
ラン
テストデータを使ってランしてみる。Options -> Set Locationsを選択。
以下のようにした。Buildボタンを押すことでindexを構築できる。
ウィンドウをそのまま閉じる。
Options -> Configurationsを選択。
変更したいパラメータがあれば変えておく。
解析するfastqを選択する。ペアエンドデータは同時に選択してopenボタンを押す。
認識された。
解析をスタートするにはメインウィンドウ左下のStart Runを押す。
途中でアライメントを行うか聞いてくるので、メインウィンドウ左下のYes No ボタンを押して決定する。解析が終わると指定したフォルダにCSVファイル等ができる。
chromosome名、遺伝子のexon上かどうか、遺伝子のアノテーション、intergenicなら遺伝子までの距離などが記載されている。
引用
ChimericSeq: An open-source, user-friendly interface for analyzing NGS data to identify and characterize viral-host chimeric sequences.
Shieh FS, Jongeneel P, Steffen JD, Lin S, Jain S, Song W, Su YH
PLoS One. 2017 Aug 22;12(8):e0182843.