macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

遺伝子融合イベントのアノテーションと視覚化を行う AGFusion

 

 遺伝子融合(wiki)は、構造的染色体再編成の結果であり、関与する遺伝子にさまざまな機能的変化を引き起こす可能性がある。多くの場合、遺伝子融合によりキメラタンパク質が生成され、それによりタンパク質ドメインが組み合わされて新規機能が生成される。遺伝子融合は、プロモーターエレメントや3 'または5' UTRなどの調節領域のリアレンジメントを引き起こす可能性もあり、それにより、関与する遺伝子の発現が変化する。次世代シーケンシングの出現により、多くの異なるタイプのガンにおける遺伝子融合の多数の異質な数が明らかになってきた。多くの融合の機能的役割は解明されているが、特定のガンは多様な遺伝子融合を示しており、腫瘍または治療抵抗性の促進におけるその機能と役割を理解することが重要である。多くの遺伝子融合は治療的に標的化が可能であり、精密医療において成長する役割を果たす可能性が高いため、これは重要である。
遺伝子融合の視覚化のためのソフトウェアパッケージがいくつかあり、それぞれが遺伝子融合に関する特定の情報の表示に特化している。

(中略)

著者らの知る限り、DNA、RNA、およびタンパク質配列を予測するだけでなく、遺伝子アイソフォームの組み合わせの複雑さを考慮しながら融合イベントを結果の遺伝子のタンパク質ドメインアーキテクチャに注釈を付けて視覚化する完全に統合されたソフトウェアはない。このギャップに対処するために、非計算ユーザー向けのWebツールとしてのAGFusionと、計算パイプラインに簡単に統合できるPythonパッケージを開発した。
AGFusionの基本的な使用法として、入力として5 'および3'遺伝子パートナーとそれらの予測される接合部の位置が必要とする。現在、AGFusionは、ヒトゲノムアセンブリGRCh38およびGRCh37およびマウスゲノムアセンブリGRCm38の座標内にある遺伝子融合の入力のみを許可している。ユーザーは、Ensembl遺伝子ID、またはヒトまたはマウスのゲノムのHGNC遺伝子記号またはMGI遺伝子記号をそれぞれ入力できる。 AGFusionは、すべての遺伝子アイソフォームの組み合わせに対する遺伝子融合の効果を予測する。予測された完全長cDNA配列を出力でき、融合がタンパク質産物を生成する場合、CDSおよびタンパク質配列が予測され、Pfamドメインで注釈が付けられる。その後、タンパク質ドメインアーキテクチャの出版品質の図を保存できる。

 

Documentation

https://pythonhosted.org/agfusion/

 

web版

https://www.agfusion.app/

 

インストール

macos10.14でmambaを使ってテストした。

依存

  • python 2.7, 3.5
  • matplotlib>=1.5.0
  • pandas>=0.18.1
  • biopython>=1.67
  • future>=0.16.0
  • pyensembl>=1.1.0

本体 Github

#bioconda(link)
mamba create -n agfusion -y python=2.7
conda activate agfusion
mamba install -c bioconda -y agfusion

agfusion

$ agfusion -h

usage: agfusion [-h] [-v] {annotate,batch,download,build} ...

 

Annotate Gene Fusion (AGFusion)

 

positional arguments:

  {annotate,batch,download,build}

                        AGFusion programs.

    annotate            Annotate and visualize a single fusion.

    batch               Annotate fusions from an output file from a fusion

                        finding algorithm.

    download            Download database for a reference genome.

    build               Build database for a reference genome.

 

optional arguments:

  -h, --help            show this help message and exit

  -v, --version         show program's version number and exit

 

 

データベースの準備

pyensemblを使ってEnsemblからダウンロードする(link)。

#step1 donwload genome
#GRCh38/hg38
pyensembl install --species homo_sapiens --release 95
#GRCh37/hg19
pyensembl install --species homo_sapiens --release 75
#GRCm38/mm10
pyensembl install --species mus_musculus --release 87

#step2 donwload AGFusion database
#GRCh38/hg38
agfusion download -g hg38
#GRCh37/hg19
agfusion download -g hg19
#GRCm38/mm10
agfusion download -g mm10

 

実行方法

2つの融合遺伝子パートナー(遺伝子シンボル、Ensembl ID、またはEntrez gene ID)、ゲノム座標で予測される融合ジャンクション、およびゲノムビルドを提供する。

agfusion annotate \
--gene5prime DLG1 \
--gene3prime BRAF \
--junction5prime 31684294 \
--junction3prime 39648486 \
-db agfusion.mus_musculus.87.db \
-o DLG1-BRAF

 

 

引用

AGFusion: annotate and visualize gene fusions

Charlie Murphy, Olivier Elemento

bioRxiv preprint first posted online Oct. 14, 2016

 

関連