Transposable Element MOnitoring with LOng-reads(TrEMOLO)は、アセンブリベースとマッピングベースのアプローチを組み合わせた新しいソフトウェアで、トランスポーザブルエレメント(TE)と呼ばれる遺伝要素を強固に検出することができる。TrEMOLOは、高品質のゲノムアセンブリまたは低品質のゲノムアセンブリからほとんどのTEの挿入と欠失を検出し、集団におけるその対立遺伝子頻度を推定することができる。シミュレーションデータを用いたベンチマークでは、TrEMOLOが他の最先端の計算ツールを凌駕することが明らかになった。TrEMOLOによるTE検出と頻度推定は、シミュレーションと実験データセットを用いて検証された。したがって、TrEMOLOは、TEダイナミクスを正確に研究するための包括的で適切なツールである。TrEMOLOはGNU GPL3.0のもと、https://github.com/DrosophilaGenomeEvolution/TrEMOLO で利用できる。
インストール
依存
For both approaches
- Python 3.6+
For Global variation tool
- BLAST 2.2+
- Bedtools 2.27.1 v2
- Assemblytics or
- RaGOO
For Populational variation tool
- Snakemake 5.5.2+
- Minimap2 2.24+
- Samtools 1.9 and (1.15.1 optional)
- svim 1.4.2
- Sniffles 1.0.12
- Python libs
- Biopython
- Pandas
- Numpy 1.21.2
- pylab
- intervaltree
- pysam
- Perl v5.26.2+
For report
- R 3.3+ libs
- knitr 1.38
- rmarkdown 2.13
- bookdown 0.25
- viridis 0.6.2
- viridisLite 0.4.0
- rjson 0.2.20
- ggthemes 4.2.4
- forcats 0.5.1
- reshape2 1.4.4
- dplyr 1.0.8
- kableExtra 1.3.4
- extrafont 0.17
- ggplot2 3.3.5
- RColorBrewer 1.1-2
- stringr 1.4.0
- stringi 1.7.6
- pandoc-citeproc 0.17
Others
- nodejs
git clone https://github.com/DrosophilaGenomeEvolution/TrEMOLO.git
cd TrEMOLO/
sudo singularity build TrEMOLO.simg Singularity
テストラン
singularity exec TrEMOLO.simg snakemake --snakefile TrEMOLO/run.snk --configfile TrEMOLO/test/tmp_config.yml
実際に使う場合、config.ymlにゲノムやロングリード、TEデータベースのパスを記載する。
引用
TrEMOLO: accurate transposable element allele frequency estimation using long-read sequencing data combining assembly and mapping-based approaches
Mourdas Mohamed, François Sabot, Marion Varoqui, Bruno Mugat, Katell Audouin, Alain Pélisson, Anna-Sophie Fiston-Lavier & Séverine Chambeyron
Genome Biology volume 24, Article number: 63 (2023)