macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

ロングリードシーケンスデータを用いてトランスポーザブルエレメントのアレル頻度推定を行うTrEMOLO

 

 Transposable Element MOnitoring with LOng-reads(TrEMOLO)は、アセンブリベースとマッピングベースのアプローチを組み合わせた新しいソフトウェアで、トランスポーザブルエレメント(TE)と呼ばれる遺伝要素を強固に検出することができる。TrEMOLOは、高品質のゲノムアセンブリまたは低品質のゲノムアセンブリからほとんどのTEの挿入と欠失を検出し、集団におけるその対立遺伝子頻度を推定することができる。シミュレーションデータを用いたベンチマークでは、TrEMOLOが他の最先端の計算ツールを凌駕することが明らかになった。TrEMOLOによるTE検出と頻度推定は、シミュレーションと実験データセットを用いて検証された。したがって、TrEMOLOは、TEダイナミクスを正確に研究するための包括的で適切なツールである。TrEMOLOはGNU GPL3.0のもと、https://github.com/DrosophilaGenomeEvolution/TrEMOLO で利用できる。 

 

インストール

依存

For both approaches

For Global variation tool

  • BLAST 2.2+
  • Bedtools 2.27.1 v2
  • Assemblytics or
  • RaGOO

For Populational variation tool

  • Snakemake 5.5.2+
  • Minimap2 2.24+
  • Samtools 1.9 and (1.15.1 optional)
  • svim 1.4.2
  • Sniffles 1.0.12
  • Python libs
  • Biopython
  • Pandas
  • Numpy 1.21.2
  • pylab
  • intervaltree
  • pysam
  • Perl v5.26.2+

For report

  • R 3.3+ libs
  • knitr 1.38
  • rmarkdown 2.13
  • bookdown 0.25
  • viridis 0.6.2
  • viridisLite 0.4.0
  • rjson 0.2.20
  • ggthemes 4.2.4
  • forcats 0.5.1
  • reshape2 1.4.4
  • dplyr 1.0.8
  • kableExtra 1.3.4
  • extrafont 0.17
  • ggplot2 3.3.5
  • RColorBrewer 1.1-2
  • stringr 1.4.0
  • stringi 1.7.6
  • pandoc-citeproc 0.17

Others

  • nodejs

Github

git clone https://github.com/DrosophilaGenomeEvolution/TrEMOLO.git
cd TrEMOLO/
sudo singularity build TrEMOLO.simg Singularity

 

 

テストラン

singularity exec TrEMOLO.simg snakemake --snakefile TrEMOLO/run.snk --configfile TrEMOLO/test/tmp_config.yml

実際に使う場合、config.ymlにゲノムやロングリード、TEデータベースのパスを記載する。

 

 

 

引用

TrEMOLO: accurate transposable element allele frequency estimation using long-read sequencing data combining assembly and mapping-based approaches
Mourdas Mohamed, François Sabot, Marion Varoqui, Bruno Mugat, Katell Audouin, Alain Pélisson, Anna-Sophie Fiston-Lavier & Séverine Chambeyron 
Genome Biology volume 24, Article number: 63 (2023)