macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

LAIスコアによる連続性の高い植物・藻類ゲノムアセンブリの品質比較を行うサイト PlantLAI

 

 近年のゲノム解読の進歩により、解読されたゲノム数は増加している。しかし、反復配列の存在は植物ゲノムのアセンブリを複雑にしている。LTRアセンブリインデックス(LAI)は、LAIが高いほどアセンブリの質が高いことを意味することから、近年、ゲノムアセンブリの質を評価するために広く用いられている。ここでは、植物および藻類1664ゲノムのアセンブリゲノムの品質をLAIを用いて評価し、PlantLAI(https://bioinformatics.um6p.ma/PlantLAI)というデータリポジトリとして報告した。全長988.11Gbpの55 117  586のpseudomolecules/scaffoldsをLAIワークフローを用いて調べた。合計46 583 551個の正確なLTR-RTが発見され、その中には2 263 188個のCopia、2 933 052個のGypsy、1 387 311個の未知のスーパーファミリーが含まれていた。その結果、LAIの計算に適した植物ゲノムは1136個にとどまり、その値は0から31.59の範囲であった。品質分類システムに基づき、476の2倍体ゲノムをドラフトゲノム、472をリファレンスゲノム、135をゴールドゲノムに分類した。また、新たにアセンブルされたゲノムのLAIを計算するためのウェブツールと、結果をリポジトリに保存する機能を無料で提供している。データリポジトリは、既存のゲノムのLAI報告におけるギャップを埋めるために設計されており、一方、ウェブツールは、研究者が新しく配列決定したゲノムのLAIを計算するのに役立つように設計されている。

 

webサービス

https://bioinformatics.um6p.ma/PlantLAI/にアクセスする。

 

種を選択する。

 

染色体1つか全ゲノムかを選ぶ。

出力例

IDや染色体名、サイズなどのほかにIntact LTR、Total LTR、Raw LAI、LAI Valueが提示された表が出力される。表はCSV形式でダウンロードできる。

Intact LTR-RTは、完全なLTRの該当配列中での割合。LTR_retrieverによって同定される。Total LTRの推定には、LTR_retrieverで生成した非冗長LTR-RTライブラリ(exemplars)を用いて、相同性ベースのRepeatMaskerプログラムでゲノムを検索し、ゲノム内の全アノテーション配列の長さを合計したもののの該当配列中での割合。LTR レトロトランスポゾンの分解により認識できない配列断片が残っている場合には、この推定値の把握が困難な場合がある。raw LAIはIntact LTR element length / Total LTR sequence length) * 100(引用)。

 

 

Statisticsのタブでは収録されている全アセンブリのLAIを閲覧できる。

 

Diploid、chartビューに変更。

 

ゲノムアセンブリの数は少ないが、藻類も収録されている。

 

Data Sourceタブではアセンブリの一次ソースへのリンクがある。

Downloadタブでは、各ゲノムアセンブリのLTR-RTsアノテーションのGFFやLAIファイルなどをダウンロードできる。

 

LAIパイプラインタブでは、手持ちの植物/藻類ゲノムアセンブリをアップロードしてLAIスコアを計算できる。

(マニュアルより;解析にかかる時間は、実行中のジョブの数によって異なりますが、30~60分です。同時に4つ以上のジョブが実行されている場合、実行中のジョブ数が4つ未満であれば、新しいジョブがクエリーに含まれ、自動的に開始されます。)

 

 

論文より

  • ロングリードシークエンシング技術の向上により、近年、植物ゲノムの繰り返し領域の完全なカバレッジが著しく向上している。その結果、BUSCOなどは飽和値に達していて、リピートを含めたゲノムの完全性を評価するには不十分となっている。LAIは、繰り返しも含めて組み立てられている植物ゲノムアセンブリを解析するための効率的な指標である。
  • LTR Assembly Index (LAI)は、インタクトなLTRレトロトランスポゾン(LTR-RT)配列の割合を計算することで、より反復性の高いゲノム領域におけるゲノムの完全性を推定する。

引用

A large-scale assessment of the quality of plant genome assemblies using the LTR assembly index
Morad M Mokhtar, Haytham M Abd-Elhalim, and Achraf El Allali

AoB Plants. 2023 Jun; 15(3)

 

Assessing genome assembly quality using the LTR Assembly Index (LAI)

Shujun Ou, Jinfeng Chen, Ning Jiang

Nucleic Acids Res. 2018 Nov 30;46(21) 

 

関連

https://kazumaxneo.hatenablog.com/entry/2020/11/07/165013

 

https://kazumaxneo.hatenablog.com/entry/2019/10/19/073000

 

https://kazumaxneo.hatenablog.com/entry/2020/11/06/073000

 

https://kazumaxneo.hatenablog.com/entry/2020/03/24/073000