macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

Long Terminal Repeat retrotransposons (LTR-RTs)

ゲノムアセンブリからLTR-RTを同定する LTR_retriever

2020 11/6 追記 Long terminal repeat retrotransposons (LTR-RT)は植物ゲノムに多く存在する。LTR-RTの同定は、高品質な遺伝子アノテーションを実現するために重要である。しかし、これらのプログラムは特異性が低く、偽発見率が高いという問題があった。こ…

RepeatMasker

RepeatMasker は、DNA 配列をスクリーニングして、散在したリピート配列や、複雑性の低い DNA 配列を検出するプログラムである。プログラムの出力は、クエリ配列に存在するリピートの詳細なアノテーションと、アノテーションされたリピートがすべてマスクさ…

De novoでTEを探索する RepeatModeler2

2020 7/5 ProcessRepeatsのhelp追加 2020 7/6 step3修正 2020 7/7 ProcessRepeatsのコマンドの間違いを修正 Tree of life全体のゲノム配列決定のペースが加速しているため、 transposable elements(TE)のようなゲノム構成要素の教師なしアノテーションを改…

タンデムリピートなどのミスアセンブリを分析する TandemQUAST

タンデムリピートは、不均等なクロスオーバーによってしばしば生成される複数の連続するほぼ同一のシーケンスによって形成される(Smith、1976)。初期のDNAシーケンスプロジェクトで、タンデムリピートが真核生物のゲノムに豊富にあることが明らかになった…

Long terminal repeats retrotransposonsをゲノム配列からde novoで発見する LtrDetector

以前は「ジャンクDNA」と考えられていたゲノムの遺伝子間領域の配列は、生物学者の間でますます注目を集めている。これらの領域の特に顕著な特徴は、一種のリピート配列である転移因子(TE)の普及率である。 TEには、RNAを使用して複製して自分自身を「コピ…