Reference-assisted assembly
次世代のシーケンシングの進歩により、膨大な量のショートリードが生成されている。しかしながら、ショートリードからゲノム配列を組み立てることは依然として困難な作業である。ゲノム中の大きなリピートのために、通常、現在のアセンブリツールの多くはシ…
リファレンスを足場として使い、コンティグからドラフトゲノムを構築するツールがいくつか提案されているが、ターゲットと参照するゲノムとの間に再編成が起きていたり、系統関係が遠いと誤ったスキャッホールドを生成する可能性がある。これは、単一のリフ…
CARは、近縁な生物のゲノムに基づいて、原核生物のゲノムのコンティグを精度よく並べ換えるアセンブリツール。論文中では、様々なリアルデータのコンティグと系統学的に近縁さが異なる20のゲノムを使い、正解と謝りの割合を調べており、競合ツールよりパフォ…
ゲノムガイドのRNAのアセンブル法は、遺伝子アノテーション情報を使わず、RNA-Seqデータから転写物の再構成を行う方法である。 Strawberryは ゲノムガイドのアセンブリと定量の2つのモジュールで構成されており、ゲノムガイドのアセンブルではbamをスプライ…
2020 2/5 condaインストール追記 Scallopは、リファンレンスガイドのトランスクリプトのアセンブルツール。 マルチエキソンの転写物や低発現の転写物を組み立てる際の高い精度を特徴とする。ヒトRNA-seqサンプルでは、ScallopはStringTieおよびTransCombより…
非モデル生物のDe novo RNA seq解析は断片化したRNAしかできないので、DEG解析が困難となる。BRANCHはそういった不完全なRNAに対して使う方法論で、近縁種のゲノム、またはcontigの情報をRNAのガイドとして利用し、アセンブルの精度を高める方法論。ゲノムの…
2018 8/31 タイトルと紹介文修正、11/5 タイトル修正 2019 1/11 追記、3/3ラストにnanopore long read追記、4/12 ラストにpacbio long read追記、6/12 リンク追記、6/27 merged.fq追記、7/15 追記、9/29 追記、10/28インストール追記 2021 2/28 関連論文追記…
StringTieはゲノムガイドのRNAアセンブリツール。cufflinksよりアセンブリ精度が高く、解析時間も短いと言われている。2015年にNature Biotechnologyに論文が発表された。 インストール Github https://github.com/gpertea/stringtie brewで導入可能。 マニ…
AlignGraphは、よく似たゲノム配列を使いcontigを伸ばしたり繋いでくれるツール。よく似たゲノム配列が存在するとき、アセンブリして作ったcontigやscaffoldsをさらに伸ばすために使われたりする。 インストール 依存 Bowtie2 BLAT PBLAT (http://icebert.gi…
ABACASはサンガー研の開発したReference-assisted assemblyなアセンブル法である。2009年に論文が発表された。サンガー研のACTやMummerの機能と連携しており、ランと結果の分析にはこの2つがインストールされている必要がある。その他の特徴として、primer3…
RACA Reference-assisted assembly を行うツール。解析にはリファレンスとアウトグループが必要である。 論文では、RACAを使いGAGEのゴールデンデータセットをアセンブルしたデータや、Tibetan antelope(ウシ科のチルー)のアセンブルデータが使われている…
small genomeとlarge genomeいずれにも使えるツール。2014年に発表された(ref.1)。複数の近縁ゲノムを使うことで、アセンブル精度を高めたとされる。公式ページには、現在レビュアー審査中の論文では哺乳類のクロモソームを再構成できると記載されている(…