macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

contigのscaffolding

アセンブルのギャップクローズを支援する GapBlaster

GapBlasterは、ゲノムのアセンブリで得られたコンティグを用いて、NNNで繋がったスキャフォールドのクローズを支援するjavaのツール。GUIで動作する。アセンブリで得られたコンティグをblast+/legacy blast/mummerの新井面ツールでスキャホールドにアライメ…

複数のアセンブラのコンティグをマージする Metassembler

2019 6/10 追記 2019 6/11 関連ツール追記 ゲノムアセンブリプロジェクトでは、通常、単一の最良のアセンブリを見つけるために複数のアルゴリズムを実行するが、それらのアセンブリには、未開発の場合は補完的な長所と短所がある。 本著者らは、ゲノムの複数…

複数のアセンブラのコンティグをマージする GAM-NGS

GAGEのペーパーでも議論されているが、生き物をと言わず常にベストな結果を出すアセンブラと言うのは現状存在しない。アセンブルを改善するため、複数のアセンブル結果をマージしてアセンブル結果を強化するポストアセンブルのツールがいくつか発表されてき…

リファンレンスガイドのトランスクリプトのアセンブリツール Scallop

2020 2/5 condaインストール追記 Scallopは、リファンレンスガイドのトランスクリプトのアセンブルツール。 マルチエキソンの転写物や低発現の転写物を組み立てる際の高い精度を特徴とする。ヒトRNA-seqサンプルでは、ScallopはStringTieおよびTransCombより…

リファレンスゲノム情報を使ってcontigをソートし、ギャップクローズのPCRプライマーを自動設計するProjector 2

Projector 2はリファンレンスのゲノムを使い、de novo assemblyで作ったcontigをconcatenateして、さらに隣接したcontigを跨ぐ特異的なプライマーを自動設計して、Finishingを助けるツール。contigの接続の指標となる参照するゲノムはドラフトでも使える。リ…

アセンブル結果の分析およびマージを行う CAMSA

2019 6/11 インストール追記、タイトル修正 ドライの計算技術およびウエット実験技術を利用して、ドラフトゲノムからゲノムを再構築する様々な方法が存在するが、それらはアセンブリの一部のみを生成する。したがって、異なる方法によって作製されたアセンブ…

アセンブリのエラーやギャップ(NNN)を検出し、ポリッシュしたFASTAを出力するPilon

2018 8/31 タイトルと紹介文修正、11/5 タイトル修正 2019 1/11 追記、3/3ラストにnanopore long read追記、4/12 ラストにpacbio long read追記、6/12 リンク追記、6/27 merged.fq追記、7/15 追記、9/29 追記、10/28インストール追記 2021 2/28 関連論文追記…

複数のcontigをマージしアセンブリの連続性を改善する Mix

2019 6/11 追記 ゲノムアセンブリ構築の利点を得ることを妨げる課題の中には、未完成のアセンブリおよびその後の実験的な費用の両方がある。第一に、ゲノムデノボアセンブリのための多数のソフトウェアソリューションが利用可能であり、それぞれがその長所と…

Reference-assisted assembly4 AlignGraph

AlignGraphは、よく似たゲノム配列を使いcontigを伸ばしたり繋いでくれるツール。よく似たゲノム配列が存在するとき、アセンブリして作ったcontigやscaffoldsをさらに伸ばすために使われたりする。 インストール 依存 Bowtie2 BLAT PBLAT (http://icebert.gi…

Reference-assisted assembly3 ABACAS

ABACASはサンガー研の開発したReference-assisted assemblyなアセンブル法である。2009年に論文が発表された。サンガー研のACTやMummerの機能と連携しており、ランと結果の分析にはこの2つがインストールされている必要がある。その他の特徴として、primer3…

Reference-assisted assembly 2 RACA

RACA Reference-assisted assembly を行うツール。解析にはリファレンスとアウトグループが必要である。 論文では、RACAを使いGAGEのゴールデンデータセットをアセンブルしたデータや、Tibetan antelope(ウシ科のチルー)のアセンブルデータが使われている…

Reference-assisted assembly1 ragout

small genomeとlarge genomeいずれにも使えるツール。2014年に発表された(ref.1)。複数の近縁ゲノムを使うことで、アセンブル精度を高めたとされる。公式ページには、現在レビュアー審査中の論文では哺乳類のクロモソームを再構成できると記載されている(…