macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

2017-06-28から1日間の記事一覧

フォーマット変換 GenBank => FASTA

2020 6/4 構成を変更 1、EMBOSSのseqretコマンドを使う(インストール)。 ゲノムのGenbankファイルを読み込んでfasta出力する。複数配列あるならmulti fasta出力される。 seqret input.gbk out.fasta 正規表現をサポートしているので、うまくワイルドカー…

Reference-assisted assembly 2 RACA

RACA Reference-assisted assembly を行うツール。解析にはリファレンスとアウトグループが必要である。 論文では、RACAを使いGAGEのゴールデンデータセットをアセンブルしたデータや、Tibetan antelope(ウシ科のチルー)のアセンブルデータが使われている…

Reference-assisted assembly1 ragout

small genomeとlarge genomeいずれにも使えるツール。2014年に発表された(ref.1)。複数の近縁ゲノムを使うことで、アセンブル精度を高めたとされる。公式ページには、現在レビュアー審査中の論文では哺乳類のクロモソームを再構成できると記載されている(…