macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

2017-08-24から1日間の記事一覧

fastqの操作ツール illumina-utils

illumina-utilsはpythonで記述されたilluminaのシーケンスデータのユーティリティツール。オーバーラップしたペアリードのmergeやクオリティフィルタリングを行うことができる。 インストール Github sudo pip install illumina-utils 実行方法 raw fastqのd…

RNAのクラスタリングを行う GET_HOMOLOGUES-EST

2018 9/27 引用の誤り修正 GET_HOMOLOGUES-ESTは似た配列をクラスタリングできるツールで、GET_HOMOLOGUESのforkとして開発された。植物のRNAやcDNAをターゲットにしており、塩基の相同性をBLASTNで調べ、その結果をクラスタリングして出力する。またPan-gen…

BLASTとコンパチブルで高速なホモロジー検索ツール Diamond

Diamondはindexのつけ方を工夫することでBLASTXの解析速度を加速できるツール。blastと同等の機能を持つが、論文ではblastより最大20000倍高速化できると主張されている。特にクエリー配列が非常に多い場合に高速とされる。2015年にnature methodsに論文が発…

rRNAを検出するツール Barrnap

BarrnapはrRNAをゲノムから探すツール。 検索対象 bacteria (5S,23S,16S) archaea (5S,5.8S,23S,16S) mitochondria (12S,16S) eukaryotes (5S,5.8S,28S,18S) インストール 本体 Github brewで導入できる。 brew install barrnap ラン barrnap genome.fa > ou…

高速なRNA seqのマッピングツール STAR

STARは高速なRNAのアライメントツール。intron-exonのsplit-alingmentに対応している。動作はbowtie2より10倍以上高速とされ、マッピング感度の高さとエラー率の低さは既存のツールと同等とされている。 github https://github.com/alexdobin/STAR マニュ…

RNA seqのリードカウント HTSeq-count

HTSeqはNGSデータの各種ハンドリングができるツール。ここではその1つhtseq-countコマンドを紹介する。htseq-countはリードのアライメントデータからカウントデータを出力するために使う。htseq-countを使うと、bamから数分でカウントデータを得ることがで…

クオリティトリミングツール sickle

sickleはfastqのクオリティトリミングツール。リード長の0.1倍のウィンドウサイズでリードを分析し、指定値以下のクオリティになった領域をトリムする。Trimmomaticと同様、ペアリードの順番が破壊されないよう、ペアの数を同じに揃えて出力できる(orphanな…