macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

2017-08-24から1日間の記事一覧

fastqの操作ツール illumina-utils

illumina-utilsはpythonで記述されたilluminaのシーケンスデータのユーティリティツール。オーバーラップしたペアリードのmergeやクオリティフィルタリングを行うことができる。 インストール Github sudo pip install illumina-utils 実行方法 raw fastqのd…

RNAのクラスタリングを行う GET_HOMOLOGUES-EST

2018 9/27 引用の誤り修正 GET_HOMOLOGUES-ESTは似た配列をクラスタリングできるツールで、GET_HOMOLOGUESのforkとして開発された。植物のRNAやcDNAをターゲットにしており、塩基の相同性をBLASTNで調べ、その結果をクラスタリングして出力する。またPan-gen…

BLASTとコンパチブルで高速なホモロジー検索ツール Diamond

2019 1/20 help追加 、コマンド追記 Diamondはindexのつけ方を工夫することでBLASTXの解析速度を加速できるツール。blastと同等の機能を持つが、論文ではblastより最大20000倍高速化できると主張されている。特にクエリー配列が非常に多い場合に高速とされる…

rRNAを素早く検出する Barrnap

2019 3/10 タイトル修正 BarrnapはrRNAをゲノムから探すツール。 検索対象 bacteria (5S,23S,16S) archaea (5S,5.8S,23S,16S) mitochondria (12S,16S) eukaryotes (5S,5.8S,28S,18S) インストール 本体 Github brewで導入できる。 brew install barrnap ラン…

高速なRNA seqのマッピングツール STAR

2019 2/15 動画とbiocondaによる install追加 STARは高速なRNAのアライメントツール。intron-exonのsplit-alingmentに対応している。動作はbowtie2より10倍以上高速とされ、マッピング感度の高さとエラー率の低さは既存のツールと同等とされている。 githu…

RNA seqのリードカウント HTSeq-count

HTSeqはNGSデータの各種ハンドリングができるツール。ここではその1つhtseq-countコマンドを紹介する。htseq-countはリードのアライメントデータからカウントデータを出力するために使う。htseq-countを使うと、bamから数分でカウントデータを得ることがで…

クオリティトリミングツール sickle

sickleはfastqのクオリティトリミングツール。リード長の0.1倍のウィンドウサイズでリードを分析し、指定値以下のクオリティになった領域をトリムする。Trimmomaticと同様、ペアリードの順番が破壊されないよう、ペアの数を同じに揃えて出力できる(orphanな…