macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2017-08-24から1日間の記事一覧

fastqの操作ツール illumina-utils

illumina-utilsはpythonで記述されたilluminaのシーケンスデータのユーティリティツール。オーバーラップしたペアリードのmergeやクオリティフィルタリングを行うことができる。 インストール Github sudo pip install illumina-utils 実行方法 raw fastqのd…

複数のトランスクリプトーム解析からコア遺伝子を探索するGET_HOMOLOGUES-EST

2018 9/27 引用の誤り修正 2020 4/13 インストール手順とヘルプ追記, タイトル修正 2020 4/14 インストール手順修正 2020 5/27 タイトル修正 種のパンゲノムとは、その種のすべての個体に見られるすべての遺伝子とノンコーディング配列の集合体と定義される…

BLASTとコンパチブルで高速なホモロジー検索ツール Diamond

2019 1/20 help追加 、コマンド追記 2019 6/9 -コマンド例から-max-target-seqs削除 2019 7/19 追記 Diamondはindexのつけ方を工夫することでBLASTXの解析速度を加速できるツール。blastと同等の機能を持つが、論文ではblastより最大20000倍高速化できると主…

SSU rRNAを素早く検出する Barrnap

2019 3/10 タイトル修正 2019 5/30 インストール方法追記 2020 6/15 コマンド修正, help追記 2020 6/29 例追記 BarrnapはrRNAをゲノムから探すツール。 検索対象 bacteria (5S,23S,16S) archaea (5S,5.8S,23S,16S) mitochondria (12S,16S) eukaryotes (5S,5.…

高速なRNA seqのマッピングツール STAR

2019 2/15 動画とbiocondaによる install追加 2020 7/6 コメントとhelp追加 STARは高速なRNAのアライメントツール。intron-exonのsplit-alingmentに対応している。動作はbowtie2より10倍以上高速とされ、マッピング感度の高さとエラー率の低さは既存のツー…

RNA seqのリードカウント HTSeq-count

2020 8/15 condaによるインストールとhelp追記 HTSeqはNGSデータの各種ハンドリングができるツール。ここではその1つhtseq-countコマンドを紹介する。htseq-countはリードのアライメントデータからカウントデータを出力するために使う。htseq-countを使うと…

クオリティトリミングツール sickle

sickleはfastqのクオリティトリミングツール。リード長の0.1倍のウィンドウサイズでリードを分析し、指定値以下のクオリティになった領域をトリムする。Trimmomaticと同様、ペアリードの順番が破壊されないよう、ペアの数を同じに揃えて出力できる(orphanな…