macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

summary

FASTA/FASTQの操作ツール

情報が増えてきたので、これまで紹介してきたfasta、fastqの分析、変換(圧縮)、修復ツールをまとめておく。 アダプタートリミング trimming / preprocessing カテゴリー seqkit fastq / fastaの操作ツール seqkit seqtk fastq / fastaの操作ツール seqtk B…

de novo transcriptome 解析を行うためのRNAのアセンブルツール

RNAの発現は分子によって大きな差があるため、どのようなデータセットでも万能なRNAのアセンブルツールというのは存在しない。そのため単一のアセンブルツールでアセンブルするより、複数のアセンブルツールでかつ複数のk-merサイズでアセンブルして、そのプ…

NCBIで全データを一度にblast解析し、得られたリストをEntrez Directでアノテーションに変換する。

複数の配列のblast解析を行う場合、ローカルでデータベースなどを構築して進めるのが一つの手である。しかしローカルだとデータベースの更新や、データサイズが問題になる(例えばnrのデータも2015年にダウンロードすると200GBを超えていた)。 ネットワーク…

ショートリードのアセンブルツール

これまでNGSデータをアセンブル様々なアセンブルやツールが発表されてきた。例えばOMICs toolでhitするツールは121ある(https://omictools.com/genome-assembly-category)。ショートリードに限定すると数は減るが、それでも膨大な数である。全てを整理しき…

sam/bamファイルを変換、編集したり分析するためのツール

samとbamのハンドリングに関するツールを紹介する。brewでツールをインストールするので、はじめにbrew tap でsiience系のコマンドをオフィシャルコマンドとしてインストールできるようにしておく。 brew tap brewsci/science #2/25リンク修正 追記 --2017--…

large indelの検出ツール

バクテリアゲノムを使い、構造変化検出ツールのパフォーマンスを比較したペーパーが出ている。 The challenge of detecting indels in bacterial genomes from short-read sequencing data 実際に導入して、パフォーマンスを比較してみる。 2017 10/18 Pinde…