macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

2017-03-27から1日間の記事一覧

RNA seq 其の2 マッピングから統計処理まで

基本的な流れは以下のリンクが参考になる。 github.com 今回はSRAに登録されているクラミドモナスのtime courseデータを使う。クラミドモナスはEnsemblにドラフトだがfastaもgtfも登録されているので非モデル生物より解析は楽になる。 クラミドモナスゲノム…

RNA seq 其の1 クオリティチェック

追記 1、クオリティチェック 変なリードが混じっていると、本来シーケンスされた領域以外の遺伝子にマッピングされたりして解析結果を歪める恐れがある。そのため、シーケンスが終わりBCLからfastqデータが出力されたら、一度クオリティをチェックする。 ク…

CIRCOS トレーニング2

バクテリアのアセンブルデータをCIRCOSで描画してみる。 最初に、ゲノムサイズが小さいのでメモリのサイズを小さくする必要がある。main.confファイルの中のchromosomes_unitsを10万に変更。 chromosomes_units = 100000 main.confファイルの内容は以下の通…

CIRCOS トレーニング

circosは多様な機能を備えたゲノムのビジュアル化ツールである。類似ソフトにDNA plotter、genome diagram、snap geneなどがあるが、機能の豊富さではcircosが抜きん出てる。circos独自の機能として、遺伝子の相関や相同性を線で表現してlinkageを表す機能が…

large indel(structural variation)の検出ツール

2017 10/18 PindelとPlatypusのフローを修正。 2018 2/3 brew tap 修正 2018 8/8 freebayes、lumpyの誤りを修正。 2018 9/8 誤字修正。 2018 10/23 lumpyの流れを見やすく修正。 2019 6/13 インストール追記 2019 7/1 lumpy -svのdockerイメージリンク追加 2…