macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

シーケンスクオリティを絵文字で表す fastqe

そのままのツールです。ツイッターで教えてもらいました。

 

インストール

mac os 10.13のpython3.4でテストした(pyton2環境でも多分動きます)。

依存

  • pyemojify
  • BioPython
  • NumPy

pipで必要なライブラリを入れておく。

pip install pyemojify numpy Biopython

本体 Github

 

ラン

実行するにはfastqファイルを引数で指定する(iIllumina 1.8+/Sanger format)。

python input.fq

 

InSilicoSeq(リンク)を使い発生させたリードを分析してみる。

#ランダムにバクテリアゲノムを1つダウンロードしてリードを発生
iss generate --ncbi bacteria -u 1 --model NovaSeq --output ncbi_reads -p 8

分析実行

python fastqe.py ncbi_reads_R1.fastq 

python fastqe.py ncbi_reads_R1.fastq 

🙀🙀🙀🙀🙀😬😬🙈🙈🙈🙈🙈🙈🙈🙈🙈🙈🙈🙈🙈🙈🙈🙈🙈🙈🙈😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😿😿😿😿😿😿😿😿😿😿😿😿😿😿😿😿😿😿😿😿😿😿😿🙅

対応絵文字はコードから確認して下さい(リンク)。

同じデータをfastqcでも分析。

> fastqc #GUI起動

f:id:kazumaxneo:20180726190026p:plain

NovaSeqのクオリティはかなり良好ですね。

 

ちょっとしたジョークアプリだと思いますが、真剣に導入したくなりました😬😬😬

引用

https://github.com/lonsbio/fastqe