macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2018-01-01から1ヶ月間の記事一覧

ターゲットゲノムにしかない配列を探し出すEAGLE

EAGLEは指定したゲノムにしかない配列を検出するツール。論文では、EAGLEを使い、ヒトゲノムのどこにもない、エボラウィルスからしか見つからない14merの配列を検出している。特定の種のみ存在する配列があれば、ユニークなプライマーを設計したり、RNA干渉…

ゲノムデータの圧縮を行うGeCo

GeCoはゲノム(fasta)の圧縮ツール。高効率な圧縮を行うことができる(ロスレスかどうかは不明)。 公式サイト http://bioinformatics.ua.pt/software/geco/ インストール 本体 Github https://github.com/pratas/geco ダウンロードしてビルドする。 brew i…

固有のindex(バーコード)を設計するTagGD

index (バーコード配列) を設計する際は、判別可能かつ無駄のない適切な長さ、増幅バイアスが起きないようなGC含量、実験データとの干渉がないなどを考える必要がある。それに加えて、index配列に塩基置換、indelなどのシーケンスエラーが起きる可能性がある…

SNVやRNA edittingに適した高精度なRNA seqのアライナー RASER

RNAのシーケンスデータをゲノムにアライメントする場合、イントロンを跨いでリードをアライメントする必要があるため、リードをsplitしてアライメントできるアライナーが使われる(真核生物のRNA seq)。イントロンは数十kbもある可能性があるので、split-al…

Linked readsのシミュレーターLRSIM

Linked readsは、長鎖の単分子DNAをエマルジョンの中に閉じ込めて断片化し、固有のバーコード配列を付加することで、一定の領域内に同じタグ付きのリードを調整する手法。100万くらいの多様なバーコードを持ったライブラリをiiluminaでシーケンスして、バー…

NGSデータ解析マシンのスペックによるデータ解析時間の違い

あけましておめでとうございます。今年もよろしくお願いします。 NGSのデータ解析で時折聞かれるのが、解析マシンのスペックはどれくらいあれば十分かというような質問である。一般的にはメモリリッチで、I/Oが高速で、CPUのマルチスレッドに対応したマシン…