macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

RNAseqの定量

よく似たゲノム情報を使い不完全なゲノム情報しか持たない種のRNA seq解析の精度を上げる自動化されたツール Necklace

2018 10/31、11/2 タイトル、コード等修正、docker追加 シーケンシングされた種の数が増加しているが、ゲノムの大部分は不完全である。それらにはギャップが含まれていても、配置されていない領域が残っていてもよく、アノテーションが不十分な場合もある。…

Kallisto

典型的なRNA-seqの転写産物レベル処理ワークフローの最初の2つのステップは、トランスクリプトーム配列またはリファレンスゲノムへのアラインメントおよび転写産物存在量の推定である。これらのステップには時間がかかることがある。例えば、広く使用されて…

選択的スプライシングを検出する SplAdder

Alternative splicing (AS)(以下、選択的スプライシング)は、成熟mRNAを高度に調節された様式で切断および再結合させ、それによって転写産物の複雑性を増加させるmRNAプロセシング機構である。生物に応じて、発現遺伝子の95%までが複数の転写産物に転写さ…

de novo transcriptomeのcontigクラスタリングツール Corset

RNA-seqは、トランスクリプトームの様々な側面を研究するための強力な技術である。それは、遺伝子発見、選択的スプライシングイベントの検出、継時的発現分析、融合の検出、SNPおよび転写後エディティングなどの変異の同定を含む広範囲の用途を有する[ref.1]…

バクテリアのRNA seq定量ツール EDGE-pro

バクテリアゲノム中の遺伝子の発現を測定することは、感染の治療法の開発から合成ゲノムの作成まで、非常に幅広い用途を有する。バクテリアにおける遺伝子発現研究は、代謝経路を研究し、変異株の特性を同定し、他の点ではそれらのゲノムにおける分子過程を…

RNA-seqのクロスコンタミを検出する Croco

核酸試料間の汚染は、分子生物学における潜在的な問題として長く認識されてきた。ポリメラーゼ連鎖反応(PCR)による増幅や、そして最近ではハイスループット配列決定でのPCR増幅は、ソースにかかわらず、また非常に低レベルの混入した核酸でさえ、十分な範…

リファンレンスガイドのトランスクリプトのアセンブル strawberry

ゲノムガイドのRNAのアセンブル法は、遺伝子アノテーション情報を使わず、RNA-Seqデータから転写物の再構成を行う方法である。 Strawberryは ゲノムガイドのアセンブリと定量の2つのモジュールで構成されており、ゲノムガイドのアセンブルではbamをスプライ…

超高速にRNA seqのリードカウント(定量)を行う salmon

salmonは豊富なbiasモデルを取り込み、高速、高精度、堅牢なRNAseqの発現定量を行う方法論。 kallistoやeXpressと比べて、同じFDRで2倍以上精度が高い(DEG判定された遺伝子が2倍以上少ない=false positiveが少ない)というデータを出している。 Supplement…

RNA seqのリードカウント HTSeq-count

HTSeqはNGSデータの各種ハンドリングができるツール。ここではその1つhtseq-countコマンドを紹介する。htseq-countはリードのアライメントデータからカウントデータを出力するために使う。htseq-countを使うと、bamから数分でカウントデータを得ることがで…

RNA seqのリードカウント featureCounts

RNA reqのリードカウントツールを紹介する。 featureCounts ダウンロード sourceforgeリンク https://sourceforge.net/projects/subread/files/subread-1.5.2/ インストール ソースコードをダウンロードして解凍し、/srcに移動。macでは以下のようにしてビル…

edgeR

発現が負の二項分布に従うと仮定した検定法。正規化はTMMで行う。FPKM/RPKM補正のcufflinksより正しくDEGの検出ができる検定法とされる。詳細は門多先生のスライドやdry本の序章の正規化の話を読んでください。以下のマニュアルも大変参考になります。後半で…