macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

normalize

メタゲノムデータの平均ゲノムサイズや総カバレッジを推定する MicrobeCensus

ショットガンメタゲノミクスは、人体や環境の微生物群集の機能的構成を特徴づけるためにますます使用されてきている[論文より ref.1-4]。これらの研究の共通の目標は、遺伝子ファミリー存在量を定量化し、環境、宿主の表現型、または実験条件の間で豊富さが…

ノーマライズしてVCF間の比較時のバイアスを減らす BAN

Variant Call Format(VCF)は、遺伝的変異および遺伝子型に関する情報を格納するためのタブ区切りのテキスト形式である(論文より Petr et al、2011)。 VCFファイル中の変異のレコードは、リファレンスDNA配列を試料DNAのシーケンスに変換する情報を記憶す…

シングルセルにも対応したシーケンスデータの削減と正規化ツール NeatFreq

Multiple displacement amplification(MDA)は、培養できない生物のシングルセルシーケンスおよびゲノムアセンブリを可能にする[ 論文より ref.1]。 MDAはまた、メタゲノムシーケンシングでの使用のために低バイオマス環境サンプルからDNAを増幅するために…

多機能なNGSの管理ツール BBtools 其の1

2018 9/5 bbmerge-auto.sh修正 BBtoolsはアメリカのJGIが提供している多機能なNGS向けの解析ツール。2014年にオープンソース化されたらしい。論文は現在準備中とある。アライメントのBBmapや、オーバーラップがないペアリードをマージするBBMerge、エラーコ…

diginormによるシーケンスデータの軽量化

"digital normalization"という名で発表されたこの手法は、k-merを指標にリードを間引いて、データサイズを軽量化する方法論。データサイズが大きすぎてアセンブルできないサンプルの軽量化に使えるとされる。トリミングターゲットは、低/高のk-merカバレッ…

シロイヌナズナのRNA seq解析

2018 10/9 誤字修正 2018 10/22 CyVerseチュートリアル追記 植物のRNA seqを初めてされる方向けに作成した資料です。 真似すれば流れを再現できるように記載しています。興味があれば同じように実行してみてください。 論文 https://www.ncbi.nlm.nih.gov/pm…

edgeR

発現が負の二項分布に従うと仮定した検定法。正規化はTMMで行う。FPKM/RPKM補正のcufflinksより正しくDEGの検出ができる検定法とされる。詳細は門多先生のスライドやdry本の序章の正規化の話を読んでください。以下のマニュアルも大変参考になります。後半で…