macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

polyploid

統計モデルを使った倍数性推定を行う nQuire

酵母や真菌などの病原性真核生物や非病原性真核生物など、様々な生物種で種内変異が起こっている。次世代シーケンサー(NGS)を用いた実験から、DNA量を測定することなく、間接的に倍数体を推定することができる。著者らは、NGSを用いて2倍体、3倍体、4倍体…

真核生物のシンテニックパンゲノムアノテーションを行う GENESPACE

多くの分類群において高品質な複数のリファレンスゲノム配列が利用可能になったことで、分子進化のパターンやプロセスを高解像度で見ることができるようになった。しかし、真核生物のほぼすべての系において、複数のリファレンスハプロタイプの情報を活用す…

HiFiロングリードを使ってhaplotype-resolved assemblyを行う Hifiasm

2022/03/26 Hi-Cと組み合わせた論文引用、ツイート追記 2023/02ツイート追記 Haplotype-resolved de novo assemblyは、ゲノム配列のバリエーションを研究するための究極のソリューションである。しかし、既存のアルゴリズムでは、ヘテロ接合型の対立遺伝子を…

公開されている真核生物アセンブリを分析する BlobToolKit

2020 6/15 追記 種の起源について不可知なシーケンスデバイスによって作成されたシーケンシングデータから標的ゲノムを再構築する場合、汚染された DNA によって混同される可能性がある。サンプル処理中に混入した場合でも、標的DNAとの共抽出によって混入し…

WGSのリードから倍数体ゲノムのゲノムサイズやヘテロ接合度を推定する GenomeScope 2.0

2020 3/21 コマンドの修正と結果追記、タイトル修正、誤字修正 2020 3/23 誤字修正 ゲノムシーケンシングは、現代の分子生物学の不可欠な部分となっている。ただし、利用可能な分析方法の大半は、染色体レベルのリファレンスゲノムと詳細なアノテーションが…

倍数性レベルを可視化して推測する smudgeplot

2022/09/02 論文引用、Githubリンク修正 性別:それは何の利点があるか?直接的な選択肢が利用可能であるとき、ほとんどの真核生物が繁殖に複雑な迂回路をとる理由は、進化生物学の中心的かつ主として未解決の問題であり続けている。無性生殖を唯一の複製形…

review article要約 16Sアンプリコンシーケンシングによる微生物コミュニティの定量

いくつかの例を挙げると、微生物群集は、地球規模の元素循環、排水処理プラントでの廃棄物除去、およびバイオガスプラントでのメタン生産を促進する、多くの自然および人工生態系における隠れたチャンピオンである。これらのシステムを理解しモデル化するた…

polyploidのラージゲノムのアセンブラ Meraculous2

ヒトや他のギガベース規模のゲノムの正確なディープショットガンシーケンスは、今や控えめなコストで容易に利用可能になっている。これらのシーケンシングスループットの増加により、大規模かつ複雑なゲノム用のショットガンシーケンスを構築するための新し…

シーケンスデータからk-merスペクトラム分析を行う GenomeScope

2019 3/5 インストール追記、コマンドのわかりにくい部分を修正 2019 5/14 リンク追加 2019 5/27 docker追加、オプションヘルプ追加 2019 8/27 twitter追記 ハイスループットシーケンシングにより、新規ゲノムのシーケンシングが日常的に可能になっている。…

somaticやmixed tumorのSNPsやSVをシミュレートする Pysim-sv

構造変化(SV)はドナーゲノムの構造変化をもたらすゲノム変異である。Indels、コピー数変動(CNV)およびゲノム再編成はすべてSVのサブクラスである。多くの研究は、SVが正常なヒト集団[論文より ref.1,2]ならびに癌ゲノム[ref.3-5]において広く広がってい…

倍数体のfractionation biasを視覚化する FractBias

全ゲノム重複(WGD)などの倍数性事象は、単一の生物体内に2つ以上のゲノムコピーを作成する。重複(サブゲノム)に由来するホモロガスな染色体の全セットは、遺伝子が相同染色体の1つからlossするfractionationと呼ばれる過程で遺伝子欠損を受ける(Langham…

highly heterozygous なゲノムのアセンブリパイプライン Redundans

ショートリードからのゲノムアセンブリは、複雑な計算上の問題である。この課題に取り組むために、数多くのゲノムアセンブラが開発されている(論文より ref.1-5)。典型的には、シーケンス中にある程度の異種性(例えば、一倍体でない生物、細胞または個体…