macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

simulator

高忠実度なin silicoモデリングによるRNA-Seqシミュレータ BEERS2

RNA-seqリードのシミュレーションは、バイオインフォマティクスツールの評価、比較、ベンチマーク、開発において極めて重要である。しかし、RNA-seqシミュレータの分野は過去10年間ほとんど進歩していない。このニーズに応えるため、本著者らは柔軟で高度に…

原核生物のゲノム進化のシミュレータ CoreSimul

原核生物は無性の生物であるが、これらの生物は有性生物の減数分裂による組換えとは異なり相同組換えを頻繁に行う。ゲノム進化をシミュレートするために開発されたほとんどのツールは、有性生殖を想定しているか、あるいは集団にDNAフラックスが全くないこと…

高速かつ様々なプロファイルに対応可能な、次世代シークエンシングデータの次世代のシミュレーター NGSNGS

シークエンシングの世代が変わるにつれてDNAシークエンサーの性能が急速に向上し、生成されるデータ量も増加した。この進化は、新しいバイオインフォマティクスの手法にもつながっており、モデルの精度やゲノム解析パイプラインの頑健性を検証する際に、in s…

メタゲノムのリードの発生からbinningまで自動でシミュレーションする MAGICIAN

シーケンスリードからメタゲノムアセンブリゲノム(MAGs)を回収することで、微生物群集とその構成員に関するさらなる洞察が可能になり、場合によっては単一分離ゲノム用に設計されたツールでそのような配列を解析することもできる。結果の質は配列の質に依…

あらゆるタイプのPacBioおよびONTロングリードのシミュレータ PBSIM3

2024/02/12 誤字修正、11/03 コマンド修正 Pacific Biosciences (PacBio)やOxford Nanopore Technologies (ONT)などのロングリードシーケンサーは、そのリード長や精度を向上させ、これまでにない研究を開拓している。ロングリードを解析するためのツールや…

ノイズパラメータを調整可能なナノポアシーケンスシグナルデータのシミュレーター squigulator

次世代シーケンサーデータのin silicoシミュレーションは、ゲノミクス分野で広く用いられている手法である。しかし、DNAまたはRNA分子を時系列電流シグナルデータの形で測定する「第3世代」ナノポアシーケンス装置からのシミュレーションデータを作成するた…

既存のシークエンスデータからリアルな人工メタゲノムを生成する SEQ2MGS

全ゲノムシークエンスデータからメタゲノム解析のためのバイオインフォマティクスツールの評価には、現実的なベンチマークセットが必要である。本著者らは、実シーケンス実験から人工メタゲノムを効率的かつ簡便に生成するツールを開発した。このツール(SEQ…

配列解析におけるリード塩基の偏りを解消するNGSリードシミュレータ Boquila

ゲノム中の塩基配列は不均質である。そのため、特定の塩基配列に偏ったゲノムワイドNGSリードは、ゲノムワイドの不均一な塩基配列分布の影響を受けてしまう。Boquilaは、真のリードのヌクレオチドプロファイルを模倣した配列を生成し、ゲノム全体に分布するN…

シングルセルDNAシーケンシングデータのシミュレータ SimSCSnTree

細胞の進化ツリーを生成し、その枝に沿って一塩基変異(SNVs)やコピー数異常(CNAs)を進化させる新しいシングルセルDNA配列シミュレータSimSCSnTreeについて報告する。このシミュレータで生成されたデータは、特にSNVやCNAが偏在するガンのシングルセルゲ…

メタゲノムとRNA seqにも対応したONTのロングリードのシミュレータ Trans-NanoSim

第3世代の1分子RNAシーケンサーは、第2世代のシーケンサーと比較して、ロングリードを生成することによりアイソフォームレベルの転写物の特性解析が容易になるという、これまでにない利点を備えている。特に、Oxford Nanopore Technologyのシーケンシングプ…

模擬微生物コミュニティとそのアンプリコンシークエンシングリードを発生させるための多機能ソフトウェア M&Ms

シーケンシング技術の進歩に伴い、16S rDNAシーケンスデータの解析を目的とした多くのバイオインフォマティクスツールが開発されている。これらのツールをテストするためには、異なる環境からのサンプルに類似したデータセットをシミュレートすることが重要…

ロングリードのシミュレータ PBSIM2

近年、PacBioやOxford Nanoporeなどのハイスループットのロングリードシーケンサーが登場し、ショートリードシーケンサーに比べてエラーの多いロングリードが生成されるようになった。リードのエラー率の高さに加えて、エラーの不均一性は、ロングリードを用…

高忠実度のHi-Cデータをシミュレートする FreeHi-C

ハイスループットのクロマチンコンフォメーション(Hi-C)データをシミュレーションできることは、Hi-Cデータ解析手法のベンチマークに不可欠である。この論文では、FreeHi-Cと名付けられたノンパラメトリックな手法を用いて、相互作用するゲノム断片から得…

コピーナンバーバリアント(CNV)のシミュレータ SECNVs

コピーナンバーバリアントは、表現型の変化やヒトの病気に重要な役割を果たすゲノムの複製や欠失である。全ゲノム配列や全エクソーム配列のデータを用いて、コピー数の変異を検出するソフトウェアが数多く開発されている。しかし、これらのアプリケーション…

エラーの多いロングリードのシミュレータ Badread

DNA シーケンシングのプラットフォームは、DNA サンプル中のヌクレオチド(A、C、G、T)の配列を測定することを目的としている。Illumina社のシーケンサーは、過去10年間の大半を占めてきた技術だが、これらのプラットフォームでは、比較的小さい(~100~30…

シングルセルのシークエンシングデータをシミュレートする SCSsim

シングルセルシーケンシング(SCS)の技術的な問題点として、アレルドロップアウト(ADO)やアンバランス増幅があり、これらを効果的にエミュレートすることは、SCSベースのバイオインフォマティクスツールを確実にベンチマークするために必要である。このような…

リアルデータに忠実なショートリードをシミュレートする ReSeq

2021 2/20 論文引用、condaによるインストール追記 2021 3/1 追記 2021 5/25 エラーについて追記 ハイスループットのシーケンシングデータでは、生データから科学的な結果に至るまでのデータ処理において、計算ツール間の性能比較は、情報に基づいた意思決定…

全てのk-mer配列を含み二次構造を作らないRNA配列を設計する CURLCAKE

タンパク質とRNAの結合は、RNAの配列と構造の両方を介して媒介され、神経変性疾患を含む多くの細胞プロセスにおいて重要な役割を果たしている。RNA結合タンパク質の配列と構造の結合嗜好性をモデル化することは、計算上の重要な課題である。正確なモデル化を…

パンゲノム解析のためbacteria populationsをシミュレートする SimPan

細菌ゲノムは、広範な相同組換え、水平遺伝子導入、遺伝子損失、遺伝子重複などの複雑な進化の歴史によって形作られている。細菌ゲノムの定義されたセット内のすべての遺伝子で構成されるパンゲノムは、系統学的推論および集団研究の基礎を提供できる。ここ…

バクテリアゲノムの進化をシミュレートする SimBac

バクテリア全ゲノムシーケンシングは急速に普及しており、高解像度の遺伝情報を迅速かつ費用対効果の高い方法で提供することにより、multilocus sequence typing(MLST)に取って代わっている(Didelot et al、2012; Wilson、2012)。遺伝学的データを使用し…

シミュレーション精度と速度が改善された DeepSimulator1.5

2020 2/1 タイトル追加、文章追加、誤字修正 2020 2/2 誤字修正 2020 3/9 コマンド修正 ナノポアシーケンスは、主要な第3世代シーケンステクノロジーの1つである。 Nanoporeデータの処理と分析を容易にするために、多くの計算ツールが開発された。以前、Deep…

変異が導入されたゲノムをシミュレートする simuG

ゲノムシーケンステクノロジーの急速な進歩に伴い、ゲノムシーケンスデータに基づいてゲノムバリアントを特徴付けるための多くのバイオインフォマティクスツールが開発されてきた。実際の生物学的サンプルから実験的に検証されたゴールドスタンダードゲノム…

Pacbioのロングリードのシミュレータ PaSS

PacBioやSMRT(1分子リアルタイム)シーケンスやナノポアシーケンスを含む第3世代のシーケンス技術は、これまでにないシーケンスリード長をゲノムを研究する研究者に提供し、ゲノミクス研究に革命をもたらしている[ref.1]。 Pacific BioSciencesが開発したSM…

Nanoporeのsquiggle plot (basecallされたリード含む) のシミュレータ DeepSimulator

2019 4/17 誤字修正 2020 1/30タイトル修正 2020 2/1リンク追加 次世代シークエンシング(NGS)技術により、研究者はDNAおよびRNAをハイスループットでシーケンシングすることが可能になり、これはゲノミクス、トランスクリプトミクスおよびエピゲノミクスに…

コンタミやダメージを考慮してAncient DNAのシーケンシングリードをシミュレートする gargammel

Ancient DNA(aDNA)とも呼ばれるsubfossilsから回収されたDNAは、populationの歴史を再構築するためにますます使用されている(Leonardi et al、2016)。しかし、下流の推論に影響を与える可能性があるいくつかの要因があるため、aDNAデータの分析は依然と…

illuminaのショートリードシミュレータ Sandy(RNA seqにも対応)

Sandyは、与えられたfastaファイルからシングルエンド/ペアエンドのリードを生成するシンプルなバイオインフォマティックツールである。多くの次世代シーケンシング分析は、実際には正確には満足されていない仮説モデルおよび原理に依存している。ポジティブ…

遺伝子水平伝播をシミュレートする HgtSIM

2019 2/9 タイトル誤字修正 Horizontal gene transfer (HGT) は、微生物の進化と適応における重要な力として認識されている(Soucy、Huang&Gogarten、2015)。単離された微生物のドラフトまたはフィニッシュしたゲノム中のHGTを同定する多数のパイプライン…

ロングリードのシミュレーションやロングリードのエラーコレクションツールの評価を行う ELECTOR

Pacific Biosciences(PB)とOxford Nanopore Technologies(ONT)のロングリードは、高いエラーレートと複雑なエラープロファイルにもかかわらず、さまざまなアプリケーションに急速に採用されてきている[論文 ref.1]。これらのリードは、エラー率が高く(…

in silico mate-pairシーケンシングによってde novo アセンブリ改善を試みる cross-species-scaffolding

10/5 3stepコマンドの誤り修正 及びコマンド変更、コメント追加 正確で完全でアノテーションのついたゲノムは、種や個体の過去、現在、未来に関する豊富な情報を提供するため、医療や生物学の研究にとって非常に貴重なリソースとなっている[論文より ref.1]…

review article要約 バクテリアのバリアントコール評価のベストプラクティス

Best practices for evaluating single nucleotide variant calling methods for microbial genomicsより https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4493402/ シークエンシング技術の革新により、生物学の研究者はbiologicalなシステムの理解を大幅に進…