macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

evaluation tool

アセンブリの内容をどれだけ反映したコールであるかに基づいてSVコールを評価する TT-Mars

大規模なシークエンス研究により、一般的な構造バリアント(SV)やレアバリアントなどの遺伝子バリアントと形質や疾患との関連付けが可能になった。SVには、欠失、挿入、重複、50塩基以上のリアレンジメントが含まれ、これらは遺伝的多様性、発達障害、ガン…

MAGとSAGのゲノム品質を評価する MDMcleaner 

2022/05/21 ツイート追記 現在、環境微生物の大部分は未培養のままであり、「微生物ダークマター」(MDM)と呼ばれている。そのため、これらの微生物に関するゲノム解析は、シングルセルオミクスやメタゲノム解析などの培養に依存しないアプローチに限定され…

コアゲノム推定にメタゲノムアセンブルゲノムを活用するためのロバストなベイズアプローチ mOTUpan

近年のシーケンサーとバイオインフォマティクスの進歩により、メタゲノムアセンブルゲノム(MAG)やシングルセルアセンブルゲノム(SAG)を通じて、環境に関連する未培養クレードのゲノムを提供し、生命の系譜を拡大している。このような多様性の拡大により…

マッピングのローレンツ曲線を生成する bam-lorenz-coverage

Githubより bam-lorenz-coverageはBAMファイルから直接ローレンツプロットやカバレッジプロットを簡単に作成できるフリーソフトです。また、テーブルをテキスト文書として出力することができるので、カスタムプロットを作成することも可能です。また、特定の…

bowtie2を使ってアセンブルした配列を評価する

bowtie2はマッピング結果の要約統計を標準エラー出力として報告する。Trinityのwikiでは、これを利用してde novo transcriptome assemblyを評価する流れがまとめられている。 RNA Seq Read Representation by Trinity Assembly · trinityrnaseq/trinityrnase…

機械学習を利用してゲノムアセンブリ品質を総合的に評価する EvalDNA

興味のある生物に対して最も完全で、継続的で、正確なアセンブリを選択するためには、アセンブリの包括的な品質評価が必要である。本著者らは、Evaluation of De Novo Assemblies (EvalDNA)という新しいツールを開発した。このツールは、教師付き機械学習を…

ロングリードを使ったゲノムアセンブリの評価とミスアセンブリ修正を行う Inspector

全ゲノムde novoアセンブリはリファレンスゲノムを持たない種の研究には不可欠であり、リファレンスゲノムを持つ種の遺伝的変異の全容を明らかにするためにも重要である。ロングリードシーケンシング技術の進歩により、ロングリードはより正確に、より長く、…

Hi-Cシーケンスデータのリファレンスベースもしくはリファレンスフリーの品質評価ツール qc3C

Hi-Cは、DNA分子間の空間的な相互作用をゲノム全体で捉えることができるハイスループットシーケンシングを可能にするサンプル調製法である。この技術は、クロマチンの3次元構造解析、大規模ゲノムアセンブリのスキャフォールド構築、最近ではメタゲノムアセ…

タンデムリピートとその周辺のリードアラインメントをハプロタイプに分解して可視化する REViewer

2021 10/27、20/28追記 ショートタンデムリピート拡張は、家族性筋萎縮性側索硬化症やハンチントン病をはじめとする多くの神経遺伝性疾患の原因となっている。最近では、全ゲノムやエクソームのシーケンスデータからリピートの拡大を同定する方法が複数開発…

アセンブルされた微生物ゲノムのクオリティ評価を行う miComplete

2022/03/18 インストール手順追記 ハイスループットシーケンスの開発により、大規模なシーケンスプロジェクトが手頃な価格になり、可用性がますます向上している。膨大な量のメタゲノムデータが生成され、未培養微生物から数千のmetagenome-assembled genome…

メタゲノムアセンブリのbin配列を評価する metashot/prok-quality

メタゲノムシークエンスにより、大規模なゲノムの同定とゲノムの特性解析が可能になる。Binningとは、未知の細菌や古細菌の配列断片(メタゲノムコンティグ)の複雑な混合物からゲノムを回収するプロセスである。メタゲノムから回収したゲノムの品質を評価す…

ゲノムアセンブリの品質、完全性、フェーズ評価を行う Merqury

最近のロングリードアセンブリは、利用可能なリファレンスゲノムの品質と完全性を上回ることが多く、その検証は困難を極めている。ここでは、効率的なk-merセット操作に基づいてリファレンスフリーにアセンブリを評価する新しいツール、Merquryを紹介する。M…

パンゲノム解析によってアノテーション情報の改善を試みる panaroo

Preprintより 原核生物のゲノム進化は、親から子への遺伝物質の垂直伝達と生物間の水平遺伝子伝達の両方によって引き起こされる(ref.1)。細菌の大規模なシーケンシング研究から、種内ゲノム含有量に大規模な違いが生じることが確認されている(ref.2)。こ…

メタゲノムのハイブリッドアセンブリとビニングのためのベスト・プラクティス・パイプライン nf-core/mag

ショットガンメタゲノムデータを解析することで、微生物群集に関する貴重な知見が得られると同時に、個々のゲノムレベルでの解決が可能となる。しかし、完全なリファレンスゲノムが存在しない場合、シークエンスリードからメタゲノムアセンブルゲノム(MAG)…

BUSCO v5

2021 8/14 誤字修正 2021 11/29 誤字修正 2022/06/08 インストールのバージョン更新 ゲノムデータやメタゲノムデータの品質を評価する方法は、ゲノムアセンブリを助け、その後の解析結果を正しく解釈するために不可欠である。BUSCOは、ユニバーサル・シング…

(メタ)ゲノムアセンブリを評価する ALE

研究者は、シングルおよびメタゲノムアセンブリの精度を客観的に評価し、それらに含まれる可能性のあるエラーを自動的に検出するための汎用的な手法を必要としている。現在の手法は、リファレンスを必要としたり、アセンブリ品質の多くの側面のうちの1つしか…

スモールゲノムのアセンブリ精度を評価する assembly_accuracy

assembly_accuracyはminimap2を使ってアセンブリの精度を評価するツール。相同な配列によって学習したモデルを使って、Nanoporeのシステマティックなエラーを他のニューラルネットワークのツールより高い精度で修正するHomopolishの論文で、アセンブリエラー…

アセンブリのinterrupted ORFsを評価する ideel

ideelはバクテリア/微生物ゲノムアセンブリの中断されたORFの評価を行うツール。 インストール Github git clone https://github.com/mw55309/ideel.gitcd ideel/ Snakefileを開いてuniprot tremblなどのdiamond databaseのパスを修正する。 実行方法 クロー…

RNA-SeQC 2

サンプルの品質は、サンプルの保管、抽出、シーケンスプロトコルによって影響を受けるため、シーケンス後の品質管理は、RNAシーケンス(RNA-seq)データの生成と解析に不可欠な要素である。RNA-seqは、数百から数万サンプルの規模のコホートに適用されること…

原核生物のゲノムアセンブリでキメラや汚染を調べる GUNC

2021 1/18 解析例追加 2021 6/15 論文引用 2022/06/16 コマンド更新 ゲノムは原核生物の系統の遺伝的青写真であり、現在進行中の微生物世界のセンサスの中心にある微生物学の基本単位であり、微生物の生態と進化の研究に不可欠なものである。1995年に細菌の…

LTRレトロトランスポゾンを識別可能な割合でゲノムアセンブリを評価するIndex; LAI

2020 11/7 タイトル修正 2020 11/8 感想追加 2020 11/11 誤字修正, タイトル修正(”主に植物”を削除) 構造的特徴に基づくコンピュータプログラムを用いたLTR要素の同定は効率的であるが(10,11)、多数の偽陽性(4)に悩まされている。最近、インタクトなLTRレ…

bamを操作する包括的なツールキット BamDeal

2021 9/6 コード修正 BamDeal は bam ファイルの包括的な解析を行うためのフル機能ツールキットである。C/C++ 言語で実装されており、Linux と Mac OS X オペレーティングシステムで利用可能である。 インストール 依存 Pre-installations of 4 libraries or…

メタゲノムのビニングされた真核生物由来コンティグの品質を調べる EukCC

微生物のDNAは日常的に抽出され、配列決定され、ゲノムにアセンブリされている。回収されたゲノムの品質を推定することは、不完全なゲノムや汚染されたゲノムが公表されるのを防ぐために非常に重要である。シングルコピーマーカー遺伝子(SCMG)は、新たにア…

完全性、正確性、連続性を考量してゲノムアセンブリを評価する PDR

既存のゲノムアセンブリ評価指標は、ゲノムアセンブリの品質の特定の側面についての限られた知見しか提供しておらず、時にはお互いに意見が合わないこともある。アセンブリ間の統合的な比較をより良くするために、著者らはここで新しいゲノムアセンブリ評価…

フェージングの品質を評価、改善する phaseME

同じDNA分子上でどの突然変異が発生しているかを検出することは、その結果を予測するために不可欠である。これは、ゲノム変異のphasingによって達成することができる。それにもかかわらず、最先端のハプロタイプphasingは、現在のところ、再構成されたハプロ…

メタゲノムアセンブリのウイルスゲノム品質を評価する CheckV

2020 5/9 誤字修正 2020 12/22 論文追加 ここ数年の間に、メタゲノミクスにより何百万もの新しいウイルス配列のアセンブルが可能になり、地球上のウイルスの多様性に関する知識が大幅に拡大した。しかし、これらの配列は小さな断片から完全なゲノムまで様々…

公開されている真核生物アセンブリを分析する BlobToolKit

2020 6/15 追記 種の起源について不可知なシーケンスデバイスによって作成されたシーケンシングデータから標的ゲノムを再構築する場合、汚染された DNA によって混同される可能性がある。サンプル処理中に混入した場合でも、標的DNAとの共抽出によって混入し…

(small eukaryotes)ゲノムアセンブリがchromosome levelに達しているかどうかを評価する Tapestry

ゲノムには、複製、転座、大きな逆位、倍数性変異などの複雑な機能が含まれている可能性があり、アセンブリやアセンブリの検証が困難になる場合がある。John Daveyが開発したTapestryと呼ばれるツールを使用すると、小さく、ほぼ完全な真核生物ゲノム(50 Mb…

アセンブリ結果を評価するwebサービス gVolante

2021 5/12 ツイート追記 全ゲノムやトランスクリプトームなどの包括的な配列情報へのアクセスが増加するとともに、それらの品質を評価する必要性が高まっている。N50などのシーケンス長に基づくメトリックが標準になったが、これはアセンブリ品質の1つの側面…

包括的なメタゲノム解析パイプライン MAGO

微生物種はさまざまな環境で重要な役割を果たしているが、メタゲノムデータセットからの高品質のゲノムの生成は、その生態学的および進化のダイナミクスを理解する上で大きな障害となっている。 Metagenome-Assembled Genomes Orchestra(MAGO)は、複数のマ…