macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

snakemake

高忠実度なin silicoモデリングによるRNA-Seqシミュレータ BEERS2

RNA-seqリードのシミュレーションは、バイオインフォマティクスツールの評価、比較、ベンチマーク、開発において極めて重要である。しかし、RNA-seqシミュレータの分野は過去10年間ほとんど進歩していない。このニーズに応えるため、本著者らは柔軟で高度に…

(メタ)ゲノムのARGプロファイリングを行うSnakemakeパイプライン ARGprofiler

メタゲノム解析は、抗菌薬耐性遺伝子(ARG)の機能や分布を理解する上で非常に有用である。しかし、研究の比較可能性を確保するために、標準化された再現可能なワークフローが必要である。現在の選択肢には、それぞれ特定の目的を念頭に設計された様々なツー…

複数のラージゲノム間のシンテニーを高速に検出する ntsynt

2024/05/27 追記 近年、リファレンスグレードのゲノムアセンブリは大幅に多様化している。このような豊富なデータにより、ゲノム間の配列保存に関する情報を提供し、種の進化に関する重要な知見に貢献するゲノムのシンテニーの検出を含む、スケーラブルな複…

完全かつ正確な細菌ゲノムアセンブリを行う Hybracter

2023/12/23 誤字修正 2024/02/11 help追記、05/09 論文追記 ロングリードシークエンスの精度と利用可能性が向上したことで、現在ではハイブリッド(すなわちショートリードとロングリード)アセンブリアプローチを用いて完全な細菌ゲノムが日常的に再構築さ…

正確で拡張可能な系統樹を構築する uDance

2023/08/05 間違った説明を修正 系統樹は、生命のツリーを横断して進化の歴史を整理するための枠組みを提供し、メタゲノム同定などの下流の比較解析に役立つ。16S rRNAのような単一マーカー遺伝子に依存する手法では、数十万種の生物で精度の低い系統樹が作…

断片化したメタゲノムアセンブリからバクテリオファージゲノムを同定する Phables

2023/09/29 論文引用 ヒトの腸内に見られる微生物群集は、ヒトの健康に強い影響を及ぼす。腸内細菌やウイルスは、炎症性腸疾患などの消化器疾患に影響を及ぼす。バクテリオファージとして知られる細菌に感染するウイルスは、ヒト腸内の細菌群集を調節する上…

ロングリードシーケンスデータを用いてトランスポーザブルエレメントのアレル頻度推定を行うTrEMOLO

Transposable Element MOnitoring with LOng-reads(TrEMOLO)は、アセンブリベースとマッピングベースのアプローチを組み合わせた新しいソフトウェアで、トランスポーザブルエレメント(TE)と呼ばれる遺伝要素を強固に検出することができる。TrEMOLOは、高…

De novoトランスクリプトームアセンブリとアノテーションのSnakemakeパイプライン transXpress

RNA-seqとde novoトランスクリプトームアセンブリは、非モデル生物の生物学的研究に変革をもたらす技術であるが、RNA-seqデータの計算処理には、多くの異なるソフトウェアツールが必要である。このようなde novoトランスクリプトームワークフローの複雑さは…

ONTリードを用いて2倍体HiFiアセンブリを検証する GAVISUNK

現在、多くの生物種や個体において、 de novo phased diploid genome assembliesが実現可能である。そのため、アセンブリの精度を検証し、オーソログシーケンスデータによるミスアセンブリを検出し、ダウンストリーム解析を確実に行うための手法が求められて…

バリアントコーリングを自動化する柔軟でスケーラブルなパイプライン grenepipe

本著者らは、個体や集団のハイスループットな生シーケンスデータから遺伝子型バリアントコールまでのデータ処理を効率化するオールインワンSnakemakeワークフローであるgrenepipeを開発した。このパイプラインは、一般的なソフトウェアツールを単一の設定フ…

メタゲノム解析のための自動化されたワークフロー MAGNETO

2022/06/17 誤字修正 メタゲノム-アセンブルゲノム(MAG)は、メタゲノムデータから回収された個々のゲノムを表す。MAGは、未培養微生物のゲノム多様性の解析や、自然環境における機能・代謝の可能性を明らかにするために非常に有用である。近年の計算機開発…

環状細菌ゲノムアセンブラ B-assembler

細菌ゲノムの正確なde novoアセンブリは、新しい細菌種の進化や病原性を理解するための基礎となるものである。Third-Generation Sequencing (TGS)の出現と普及により、バクテリアゲノムのアセンブルはかつてないほどのスピードで可能になった。しかし、現在…

機械学習と意味的類似性によってGene Ontologyのアノテーションを行う CrowdGO

ますます増加し多様化するゲノム上の遺伝子機能の解析は、ほぼ全て計算機による予測手法に依存している。また、これらのソフトウェアは、コミュニティーのベンチマーク活動を通じて明らかにされたように、それぞれ異なる長所と短所を持っており、多数かつ多…

メタゲノムの高感度分類と柔軟な機能アノテーションのためのパイプライン MEDUSA

メタゲノム研究により、微生物群集の分類学的構成や機能の詳細が明らかになった。完全なメタゲノム解析には、目的別に異なるツールが必要であり、これらのツールの選択とセットアップは依然として困難である。さらに、選択したツールセットは、結果で報告さ…

複雑なメタゲノムデータセットから高品質なゲノムを回収するビニングアルゴリズム binny

2022/10/15 論文引用 ゲノムの再構築は、ゲノム-resolved メタゲノム解析や微生物群集からのマルチオミクスデータ統合において重要なステップである。本発表では、連続したゲノムと高度に断片化したゲノムの両方から高品質のメタゲノムアセンブリゲノムを生…

ロングトランスクリプトームリードから遺伝子融合を高精度に検出する Genion

次世代シーケンサーの登場により、様々なトランスクリプトーム研究が行われるようになった。その中でも、多くのがん種で観察され、発がん性が疑われている遺伝子融合は、広く研究されているテーマである。遺伝子融合は、2つの遺伝子が近接して配置され、融合…

De novoトランスクリプトームアセンブリで誤ってアセンブリされたキメラ転写産物を除去する Bellerophon

トランスクリプトームの品質管理は、RNA-Seq実験において重要なステップである。しかし、de novo アセンブルされたトランスクリプトームの品質を評価することは、アセンブルを比較するリファレンスゲノムがないために困難である。本著者らは、キメラ配列の除…

エキソームのバリアント解析パイプライン EXOME-pipeline

レポジトリよりこのプロジェクトは、エクソームシーケンス用のSnakemakeを使った解析パイプラインです。Illumina HiSeqからのヒトエクソームシーケンシングで広くテストされていますが、必要なリソースファイルを手動でダウンロードすれば、ほとんどのシステ…

大量のタンデムリピート構造を含むゲノムをインタラクティブに可視化する StainedGlass

2022/01/13 論文引用 ドットプロット解析は、配列の同一性や方向性の違いのような複雑なリピートの基礎構造を明らかにするためによく用いられる。ロングリードシーケンス技術の進歩により、最近ではますます連続したリファレンスゲノムのアセンブリやヒトの…

全ゲノムバイサルファイトシーケンスデータのためのエンドツーエンド解析パイプライン wg-blimp

DNAシークエンスが開発されて以来、遺伝的変異に関する多くの研究が行われてきたが、エピジェネティックなレベルでの広範な研究は最近になって登場した。生体内のほとんどの細胞は、そのゲノム配列が同一であるが、組織や細胞の種類によっては、それぞれのア…

メタゲノムアセンブリゲノムの下流解析のための再現性のあるパイプライン MAGpy

2022/02/20 追記 メタゲノミクスは、環境中に存在するすべてのゲノムからDNAをアッセイするための強力なツールである。近年のバイオインフォマティクスの進歩により、ほぼ完全なメタゲノム・アセンブル・ゲノム(MAG)の迅速なアセンブルが可能になっており…

(bin化した)メタゲノムアセンブリから病原性遺伝子や薬剤耐性遺伝子を予測するパイプライン PathoFact

2023/07/13 追記 2024/05/20 追記 病原性微生物は、宿主に侵入し、コロニー化し、損傷を与えることで病気を引き起こす。細菌毒素を含む病原性因子は病原性に寄与する。さらに、抗菌薬耐性遺伝子は、病原体が治癒力のある治療法を回避することを可能にする。…

( メタゲノム)ONTのロングリードをアセンブリしてコンプリートMAGsを生成する lathe

2020 4/29 実行手順修正 細菌および古細菌での完全なメタゲノムアセンブリゲノム(MAG)の新規生成は、マイクロバイオーム研究における長年の目標である。既存のメタゲノムシーケンスおよびアセンブリ法では通常、完成した細菌ゲノムシーケンスが得られない…