macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

NAR Genomics and Bioinformatics

細菌ゲノムに組み込まれたプロファージ領域を見つける PhageBoost

プロファージは細菌ゲノムに組み込まれたファージであり、細菌生物学の多くの側面を理解する鍵となる。プロファージは非常に多様であるため、配列の類似性を利用して検出することは困難である。本著者らは、新規プロファージの発見を容易にするために、特徴…

天然変性タンパク質を予測する ADOPT

天然変性タンパク質(Intrinsically disordered proteins: IDPs)(wiki)は、広範な生物学的機能に重要であり、多くの疾患に関与している。内在性無秩序を理解することは、IDPを標的とする化合物を開発するための鍵となる。IDPの実験的特性解析は、IDPが非…

ゲノムのGFF3アノテーションファイルを扱う AEGeAn Toolkit

マニュアルより AEGeAn Toolkitは、全ゲノム遺伝子構造アノテーションを管理・解析するツールを構築するための、いくつかの異なるが関連した取り組みとして始まった。AEGeAnはこれらの取り組みを一つのライブラリにまとめ、実行可能なプログラムだけでなく、…

あらゆるタイプのPacBioおよびONTロングリードのシミュレータ PBSIM3

2024/02/12 誤字修正 Pacific Biosciences (PacBio)やOxford Nanopore Technologies (ONT)などのロングリードシーケンサーは、そのリード長や精度を向上させ、これまでにない研究を開拓している。ロングリードを解析するためのツールやアルゴリズムも数多く…

病原性因子と抗生物質耐性遺伝子を同時に予測する HyperVR

感染症は、公衆衛生と世界経済に深刻な問題を提起している。病原体が宿主細胞に接着し、繁殖し、ダメージを与えることを可能にするのは病原性因子(VFs)であり、抗生物質耐性遺伝子(ARGs)は、通常であれば治癒可能な治療を回避することを可能にする。VFs…

(主にヒトRNA-seq)大規模RNA-seqデータセットからデータセットに関する情報を提供する Kmerator Suite

一般に公開されている膨大な数のRNA-sequencing (RNA-seq) ライブラリは、組織における既知または新規の転写産物の発現を定量化するための機能情報の宝庫である。しかし、転写産物の定量は、多くの計算資源と処理時間を必要とするアライメント手法に依存する…

既存のシークエンスデータからリアルな人工メタゲノムを生成する SEQ2MGS

全ゲノムシークエンスデータからメタゲノム解析のためのバイオインフォマティクスツールの評価には、現実的なベンチマークセットが必要である。本著者らは、実シーケンス実験から人工メタゲノムを効率的かつ簡便に生成するツールを開発した。このツール(SEQ…

ProtHint

著者らは、真核生物ゲノムにおける遺伝子予測のための高速かつ高精度なアルゴリズムの作成に向けて、いくつかのステップを踏んできた。まず、ab initio gene findingを効率的に行うための自動化手法、GeneMark-ESを導入し、教師無しでパラメータを繰り返し学…

グラフニューラルネットワークを用いてタンパク質機能予測を行う PANDA2

ハイスループットなシークエンス技術により、大量のタンパク質配列が生成されているが、タンパク質配列のアノテーションは、低スループットで高価な生物学的実験に大きく依存している。そのため、タンパク質配列から機能的な知識を推測するために、正確かつ…

fastqから正確に汚染を除去する CONSULT

多くのバイオインフォマティクスのアプリケーションには基本的な疑問がある。あるシーケンスリードは、ある広範な分類群のゲノムからなる大規模なデータセットに属しているのか、たとえそのセットの中で最も近いマッチがクエリから進化的に乖離しているのか…

コアゲノム推定にメタゲノムアセンブルゲノムを活用するためのロバストなベイズアプローチ mOTUpan

2022/08/20 論文引用 近年のシーケンサーとバイオインフォマティクスの進歩により、メタゲノムアセンブルゲノム(MAG)やシングルセルアセンブルゲノム(SAG)を通じて、環境に関連する未培養クレードのゲノムを提供し、生命の系譜を拡大している。このよう…

ハイスループットシーケンシングデータから既知のヒトキメラ配列を迅速かつ正確に同定する ChiTaH

融合遺伝子やキメラは、通常、2つの異なる遺伝子からの配列で構成されている。このような融合配列のキメラRNAは、しばしばガンのドライバーとして機能する。このようなドライバーfusionを特定することは、診断や治療に重要である。DNA-SeqやRNA-Seqなどの次…

包括的なマイクロRNAおよびtRFシーケンシング解析パイプライン miRge3.0

マイクロRNAとtRFは、遺伝子の翻訳制御に関与することで知られる低分子ノンコーディングRNAの一種である。次世代シーケンサー(NGS)の進歩により、high-throughput small RNA-seq研究が可能になったが、これには強固なアラインメントパイプラインが必要であ…

大規模な微生物の比較ゲノミクスのためのモジュラー式のツール PanACoTA

2021 9/8 修正 2021 9/9 誤字修正 2021 9/10 prokkaのバージョンによるエラー修正 (依存するライブラリの関係でpython3.7の環境に導入するように修正した), --prodigalのオプション消去 2021 10/15 docker imageのコマンド追記 2021 10/18 annotate追記 2021…

メタゲノムのハイブリッドアセンブリとビニングのためのベスト・プラクティス・パイプライン nf-core/mag

2023/03/02 論文引用 ショットガンメタゲノムデータを解析することで、微生物群集に関する貴重な知見が得られると同時に、個々のゲノムレベルでの解決が可能となる。しかし、完全なリファレンスゲノムが存在しない場合、シークエンスリードからメタゲノムア…

エピゲノムプロファイルを用いた転写因子予測ツール BART

ある遺伝子セットを制御する機能的な転写因子の同定は、遺伝子制御研究において重要な問題である。従来の転写因子の同定方法であるDNA配列モチーフ解析では、特定の因子の機能的な結合を予測することができず、遠位のエンハンサーに結合する因子を検出するに…

メタゲノムの組成を解析する CAMAMED

メタゲノミクスは、分子ゲノミクス、微生物生態学、データ解析が交差する学際的な研究分野である。この分野の主な研究対象は、ある環境に存在する微生物のゲノム総量を指すメタゲノムである。メタゲノミクスは、ハイスループットゲノムシークエンシング技術…

ハプロタイプを考慮してドラフトゲノムアセンブリをポリッシュする Hapo-G

2021 5/23 論文引用 1分子シーケンシング技術は最近、Pacific BiosciencesとOxford Nanoporeによって商業化され、長いDNA断片(キロベースからメガベースのオーダー)をシーケンシングし、効率的なアルゴリズムを使用して、反復領域の連続性と完全性の点で高…

アノテーションパイプライン BRAKER2

2020 8/14、15、10/1、10/2 追記, タイトル修正、誤字修正 2021 2/9、9/4 追記 2022 1/.29 12/23 condaインストール修正、 追記 2023/01/04, 01/09.01/11 間違った説明を修正、Documentリンク修正、画像追加 2023/03/03 braker3.0の公開について 遺伝子予測…

オルガネラゲノムをターゲットアセンブリする NOVOPlasty

次世代シークエンシング(NGS)技術の進化により、様々なアセンブルアルゴリズムが開発されてきたが、オルガネラゲノムのアセンブルに焦点を当てたものはほとんどない。これらのゲノムは、系統研究や食品の同定に利用されており、GenBankに登録されている真…