macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2026-01-01から1ヶ月間の記事一覧

ウイルス配列をクラスタリングするNextflowパイプライン ViralClust

ウイルスゲノム配列の急速な蓄積は、アウトブレイクによる過剰表現によって引き起こされる計算上の制約とサンプリングバイアスのために、多重配列アライメント、系統発生、ゲノム/アライメント可視化などの下流解析ツールに大きな課題をもたらしている。クラ…

UCSF ChimeraX内でBoltzを使う

2026/02/02 追記 タイトルの通り。インストールと使う流れだけ簡単に見ていきます。 HP https://www.cgl.ucsf.edu/chimerax/docs/user/tools/boltz.html Making Boltz Structure Predictions in ChimeraX https://www.rbvi.ucsf.edu/chimerax/data/boltz-apr20…

複数のタンパク質構造から多重構造アライメント(MTSA)を超高速に行う FoldMason

タンパク質構造は配列を超えて保存されているため、遠縁のタンパク質を解析するには多重構造アライメント(MSTA)が不可欠である。計算予測法によって利用可能なタンパク質構造のリポジトリは大幅に拡張され、高速で正確なMSTA法が求められている。本稿では…

ランダムフォレスト分類器により全遺伝子の存在パターンを予測する PanForest

ゲノム中の一部の遺伝子の有無は、他の遺伝子の存在の可能性に影響を与える可能性がある。こうした遺伝子の共起と回避のパターンを理解することで、ゲノム構成の基本原理が明らかになり、進化的再構成から合成ゲノムの合理的設計に至るまで、幅広い応用が期…

SingularityコンテナのGUI環境を提供する Colony

バイオインフォマティクスパイプラインは、再現可能な解析を可能にするために、FAIR基準を満たす必要がある。FAIRは、再現可能な研究に必要な4つの主要要件、すなわち、検索可能性、アクセス可能性、相互運用性、再利用性を規定している。Singularityなどの…

メタゲノムアセンブリのマルチサンプルbinning

2026/01/28 追記、誤字修正 今回はmetagenomic binningについてです。Albertsenらは、2013年の論文(Albertsen et al., 2013)で、DNA抽出方法だけ変えて同じサンプルを繰り返しショットガンシークエンスし、DNA抽出効率の違いによる菌体のカバレッジ共存在量情…

生物種を指定してNCBI BLASTサービスを使用するときのTips

2026/01/24 文字修正 しばらく前から、NCBI BLASTサービスのデフォルトDBがCore nucleotide DBとCLusteredNRになりました。データベースは年々加速度的に肥大化しており、検索速度を維持するための変更だと思われます。Core nucleotide DBとCLusteredNRでは、よく…

メタゲノムから細菌群集の好気性を予測する OxyMetaG

酸素は微生物の分布と活動の主要な駆動力である。酸素濃度を現場で測定することはしばしば困難であるため、一つの解決策として、細菌を酸素濃度の生物指標として用いることが考えられる。細菌は偏好気性細菌から偏嫌気性細菌まで多岐にわたるため、細菌群集…

ゲノムアノテーションとゲノム多様性解析のためのオールインワンワークフロー EASYstrata

生命のツリー全体にわたって新たなリファレンスゲノムとトランスクリプトームがますます利用可能になり、刺激的な疑問に取り組む新たな道が開かれている。しかしながら、ゲノムのアノテーションと進化プロセスの推論には依然として課題があり、方法論の標準…

細菌ゲノムの新規アノテーションのための統合プラットフォーム BacExplorer

ハイスループットシーケンシング(HTS)は、微生物学者の日常的な分析に不可欠な要素となっている。数十のサンプルをシーケンシングするプロセスでは、手作業ではアノテーションを付与できない膨大な量のデータが生成される。この課題に対処するため、長年に…

完全に自動化された 16S・18Sメタアンプリコン解析パイプライン AmpWrap

次世代シーケンシング革命は、群集構成を探索するための効率的かつ費用対効果の高い方法としてメタバーコーディングの確立を推進した。原核生物の16S rRNA遺伝子などの分類マーカー遺伝子のアンプリコンシーケンシングは、ハイスループット分類プロファイリ…

堅牢で再現性の高い可視化のための自己デバッグ型マルチモーダルエージェント ggplotAgent

出版物レベルの可視化を作成することはバイオインフォマティクスにおいて不可欠であるが、コーディングの専門知識が限られている研究者にとっては依然としてボトルネックとなっている。大規模言語モデル(LLM)はコード生成に長けているが、ライブラリの依存…

軽量かつインタラクティブなアライメントの視覚化を行う Alignoth

Alignothは、DNAシーケンシングリードアライメントパイルアップの自己完結型でポータブルなHTMLレポートを生成する軽量コマンドラインアプリケーションである。PNG、SVG、PDFなどの静的フォーマットやJSONベースの埋め込み可能な形式へのエクスポートもサポ…

特定の枝で正の選択が起きたか調べる aBSREL

2026/01/14追記、 1/23追記 過去20年間にわたり、コドン置換モデルを用いた比較配列解析は、分子データから自然選択のシグネチャーを検出するための強力かつ一般的な手法へと磨き上げられてきた。多くの研究は、ω比で定量化された配列に対する選択圧をコドン…

大規模データにおいて形質の進化的関連性を調べる SimPhyNI

2026/01/30 追記 ゲノム特徴と形質の間、またはゲノム形質のペア間の関連性を識別する従来の方法は、細菌ゲノムに適用すると困難をきたす。細菌におけるゲノムワイド連鎖が強い進化誘導関連性を生み出すという事実を説明するために、いくつかの微生物GWAS(m…

マルチスケール適応型クラスタリングと評価によるメタゲノムロングリードの効率的なビニングを行う LorBin

ロングリードシーケンスはメタゲノミクスを変革し、メタゲノムアセンブルゲノム(MAG)の品質を向上させた。しかし、現在のビニング手法では、未知の種の同定や不均衡な種分布の管理が課題となっている。本稿では、天然マイクロバイオーム中のMAGを再構築す…

シンテニープロット解析前のクオリティコントロールを行う SyntenyQC

SyntenyQCは、シンテニープロットを構築するためのデータ前処理ツールである。ゲノムデータの収集、アノテーション、デレプリケーションをサポートし、有益なシンテニープロットの構築を容易に(場合によっては根本的に)実現する。 SyntenyQCは、Pythonバー…

8つの生物種におけるオルソログ起源情報を提供する OrthoGuide

オーソロジーは、代謝経路や遺伝子制御ネットワークといった生物システムの進化研究において、貴重な代替指標であることが証明されている。同じオーソロググループに属する遺伝子は、通常、共通の祖先を反映して、同じ進化史を共有している。この特性を活用…

ゲノム近傍を解析するwebサービス GNAT

Gene Neighbourhood Analysis Tool(GNAT)は、タンパク質配列を与えられた微生物(細菌、古細菌、真菌)またはウイルスデータベース内の相同遺伝子を同定し、それらのゲノム近傍(GN)を類似性に基づいてアラインメントおよびクラスタリングし、一致したゲ…

細胞外多糖類生合成遺伝子クラスターを発見する epsSMASH

バイオフィルムは、自然環境および人工環境における細菌のデフォルトの生活様式を表し、細胞外多糖類(exoPS)はバイオフィルムマトリックスの重要な構造的および機能的構成要素として機能する。その重要性にもかかわらず、これらの環境でのexoPSの産生はほ…