macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2023-03-01から1ヶ月間の記事一覧

IGVのtips その3

以前書いたIGVのtipsという記事に時々アクセスがあるようなので、今日は再びゲノムブラウザIGVのtipsの紹介をします。 1、JSONファイルでの読み書き IGVはゲノムファイルやアノテーションをGenomeメニューから読み込むことよりもJSON形式でゲノムを指定する…

GTDBデータベースを扱うためのRustツール xgt

レポジトリより xgtは、GTDBデータベースの効率的なクエリとパースを可能にするRustツール。GTDB APIをミラーリングし、追加のパース機能を提供するコマンドのコレクションで構成されている。 インストール Github #rustcが古いならアップグレードするrustup…

染色体外環状DNA(eccDNA)を検出するパイプライン ECCsplorer

Extrachromosomal circular DNAs(eccDNA)は、染色体から物理的に分離したリング状のDNA構造で、100bpから数メガバイトの大きさである。eccDNAは、タンデムに繰り返されるDNAの他に、遺伝子のコピーや最近活性化したトランスポゾームエレメントを持つことが…

パンゲノムに基づくゲノムアイランド予測およびその多様性探索のための手法 panRGP

原核生物ゲノムの可変性の主な原因は、遺伝子の水平移動(HGT)である。ゲノム可塑性領域(RGP)は、非常に可変性の高いゲノム領域に位置する遺伝子のクラスターである。その多くは、HGTによって生じたもので、ゲノムアイランド(GI)に相当する。これらの領…

KEGGパスウェイをペイントする KPP

ハイスループット技術は、ゲノムワイドな遺伝子発現パターンの変化を読み解くための一般的なツールとなった。遺伝子発現パターンの機能解析は、生物学的知識の公開リポジトリにしばしばアクセスする必要があるため、困難な作業である。一方、多くの場合、研…

KofamKOALAのアノテーション結果からKEGGオルソログを抽出する KEGG_Extractor

KEGG Orthology (KO) データベースは、ほとんどの微生物の機能アノテーションを行うことができる、広く使われている分子機能参照データベースである。現在、機能的なオルソログをアノテーションするためのKOエントリーに基づく多くのKEGGツールが存在する。…

細菌プラスミドのデータベース PLSDB

プラスミドには、病原因子や抗生物質耐性機構をコードする遺伝子が含まれていることが知られている。メタゲノミクスデータ処理におけるその関連性は着実に高まっている。しかし、メタゲノム実験の普及と規模の拡大に伴い、報告されるプラスミドの数も急速に…

ONTのメタゲノムシークエンシングデータからリファレンス品質の高品質MAGをアセンブルする NanoPhase

Genome-resolved metagenomicsの正確で包括的な解析は、多様な微生物群からリファレンス品質(完全で高品質な)のゲノムを再構築することに大きく依存している。Nanoporeロングリードにより、ドラフトゲノムのギャップ解消が進んでいるが、ゲノム品質の向上…

nf-coreのscRNAseq解析パイプライン nf-core/scrnaseq

Nf-coreより nf-core/scrnaseqは、10x Genomics社のシングルセルRNA-seqデータを処理するためのバイオインフォマティクスのベストプラクティス解析パイプラインである。このパイプラインは、複数の計算インフラでタスクを実行するためのワークフローツールで…

変異がタンパク質に与える影響の解釈と可視化のためのウェブアプリケーション VIVID

大規模な比較ゲノム研究や集団遺伝学研究では、DNAバリアントという形で膨大な量の多型データが生成される。これらの研究の最終的な目的は、遺伝的変異を表現型やフィットネスに関連付けることである。VIVIDは、あらゆる生物・疾患の遺伝型から表現型までの…

シークエンシングデータのクオリティコントロールを行う seqqc

レポジトリより Arcadia-Science/seqqcは、シーケンシングデータの品質管理のための解析パイプラインである。このパイプラインは、ショートリードまたはロングリードのシーケンスデータ(FASTQフォーマット)に使用でき、アダプターの存在、高いシーケンス重…

ファージゲノムのアノテーションと解析のためのウェブサーバー PhaGAA

ファージゲノムアノテーションは、ファージ治療の設計に重要な役割を果たす。これまで、ファージのゲノムアノテーションツールは様々なものがあったが、その多くは単機能のアノテーションに特化したもので、操作プロセスも複雑だった。そのため、ファージゲ…

宿主ゲノムにマッピングして宿主と汚染菌のロングリードを分けることができるか試す

2023/03/12 誤字修正 ロングリードを使ったゲノムプロジェクトが爆発的に増えており、現在ではほとんどのゲノム解読プロジェクトでロングリードのシークエンスが主要に使用されています。ロングリードのゲノムプロジェクト増加に伴って、想定しない汚染生物…

教師なしクラスタリングによりロングリードのホストとコンタミ配列を分離するリファレンスフリー法 Symbiont-Screener

2023/03/10 追記 メタゲノムシークエンシングは、培養を必要としない複雑な微生物コミュニティの大規模な構成の解析と機能的特徴付けを容易にする。最近のロングリードシーケンス技術の進歩は、長距離情報を利用して、repeat-awareなメタゲノムアセンブリパ…

ヒトゲノム領域の包括的エンリッチメント解析ソフトウェア GREAP

ゲノムのハイスループットシーケンスの急速な発展により、豊富なエピジェネティクスマーカーを持つDNA制御要素が多数同定され、機能性ゲノム領域データの急速な蓄積が促進されている。ヒトの機能性ゲノム領域の網羅的な理解と研究は、現在でも比較的急務の課…

ヒトの遺伝子と転写産物の総合カタログ CHESS 3

ヒト遺伝子のCHESSデータベース(Comprehensive Human Expressed SequenceS)は、Genotype-Tissue Expression (GTEx)プロジェクトで作成されたヒト53部位における約1万件のRNAシーケンス実験から構築され、さらに他のデータベースからの遺伝子を加えて、タン…

バクテリオファージ・サテライトを同定する SatelliteFinder

バクテリオファージとバクテリアの相互作用は、ファージサテライト(バクテリア間の移動にファージを利用する要素)によって影響を受ける。サテライトは、防御システム、抗生物質耐性遺伝子、病原性因子をコードすることができるが、その数や多様性は不明で…

オルソログを探索する OrthoLoger

OrthoDBは、真核生物、原核生物、ウイルスの多様なサンプルの遺伝子の進化的・機能的アノテーションを提供する。Orthologyは、急速に拡大するゲノム配列の世界と、遺伝子の機能的知識を結びつける最も正確な方法である。OrthoDBは、最も多様な生物と最高品質…

ONTリードを用いて2倍体HiFiアセンブリを検証する GAVISUNK

現在、多くの生物種や個体において、 de novo phased diploid genome assembliesが実現可能である。そのため、アセンブリの精度を検証し、オーソログシーケンスデータによるミスアセンブリを検出し、ダウンストリーム解析を確実に行うための手法が求められて…

遺伝子の機能的アノテーションとエンリッチメント解析を行う KOBAS3.0

GSE(Gene Set Enrichment)解析は、ゲノムスケールの実験から生物学的な知見を引き出すために重要な役割を担っている。ORA (overrepresentation analysis)、FCS (functional class scoring)、PT (pathway topology) のアプローチは、GSE手法の3世代に渡って…