macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

human genome

minimap2インデックスに既知バリアント情報を組み込むことで、WGSでのSNVコールを改善する minimap2_index_modifier

リファレンスゲノム配列に対するリードのアライメントは、次世代シーケンサー(NGS)技術によって得られたヒト全ゲノムシーケンスデータの解析における重要なステップの1つである。遺伝的変異の臨床的解釈の結果やゲノムワイド関連研究GWASの結果など、その…

(ヒト)AlphaFoldでモデル化されたタンパク質間相互作用のデータベース Predictomes

タンパク質間相互作用(PPI)は生物学において普遍的なものであるが、生化学的プロセスの根底にあるPPIの包括的な構造解析は不足している。AlphaFold-Multimer(AF-M)はこの知識のギャップを埋める可能性を秘めているが、標準的なAF-Mの信頼性指標では、関連す…

パンゲノムに基づいて構造変異をコールする svarp

現在私たちが使用しているリニアなヒトリファレンスゲノムは、全世界のヒト集団のハプロタイプ多様性を表現していない。そのため、ゲノムリードのアライメントに偏りが生じ、特に多型性の高い遺伝子座における大きな構造変異(SV)の検出が制限される。した…

(ヒト)遺伝子スクリーニングの結果をタンパク質の配列と構造にリンクする Genomics 2 Proteins portal

近年のAIを用いた手法の進歩は、構造生物学の分野に革命をもたらした。それと同時に、ハイスループットシークエンシングと機能的ゲノミクス技術により、バリアントの検出と生成がかつてない規模で可能になった。しかし、バリアントをタンパク質構造に「マッ…

HGVS命名法をチェックする Mutalyzer

ヒトのDNAバリアントを記述のスタンダードとして、HGVS Nomenclature という記述のルール(命名則)が存在する。これはバリアントをどのように曖昧なく記述するべきかのガイドラインで、snpeffなどのアノテーションツールは、このスタンダードに従ってバリア…

どれだけ知られていないかを基にタンパク質をランク付けする Unknomeデータベース

ヒトゲノムには約2万個のタンパク質がコードされているが、その多くはまだ解明されていない。科学研究は、よく研究されているタンパク質に焦点を当てがちであることは明らかであり、未解明の遺伝子が不当に軽視されているという懸念につながっている。この問…

(ヒトとマウス)マルチオミクスデータを探索するウェブサーバ  ExpressVis

ライフオミクスの時代、膨大な量のマルチオミクスデータが生成され、生物医学研究に広く利用されるようになった。プログラミングスキルの低い生物学者がマルチオミクスデータから生物学的知見を得ることは困難である。そのため、複雑なオミクスデータを扱い…

複数のライブラリにまたがるエンリッチメント解析を行う Enrichr-KG

遺伝子およびタンパク質セットのエンリッチメント解析は、オミックス実験から収集されたデータの解析において重要なステップである。Enrichrは、数十万件の注釈付き遺伝子セットを含む、人気のある遺伝子セットエンリッチメント解析ウェブサーバー検索エンジ…

(ヒト)遺伝子発現解析のためデータ可視化とパスウェイエンリッチメント解析を統合したウェブツール STAGEs

遺伝子発現プロファイリングは、生物学的プロセスや疾患の理解に多大な貢献をしてきた。しかし、データ可視化ツールやパスウェイ解析ツールの多くは、膨大なデータフォーマットを必要とするため、特にバイオインフォマティシャンでない人にとっては、処理さ…

1行のコードでゲノムデータベースへの様々な問い合わせを行う gget

ゲノムデータの解釈には、既存のリファレンスデータベースとの関連で結果を評価することが繰り返し課題となっている。コマンドラインやPythonの利用者が増加する中、大規模な公開ゲノムデータベースの多様なコレクションに保存されているキュレーションされ…

(ヒト)ノンコーディングRNAとKEGGシグナル伝達パスウェイの可視化およびエンリッチメント解析を行う NcPath

非コードRNAは転写プロセスにおいて重要な役割を果たし、様々な生物学的機能の制御に関与している。特にmiRNAやlncRNAが重要である。しかし、既存のシグナル伝達パスウェイデータベースには、miRNAやlncRNAに関する情報は含まれていない。そこで本著者らは、…

ヒトゲノム領域の包括的エンリッチメント解析ソフトウェア GREAP

ゲノムのハイスループットシーケンスの急速な発展により、豊富なエピジェネティクスマーカーを持つDNA制御要素が多数同定され、機能性ゲノム領域データの急速な蓄積が促進されている。ヒトの機能性ゲノム領域の網羅的な理解と研究は、現在でも比較的急務の課…

ヒトの遺伝子と転写産物の総合カタログ CHESS 3

ヒト遺伝子のCHESSデータベース(Comprehensive Human Expressed SequenceS)は、Genotype-Tissue Expression (GTEx)プロジェクトで作成されたヒト53部位における約1万件のRNAシーケンス実験から構築され、さらに他のデータベースからの遺伝子を加えて、タン…

ネットワークベースのパスウェイアノテーションのためのウェブサーバー PathBIX

パスウェイアノテーションは、生命科学における実験データを解釈し、意味を与えるための重要なツールである。このタスクのために数多くのツールが存在するが、最新世代のパスウェイエンリッチメント解析ツールであるネットワークベース法は、単に遺伝子の内…

ゲノムワイドなスプライシング効率を定量する SPLICE-q

一般にイントロンは一次転写産物から取り除かれ、成熟RNA分子を形成するために、スプライシングと呼ばれる転写後プロセスが行われる。一次転写産物の効率的なスプライシングは、遺伝子発現に不可欠なステップであり、その制御ミスは多くのヒト疾患に関連して…

(ヒト)バリアントの機能的アノテーションリソース FAVOR

大規模な全ゲノムシークエンシング(WGS)研究とバイオバンクにより、多数のコーディングおよびノンコーディングバリアントが急速に生成されている。これらは、ヒト疾患の遺伝的基盤を明らかにするための前例のないリソースを提供する。バリアント機能アノテ…

シングルブレイクエンドバリアントと構造バリアントのフェージングにより体細胞構造変異の包括的な評価を行う GRIDSS2

GRIDSS2 は、片側のみが明確に決定できるブレイクポイントであるシングルブレイクエンドを明示的に報告する初めての構造的バリアントコーラーである。シングルブレイクエンドをブレイクポイントと同様に基本的なゲノムリアレンジメントシグナルとして扱うこ…

大規模な遺伝子バリアントアノテーションのための統合的かつ対話的なプラットフォーム Annotation Query (AnnoQ)

Annotation Query (AnnoQ) (http://annoq.org/)は、ヒトの遺伝子バリアントに対して包括的かつ最新の機能アノテーションを提供するために設計されている。このシステムは、Haplotype Reference Consortium (HRC) の約3900万個のヒトバリアントに、WGSAによる…

ヒートマップと遺伝子セットエンリッチメント解析のオンラインサービス HemI 2.0

近年のハイスループットなオミックス技術により、大量の生物学的データが生み出されている。このようなビッグオミックスデータを可視化することは、様々な生物学的問題に答えるために必要不可欠である。簡潔でありながら包括的な戦略として、ヒートマップは…

(ヒトゲノム)バリアントが転写因子結合に及ぼす影響を予測する FABIAN-variant

コーディングバリアントの影響予測は大きく進歩したが、ノンコーディングバリアントの評価は依然として困難である。特にプロモーター領域内のバリアントは、遺伝子の過剰発現を引き起こしたり、発現を低下させたり、あるいは消失させたりする可能性があるた…

配列が重複しているGFAを重複のないblunt-ended GFAに変換する GetBlunted

配列グラフは、ゲノムアセンブリとパンゲノミクスという、計算ゲノム科学の2つの異なる分野で重要なツールとして浮上してきた。しかし、このように共通の基盤があるにもかかわらず、微妙に異なるグラフの形式が、パンゲノミクスからゲノムアセンブリへの方法…

アセンブルされたゲノムをコンパクトに表現する AGC

高品質の配列アセンブリは、個体の完全な遺伝情報を表現する究極の手段である。現在進行中のいくつかのパンゲノムプロジェクトでは、様々な種の高品質なアセンブリのコレクションが作成されている。ここでは、配列決定されたゲノムを2-3桁小さい空間で表現し…

公開されている大規模なRNA-seqデータセットを扱う recount3

新しいMonorail解析パイプラインによって一様に処理された750,000以上の一般に公開されているヒトとマウスのRNAシーケンス(RNA-seq)サンプルからなるリソース、recount3を紹介する。データへのアクセスを容易にするために、recount3およびsnapcountのR/Bio…

(ヒト)パスウェイエンリッチメント解析のためのウェブアプリケーション DecoPath

過去20年間で、パスウェイデータベースとパスウェイエンリッチメント法は着実に発展してきた。しかし、パスウェイデータの出現に伴い、データベース間の相互運用性が改善されていないため、複数のデータベースから得られたパスウェイ知識をパスウェイ・エン…

(SARS-CoV-2) シーケンシングリードの迅速なデコンタミネーションを行う ReadItAndKeep

臨床検体から得られたウイルス配列データには、人為的な汚染が含まれていることが多い。これらは、法的・倫理的な理由により、共有する前に除去する必要がある。ホストリードの除去を可能にし、低スペックのノートパソコンでSARS-CoV-2のシーケンスデータを…

ヒトおよびモデル生物のタンパク質相互作用データベース Integrated interactions database

バイオアッセイの改良により、新しいタンパク質間相互作用(PPI)の同定率が大幅に向上し、検出されたヒトPPIの数は、初期のヒト・インタラクトームの推定サイズを大幅に上回っている。これらの新しいPPIは、疾患メカニズムのより完全な見解を提供しているが…

JBrowseゲノムブラウザのデスクトップアプリケーション JBrowse 2 desktop

2022/05/21 ツイート追記 2023/04/18 論文引用 HPより JBrowseは、JavaScriptとHTML5で作られた高速でフル機能のゲノムブラウザです。Webサイトやアプリに簡単に組み込むことができますが、スタンドアロンのWebページとして提供することも可能です。 version…

ネットワークに基づく遺伝子セットエンリッチメント解析を行う NGSEA

遺伝子発現表現型の遺伝子セット解析には、 over-representationアプローチとaggregate scoreアプローチという2つの主要なアプローチがある(Irizarry et al.、2009)。 over-representationアプローチでは、発現データセットから差分発現遺伝子(DEG)群を…

包括的な遺伝子セットのエンリッチメント解析ウェブサーバー Enrichr

エンリッチメント解析は、ゲノムワイド実験で得られた遺伝子セットを解析するための一般的な手法である。ここでは、Enrichrと呼ばれるこの分野のツールの1つを大幅に更新した。Enrichrには、現在、解析やダウンロードが可能な多様な遺伝子セットライブラリの…

ハプロタイプresolved のSNV、SV、およびメチル化を包括的に検出するPRINCESS

ロングリードシーケンスは、構造変異(SV)の検出やメチレーションコールに有利であることが示されている。多くの研究では、SV、メチル化、またはSNVのphasingのいずれかに焦点が当てられているが、バリアントの組み合わせによってのみ、サンプルに関する包…