macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

Nucleic Acids Research

(ヒトゲノム)超高速なk-mer問い合わせwebサービス KmerKeys

2022/05/21 論文引用 K-merは、ゲノム配列解析に使用される短いDNA配列である。K-merを使ったアプリケーションには、ゲノムアセンブリやアラインメントがある。しかし、バイオインフォマティクスの分野でk-merを広く利用するには、ゲノム配列データの巨大化…

マイクロバイオーム解析リソース MGnify

マイクロバイオームの研究には、通常、特定の環境(biomeとして知られている)からの微生物の集合的な遺伝物質の研究が含まれる。この多様で拡大している研究分野(バイオーム、方法、科学的質問の幅の観点から)は、世界の海洋の深海水と堆積物(1〜3)から…

(ヒトゲノム)非コード領域のバリアントの機能を評価するウェブサーバー DeepFun

ゲノムワイド関連研究(GWAS)で同定された遺伝子変異の90%以上は、ヒトゲノムの非コード領域に存在する。ここでは、非コード領域の遺伝子変異の機能的活性を評価するための、ユーザーフレンドリーなウェブサーバー「DeepFun」(https://bioinfo.uth.edu/de…

Webサービスの可用性を監視するためのWebサービス Aviator

オンラインツールの監視を容易にするウェブサービスとリポジトリAviatorを紹介する。Aviatorは、ユーザーフレンドリーなWebサイトと、文献調査をベースにした一般的なモジュールと、手動で精査したモジュールの2つのモジュールで構成されている。一般モジュ…

ゲノムスケールの代謝モデルをメタゲノムから直接再構築する metaGEM

2021 7/2, 7/5, 7/6 追記 2021 10/7 論文引用 2021 10/15 ツイート追記 複雑な微生物群集のメタゲノムアセンブルゲノム(MAG)の再構築により、種間・種内の遺伝的多様性が明らかになってきた。しかし、代謝モデリングの取り組みは、ゲノムスケールの代謝モ…

mate-pairs、10x Genomics のbarcoded_pair、ロングリードにも対応したメタゲノムアセンブラ MetaPlatanus

2021 6/18 コマンドの間違い修正 2021 9/28 論文引用 2021/10/21 ツイート追加 HPより メタゲノムデータをデノボで組み立て、配列をクラスタリングすることで、未培養生物を含む複数のドラフトゲノムを構築することができる。この目的のために、本著者らは以…

De novo遺伝子予測やメタゲノムの機能アノテーションなどに対応したeggNOG-Mapper v2

遺伝子の自動機能アノテーションは、ほとんどのゲノムおよびメタゲノムワークフローにおいて基本的なステップであるにもかかわらず、大規模なスケールでは依然として困難である。本研究では、事前に計算されたorthology assignmentsに基づいて機能アノテーシ…

キュレーションされ、統一したアノテーションが付けられたhuman gutメタゲノムのデータベースGMrepo

GMrepo (data repository for Gut Microbiota)は、キュレートされ、一貫してアノテーションされたヒト腸管メタゲノムのデータベースである。GMrepoの主な目的は、急速に増加しているヒトのメタゲノムデータの再利用とアクセスを容易にすることである。これは…

脊椎動物のオルソログデータベース OHNOLOGS v2

ヒトを含むすべての脊椎動物は、2回の全ゲノム重複(2R-WGD)を経た祖先から進化してきた。また、テレオスの魚類では、さらに3回目のゲノム複製(3R-WGD)が行われている。これらのゲノム重複から保持された遺伝子、いわゆるオルソログは、脊椎動物の複雑性…

原核生物のゲノム構造を利用してリボソーム領域全体をアセンブルする riboSeed

バクテリアのゲノムシーケンスの大部分は、イルミナのショートリードを用いて行われている。しかし、ショートリードだけでは繰り返し領域を解決することが難しいため、クローズドなゲノムを得ることができたのは、シーケンスプロジェクトの約10%に過ぎなかっ…

機能的エンリッチメント解析のためのウェブツール WebGestalt

WebGestaltは、大規模な-オミクス研究から得られた遺伝子リストを解釈するための人気のツールである。2019年のアップデートでは、WebGestaltは12の生物、342の遺伝子識別子、155 175の機能カテゴリをサポートしており、ユーザーがアップロードした機能データ…

バクテリアゲノムデータセットからリンクされた遺伝子を探す SLING

オペロンおよび機能的に連結された遺伝子アレイは原核生物ゲノムにおける転写構成の最も基本的な単位を表す。同じプロセスまたはパスウエイに関与する遺伝子は単一のブロックにコードされ、同じ調節の下で転写される。多くの臨床的に重要な遺伝子システムが…

(イネ科)比較ゲノミクスとパスウェイの力を植物研究に生かす Gramene

Gramene(http://www.gramene.org)は、モデル植物と主要作物のゲノムおよびパスウェイデータの比較機能解析に基づいたナリッジベースで、世界中の農業研究者をサポートする。このリソースは、FAIRデータ原則に基づいて、オープンアクセスと再現可能な科学を…

Multiple Sequence Alignmentの結果を視覚化する Sequence Bundles

本研究では、複数の配列アライメント(MSA)を表現するための新しいデータ可視化手法であるSequence Bundlesを紹介する。既存のバイオインフォマティクスのデータ可視化手法(Sequence Logoなど)の主な限界を特定し、解決するために、Sequence Bundlesを用…

腸内嫌気性細菌の代謝遺伝子クラスターを調べる gutSMASH

2021 5/26 論文引用 腸内細菌叢は何百もの小分子を産生し、その多くは宿主の生理機能を調節している。二次代謝産物の生合成遺伝子を同定する試みがなされているが、腸内細菌叢の化学的プロダクトは主に一次代謝産物で構成されている。本研究では、腸内細菌の…

陸域メタゲノムのキュレーションされたメタデータ公開リポジトリ TerrestrialMetagenomeDB

2022/06/25 タイトル変更 微生物群集の遺伝的可能性に着目したマイクロバイオーム研究(メタゲノム研究)は、微生物生態学の分野では標準的なものとなった。MG-RASTとSequence Read Archive (SRA)という2つの主要なメタゲノムリポジトリには、202,858以上の…

多様なヒートマップを作図できるwebサービス Heatmapper

2021 1/19 誤字修正 Heatmapperは自由に利用できるWebサーバであり、ユーザーは使いやすいグラフィカルなインターフェースを使って、データをヒートマップの形でインタラクティブに視覚化することができる。既存の非商用のヒートマップパッケージは、グラフ…

高速なハプロタイプバリアントコーラー LocHap

Somatic mosaicismとは、単一の生物学的サンプル中の体細胞の一部に体細胞変異が存在することである。その重要性は主に理論的に議論されてきたが、実験的な研究により体細胞モザイクと疾患診断との関連性が明らかになりつつある。本研究では、健康なドナーの…

(主に微生物)代謝モデルのデータベース BiGG Models

BMC Bioinformatics. 2010 Apr 29;11:213 COBRA(Constraint Based Reconstruction and Analysis)フレームワークに基づくゲノムスケールの代謝再構成は、生物の代謝能力を解析し、実験データを解釈するための貴重なツールである。このような再構成や解析手…

タイプ株のゲノムデータベース gcType

微生物は世界で最も豊富な生物と言われている。原核生物細胞は地球上に約4〜6×10^30個存在し、350〜550×10^15gの炭素を含むバイオマスを構成していると推定されている(1)。原核生物の総数は10^9種にも及ぶ(2)。1980年には、約1800種の細菌・古細菌の種名が承…

Natural product生産ポテンシャルも含めてMLST解析を行うwebサービス autoMLST

細菌単離株の進化の背景を理解することは、幅広い研究への応用が期待される。しかし、正確な種の系統樹を作成することは依然として困難である。現在、種の同定には16S rDNAへの依存が一般的になっている。残念ながら、この普及している方法では、配列の保存…

メタゲノムのシーケンシングリードからアセンブリしてCRISPRsを探す Crass

Clustered Regularly Interspaced Short Palindromic Repeats (CRISPRs) は、バクテリオファージ(ファージ)から細胞を保護する細菌および古細菌の適応免疫システムを構成する。 CRISPR遺伝子座の分析により、ファージ感染の履歴が明らかになり、ファージと…

様々な種のバリアント情報をまとめたデータベース Genome Variation Map(GVM)

Genome Variation Map (GVM; http://bigd.big.ac.cn/gvm/) は、ゲノム変異の公開データリポジトリである。幅広い種のゲノム変異を収集・統合することを目的としており、世界中から様々な変異タイプの投稿を受け付けており、世界中の研究活動を支援するために…

ウィルスゲノムのアノテーションを行う VIGOR

遺伝子予測プログラムVIGOR(Viral Genome ORF Reader)は、2010年にJ.Craig Venter Instituteで開発され、感染症ゲノムシークエンシングセンターのプロジェクトでコロナウイルス、インフルエンザ、ライノウイルス、ロタウイルスの遺伝子コールに成功してい…

LTRレトロトランスポゾンを識別可能な割合でゲノムアセンブリを評価するIndex LAI

2020 11/7 タイトル修正 2020 11/8 感想追加 2020 11/11 誤字修正, タイトル修正(”主に植物”を削除) 構造的特徴に基づくコンピュータプログラムを用いたLTR要素の同定は効率的であるが(10,11)、多数の偽陽性(4)に悩まされている。最近、インタクトなLTRレ…

異なるphylogenetic cladesで保存されているタンパク質を検索するwebサービス PhyloGene

同じパスウェイ、タンパク質複合体、または同じ環境条件で機能するタンパク質は、系統発生クレード全体で類似した配列保存パターンを示すことがある。特定のタンパク質複合体またはパスウェイをもはや必要としない種では、これらのタンパク質は、グループと…

de novo transcriptomeの系統解析と機能解析を行うwebツール TRAPID 2.0

2021 10/1 論文引用 ハイスループットシーケンシングの進歩は、RNA-Seqトランスクリプトームデータの膨大な増加をもたらした。しかし、特定の組織、状態、単細胞生物、微生物群集での迅速な遺伝子発現プロファイリングが期待されているが、新たな計算上の課…

リピートをマスクする RepeatMasker

2021 3/26 コマンド追加 2022/12更新 2023/01/08, 01/9 追記 RepeatMasker は、DNA 配列をスクリーニングして、散在したリピート配列や、複雑性の低い DNA 配列を検出するプログラムである。プログラムの出力は、クエリ配列に存在するリピートの詳細なアノテ…

アノテーションパイプライン PASA

2020 10/4 コマンドの間違い修正 2020 10/5 アップデートのコマンド修正 2023/01/05, 01/12追記 アップデートのコマンド追記 ゲノム配列に対する発現配列データのスプライスアラインメントは、真核生物ゲノムにおける遺伝子の包括的なアノテーションにおいて…

NCBI Genome のBrowse by Organism機能

2020 10/25 追記 ハイスループットシークエンシング技術の普及により、NCBIなどの塩基配列データベースに登録されるゲノム数は爆発的に増大している。BLAST検索をやり直したら少し前は無かったゲノム情報が出てきた、という話も度々耳にする。特にバクテリア…