macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

web tool

マイクロバイオームと表現型のデータを関連付ける統合データベース解析プラットフォーム MANTA

人体の内部または表面に存在する微生物、特に腸内マイクロバイオームは宿主との相互関係の中で生きている。これらの関係は宿主の代謝に重要な貢献をしており、通常、人間の健康には欠かせないものである。腸管のマイクロバイオータ(腸内マイクロバイオータ…

De novo遺伝子予測やメタゲノムの機能アノテーションなどに対応したeggNOG-Mapper v2

遺伝子の自動機能アノテーションは、ほとんどのゲノムおよびメタゲノムワークフローにおいて基本的なステップであるにもかかわらず、大規模なスケールでは依然として困難である。本研究では、事前に計算されたorthology assignmentsに基づいて機能アノテーシ…

ターゲットの転写制御因子を予測したりピークのアノテーションを行うウェブツール AnnoMiner

遺伝子発現の制御には、転写因子による正確な転写プログラムと、エピジェネティックな事象の組み合わせが必要である。近年、エピゲノムやトランスクリプトームの技術が進歩し、さまざまな遺伝子制御メカニズムが解明されてきた。しかし、転写因子とエピジェ…

エピゲノムプロファイルを用いた転写因子予測ツール BART

ある遺伝子セットを制御する機能的な転写因子の同定は、遺伝子制御研究において重要な問題である。従来の転写因子の同定方法であるDNA配列モチーフ解析では、特定の因子の機能的な結合を予測することができず、遠位のエンハンサーに結合する因子を検出するに…

ナノポアリード用の新しい高精度メタゲノム分類器 BugSeq

20211114 論文引用 メタゲノム解析にナノポアシーケンサーを使用する機会が増えるにつれ、ロングリードの分類学的な分類を高速かつ正確に実行できるツールが必要となっている。既存のツールは、ショートリードデータ用に設計されているか(例:Centrifuge)…

真菌群集を解析するユーザーフレンドリーなwebサーバー DAnIEL

ヒトの体内や体の中には、あらゆる生物界を代表する何兆もの微生物が生息しており、宿主の発生や生理に重要な役割を果たしている。この10年間で、細菌の配列を解析するためのオンラインツールやサーバーが十数種類開発され、パブリックドメインでアクセスで…

機能的エンリッチメント解析のためのウェブツール WebGestalt

WebGestaltは、大規模な-オミクス研究から得られた遺伝子リストを解釈するための人気のツールである。2019年のアップデートでは、WebGestaltは12の生物、342の遺伝子識別子、155 175の機能カテゴリをサポートしており、ユーザーがアップロードした機能データ…

(イネ科)比較ゲノミクスとパスウェイの力を植物研究に生かす Gramene

Gramene(http://www.gramene.org)は、モデル植物と主要作物のゲノムおよびパスウェイデータの比較機能解析に基づいたナリッジベースで、世界中の農業研究者をサポートする。このリソースは、FAIRデータ原則に基づいて、オープンアクセスと再現可能な科学を…

Multiple Sequence Alignmentの結果を視覚化する Sequence Bundles

本研究では、複数の配列アライメント(MSA)を表現するための新しいデータ可視化手法であるSequence Bundlesを紹介する。既存のバイオインフォマティクスのデータ可視化手法(Sequence Logoなど)の主な限界を特定し、解決するために、Sequence Bundlesを用…

植物の発現データの視覚化と探索を行う ePlant

現在のシステムバイオロジー研究では、異なる種類のデータを別々のソースからアクセスし、別々のツールを使って視覚化しなければならないという大きな課題がある。このようなワークフローをナビゲートするために必要な高い認知的負荷は、仮説の生成に悪影響…

バリアントデータのマイニングと管理のためのウェブベースの可視化ツール VCF-Server

次世代シーケンシング(NGS)は、疾患に関連した遺伝的変異の発見を促進しており、疾患の病因調査および臨床遺伝診断に広く使用されている(Gong、Jiang、Duan、およびLu、2018; Zhao&Wei、2018)。 NGSによって識別された変異は、通常、変異データを格納す…

KEGGパスウェイと発現プロファイルデータを視覚的に統合するウェブサーバー KeggExp

発現プロファイルデータを解析する際の知識発見には、効果的な可視化が重要である。しかし、発現プロファイルデータをKEGGパスウェイマップと視覚的に統合するための既存のツールは、広範なインタラクティブな可視化操作を欠いている。KeggExpは、1つのパス…

原核生物の遺伝子配列をGenBankファイルから簡単に検索するためのウェブツール BAGET 2.0

細菌ゲノムや古細菌ゲノムの完全シークエンスから単一の遺伝子配列とコンテキストを検索することは、ウェットベンチ生物学者にとっては気が遠くなるような作業である。既存のウェブベースのゲノムブラウザは、日常的に使用するには複雑すぎるか、原核生物ゲ…

GO エンリッチメント解析を実行し、バックグラウンドセットと比較して過剰に存在する語彙を調べる FunSet

遺伝子オントロジーエンリッチメント解析は、複雑な生物学的データセットから意味のある情報を抽出する効果的な方法を提供する。遺伝子セットの中で有意に過剰発現している語彙を特定することで、研究者は遺伝子が共有する生物学的特徴を明らかにすることが…

インタラクティブな出版品質の合成 Figure作成webツール canvasDesigner2

Scalable Vector Graphics (SVG) は、拡張可能なマークアップ言語 (XML) ベースのベクトル画像フォーマットであり、png, gif, jpg のような他の一般的な画像フォーマットのようにぼやけたピクセル化をすることなく、任意の解像度に拡張可能である。この形式…

事前計算された植物の遺伝子ファミリーの系統樹 PhyloGenes

著者らは、シロイヌナズナや他のモデル生物から得られた遺伝子機能に関する知識を、他の植物種に正確かつ効率的に伝達できるようにすることを目指している。このような知識移転は、植物の系統における個々の遺伝子やゲノム全体の重複のために、植物において…

陸域メタゲノムのキュレーションされたメタデータ公開リポジトリ TerrestrialMetagenomeDB

2022/06/25 タイトル変更 微生物群集の遺伝的可能性に着目したマイクロバイオーム研究(メタゲノム研究)は、微生物生態学の分野では標準的なものとなった。MG-RASTとSequence Read Archive (SRA)という2つの主要なメタゲノムリポジトリには、202,858以上の…

: 高次元データのクラスタリングと可視化のためのインタラクティブな教育用ウェブリソース ClusterEnG

クラスタリングは、何らかの尺度に従って類似したデータポイントをグループ化することにより、大規模データセットの構造を発見するための最も強力で広く利用されている分析手法の一つである。R(R Core Team, 2015)やPython(Pedregosa et al., 2011)のような…

RNAseqのDEGsを視覚化する DrEdGE

Differential Expression Gene Explorer(DrEdGE)はウェブベースのツールで、インタラクティブなオンラインのデータビジュアライゼーションを簡単に作成できるようにgenomicists(*1)を案内する。 DrEdGEの機能を、公開されているデータセット(ヒトの神経…

RNAの二次構造を予測する UFold 

多くのRNA分子にとって、二次構造はRNAの補正機能に欠かせないものである。ヌクレオチド配列からRNAの二次構造を予測することは、ゲノミクスにおける長年の課題であるが、予測性能は時間の経過とともにプラトーに達している。従来のRNA二次構造予測アルゴリ…

ボックスプロットを描画するwebツール BoxPlotR

2021 2/26 追記 生物医学研究では、異なる分布を持つ複数のデータセットを比較する必要があることが多い。棒グラフ、またはヒストグラムは、通常、単純な統計的尺度、通常は s.d.やs.e.m.による平均値に基づいてデータセットを比較するために使用される。ボ…

(バクテリア)共存在する遺伝子を探索するwebサービス PhyloCorrelate

系統プロファイリング」として知られるゲノム間のco-occurring genesを統計的に検出する方法は、遺伝子間の機能的関連を推測するための強力なバイオインフォマティクス技術である。系統樹データベースのサイズと複雑さ、系統樹構造の考慮の難しさ、ゲノムア…

(主に微生物)代謝モデルのデータベース BiGG Models

BMC Bioinformatics. 2010 Apr 29;11:213 COBRA(Constraint Based Reconstruction and Analysis)フレームワークに基づくゲノムスケールの代謝再構成は、生物の代謝能力を解析し、実験データを解釈するための貴重なツールである。このような再構成や解析手…

ヒトとマウスの ロングノンコーディングRNAのアノテーションをつける lncFunTK

ロングノンコーディングRNA(lncRNA)とは、200塩基より長いノンコーディング転写物を指す。現在までに、約58,000のlncRNAが様々な細胞型・組織に集積されているが、そのうち79%が新規性の高いものであり、その生物学的機能は未だ解明されておらず(Iyer et a…

ChIP-Atlas

代表的なモデル生物6種(ヒト、マウス、ラット、ミミズバエ、線虫、出芽酵母)から得られた公開されているクロマチン免疫沈降シークエンス(ChIP-seq)とDNase-seqデータ(n>70,000)を完全に統合し、ChIP-Atlas(http://chip-atlas.org)と名付けられたデー…

配列モチーフを探す STREME

配列モチーフ発見アルゴリズムは、DNA、RNA、タンパク質の配列中で生物学的機能を果たす新規な配列パターン、例えば、DNAやRNA結合タンパク質の結合部位モチーフを同定することができる。ここで紹介するSTREMEアルゴリズムは、精度と汎用性の両面で最先端のa…

真核生物ゲノムのアノテーションを行うwebサービス MOSGA

近年のシーケンシング技術の進歩により、大規模な真核生物ゲノムであっても高品質のアセンブリを生成することは、多くの生物学者にとって日常的な作業となっている。しかし、このようなアセンブリのアノテーションは、関心のある生物の生物学的性質を解明す…

タイプ株のゲノムデータベース gcType

微生物は世界で最も豊富な生物と言われている。原核生物細胞は地球上に約4〜6×10^30個存在し、350〜550×10^15gの炭素を含むバイオマスを構成していると推定されている(1)。原核生物の総数は10^9種にも及ぶ(2)。1980年には、約1800種の細菌・古細菌の種名が承…

Natural product生産ポテンシャルも含めてMLST解析を行うwebサービス autoMLST

細菌単離株の進化の背景を理解することは、幅広い研究への応用が期待される。しかし、正確な種の系統樹を作成することは依然として困難である。現在、種の同定には16S rDNAへの依存が一般的になっている。残念ながら、この普及している方法では、配列の保存…

トランスポーターのデータベース TCDB

膜輸送体は、細胞の分子組成やエネルギー状態を決定するチャネル、キャリア、ポンプ、group translocators、電子輸送体などの複雑なネットワークを形成する多様なタンパク質のグループを構成している(ref.1)。これらのタンパク質は、細胞内の全タンパク質の…