macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

web tool

原核生物の遺伝子配列をGenBankファイルから簡単に検索するためのウェブツール BAGET 2.0

細菌ゲノムや古細菌ゲノムの完全シークエンスから単一の遺伝子配列とコンテキストを検索することは、ウェットベンチ生物学者にとっては気が遠くなるような作業である。既存のウェブベースのゲノムブラウザは、日常的に使用するには複雑すぎるか、原核生物ゲ…

GO エンリッチメント解析を実行し、バックグラウンドセットと比較して過剰に存在する語彙を調べる FunSet

遺伝子オントロジーエンリッチメント解析は、複雑な生物学的データセットから意味のある情報を抽出する効果的な方法を提供する。遺伝子セットの中で有意に過剰発現している語彙を特定することで、研究者は遺伝子が共有する生物学的特徴を明らかにすることが…

インタラクティブな出版品質の合成 Figure作成webツール canvasDesigner2

Scalable Vector Graphics (SVG) は、拡張可能なマークアップ言語 (XML) ベースのベクトル画像フォーマットであり、png, gif, jpg のような他の一般的な画像フォーマットのようにぼやけたピクセル化をすることなく、任意の解像度に拡張可能である。この形式…

事前計算された植物の遺伝子ファミリーの系統樹 PhyloGenes

著者らは、シロイヌナズナや他のモデル生物から得られた遺伝子機能に関する知識を、他の植物種に正確かつ効率的に伝達できるようにすることを目指している。このような知識移転は、植物の系統における個々の遺伝子やゲノム全体の重複のために、植物において…

メタゲノムのキュレーションされたメタデータ公開リポジトリ TerrestrialMetagenomeDB

微生物群集の遺伝的可能性に着目したマイクロバイオーム研究(メタゲノム研究)は、微生物生態学の分野では標準的なものとなった。MG-RASTとSequence Read Archive (SRA)という2つの主要なメタゲノムリポジトリには、202,858以上の公開メタゲノムがあり、そ…

: 高次元データのクラスタリングと可視化のためのインタラクティブな教育用ウェブリソース ClusterEnG

クラスタリングは、何らかの尺度に従って類似したデータポイントをグループ化することにより、大規模データセットの構造を発見するための最も強力で広く利用されている分析手法の一つである。R(R Core Team, 2015)やPython(Pedregosa et al., 2011)のような…

RNAseqのDEGsを視覚化する DrEdGE

Differential Expression Gene Explorer(DrEdGE)はウェブベースのツールで、インタラクティブなオンラインのデータビジュアライゼーションを簡単に作成できるようにgenomicists(*1)を案内する。 DrEdGEの機能を、公開されているデータセット(ヒトの神経…

RNAの二次構造を予測する UFold 

多くのRNA分子にとって、二次構造はRNAの補正機能に欠かせないものである。ヌクレオチド配列からRNAの二次構造を予測することは、ゲノミクスにおける長年の課題であるが、予測性能は時間の経過とともにプラトーに達している。従来のRNA二次構造予測アルゴリ…

ボックスプロットを描画するwebツール BoxPlotR

2021 2/26 追記 生物医学研究では、異なる分布を持つ複数のデータセットを比較する必要があることが多い。棒グラフ、またはヒストグラムは、通常、単純な統計的尺度、通常は s.d.やs.e.m.による平均値に基づいてデータセットを比較するために使用される。ボ…

(バクテリア)共存在する遺伝子を探索するwebサービス PhyloCorrelate

系統プロファイリング」として知られるゲノム間のco-occurring genesを統計的に検出する方法は、遺伝子間の機能的関連を推測するための強力なバイオインフォマティクス技術である。系統樹データベースのサイズと複雑さ、系統樹構造の考慮の難しさ、ゲノムア…

(主に微生物)代謝モデルのデータベース BiGG Models

BMC Bioinformatics. 2010 Apr 29;11:213 COBRA(Constraint Based Reconstruction and Analysis)フレームワークに基づくゲノムスケールの代謝再構成は、生物の代謝能力を解析し、実験データを解釈するための貴重なツールである。このような再構成や解析手…

ヒトとマウスの ロングノンコーディングRNAのアノテーションをつける lncFunTK

ロングノンコーディングRNA(lncRNA)とは、200塩基より長いノンコーディング転写物を指す。現在までに、約58,000のlncRNAが様々な細胞型・組織に集積されているが、そのうち79%が新規性の高いものであり、その生物学的機能は未だ解明されておらず(Iyer et a…

ChIP-Atlas

代表的なモデル生物6種(ヒト、マウス、ラット、ミミズバエ、線虫、出芽酵母)から得られた公開されているクロマチン免疫沈降シークエンス(ChIP-seq)とDNase-seqデータ(n>70,000)を完全に統合し、ChIP-Atlas(http://chip-atlas.org)と名付けられたデー…

配列モチーフを探す STREME

配列モチーフ発見アルゴリズムは、DNA、RNA、タンパク質の配列中で生物学的機能を果たす新規な配列パターン、例えば、DNAやRNA結合タンパク質の結合部位モチーフを同定することができる。ここで紹介するSTREMEアルゴリズムは、精度と汎用性の両面で最先端のa…

タイプ株のゲノムデータベース gcType

微生物は世界で最も豊富な生物と言われている。原核生物細胞は地球上に約4〜6×10^30個存在し、350〜550×10^15gの炭素を含むバイオマスを構成していると推定されている(1)。原核生物の総数は10^9種にも及ぶ(2)。1980年には、約1800種の細菌・古細菌の種名が承…

Natural product生産ポテンシャルも含めてMLST解析を行うwebサービス autoMLST

細菌単離株の進化の背景を理解することは、幅広い研究への応用が期待される。しかし、正確な種の系統樹を作成することは依然として困難である。現在、種の同定には16S rDNAへの依存が一般的になっている。残念ながら、この普及している方法では、配列の保存…

トランスポーターのデータベース TCDB

膜輸送体は、細胞の分子組成やエネルギー状態を決定するチャネル、キャリア、ポンプ、group translocators、電子輸送体などの複雑なネットワークを形成する多様なタンパク質のグループを構成している(ref.1)。これらのタンパク質は、細胞内の全タンパク質の…

ヒトとマウスのショートオープンリーディングフレーム(sORF)のデータベース MetamORF

ハイスループット技術の開発により、ほとんどの真核生物のRNAにnon-canonicalなショートオープンリーディングフレーム(sORF)が存在することが明らかになった。これらは、種を超えて高度に保存されたユビキタスな遺伝的要素であり、多くの細胞プロセスに関…

GO enrichmet解析結果を視覚化する MonaGO

2020 11/10 誤字修正 MonaGOは、遺伝子オントロジー(GO)エンリッチメント解析を実行し、結果を可視化するための直感的でインタラクティブな応答性の高いインターフェイスを提供する、新しいウェブベースの可視化システムである。MonaGOは、ダイナミックな…

16S rRNA OTUピッキングと視覚化を行うデータベース OTUX

多くのマイクロバイオーム研究では、リファレンスベースのoperational taxonomic unit (OTU)picking法を採用しているが、一般的には、完全長16S rRNA遺伝子のクラスタリングによって同定されたリファレンスOTUをカタログ化したデータベースに依存している…

異なるphylogenetic cladesで保存されているタンパク質を検索するwebサービス PhyloGene

同じパスウェイ、タンパク質複合体、または同じ環境条件で機能するタンパク質は、系統発生クレード全体で類似した配列保存パターンを示すことがある。特定のタンパク質複合体またはパスウェイをもはや必要としない種では、これらのタンパク質は、グループと…

(植物)葉緑体ゲノム配列を自動で完全にアノテーションする CPGAVAS2

葉緑体ゲノムの完全長配列は、種の進化の歴史に関する豊富な情報を提供している。次世代シークエンシング技術の進展に伴い、葉緑体ゲノムの完全配列の数は飛躍的に増加すると予想されており、ゲノム配列をアノテーションするための強力な計算機ツールが急務…

de novo transcriptomeの系統解析と機能解析を行うwebツール TRAPID 2.0

ハイスループットシーケンシングの進歩は、RNA-Seqトランスクリプトームデータの膨大な増加をもたらした。しかし、特定の組織、状態、単細胞生物、微生物群集での迅速な遺伝子発現プロファイリングが期待されているが、新たな計算上の課題もある。リファレン…

(TCGA)インタラクティブな遺伝子発現解析のためのWebアプリケーション Phantasus

2020 10/25 追記 Phantasusは、視覚的でインタラクティブな遺伝子発現解析のためのウェブアプリケーションである。Phantasusは、ヒートマップの可視化と解析のためのWebベースのソフトウェアMorpheusをベースにしており、OpenCPU APIを介してR環境に統合され…

関連論文をネットワークに視覚化する CONNECTED PAPERS

Connected papersは、研究者や応用科学者が自分の研究分野に関連する論文を見つけて探索するのに役立つ、ユニークで視覚的なツールである。 論文のグラフは、その類似性に応じて配置される。つまり、直接引用し合っていない論文でも、強くつながりがあると、…

ペアでないデータの定量的な比較を行うwebサービス PlotsOfDifferences

異なる条件で得られたデータを定量的に比較することは、実験科学の重要な側面である。定量的比較のために最も広く使われている統計量はp値である。しかし、p値にはいくつかの欠点がある。定量的比較に関連する最も顕著な欠点は、p値が違いの大きさを伝えられ…

一般的なラボのデータ分析を高速化するshinyアプリケーション FaDA

RプログラミングShinyパッケージを用いて開発されたWebベースのデータ解析・可視化ツールが研究者に提案されることが増えている。これらのツールは、様々な視点からデータを解析したり、インタラクティブな可視化を提供したりするのに便利である。そのため、…

ドラフトゲノムからplasmidを検出する RFPlasmid

細菌の抗生物質耐性(AMR)遺伝子は、多くの場合プラスミド上に保持されており、これらのプラスミドは細菌間でAMR遺伝子を移行させることができる。分子疫学やリスク評価のためには、遺伝子が転写性の高いプラスミド上にあるのか、より安定した染色体上にあ…

入力プロテオームから類似したタンパク質のデータベースを自動検索し、プロテオームから近い種を調べる AAI-profiler

全ゲノムショットガンシーケンスは、分類学的分類の再評価を推進し、シングルセルゲノミクスの出現は生物多様性に関する知識を大きく広げている(1)。これらすべての応用分野において、分類学的分類に関するオリジナルの文献を検索するよりも、配列データを直…

Webベースのデータ分析プラットフォーム NASQAR

2020 9/6 追記 次世代シーケンシング(NGS)テクノロジーの急速な進歩により、ゲノムデータは近年大幅に成長している[ref.1、2]。一般的なアプリケーションには、de novoゲノムシーケンス;ゲノム変異、転写因子結合部位、クロマチン修飾、クロマチンアクセシ…