macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

web tool

入力プロテオームから類似したタンパク質のデータベースを自動検索し、プロテオームから近い種を調べる AAI-profiler

全ゲノムショットガンシーケンスは、分類学的分類の再評価を推進し、シングルセルゲノミクスの出現は生物多様性に関する知識を大きく広げている(1)。これらすべての応用分野において、分類学的分類に関するオリジナルの文献を検索するよりも、配列データを直…

Webベースのデータ分析プラットフォーム NASQAR

2020 9/6 追記 次世代シーケンシング(NGS)テクノロジーの急速な進歩により、ゲノムデータは近年大幅に成長している[ref.1、2]。一般的なアプリケーションには、de novoゲノムシーケンス;ゲノム変異、転写因子結合部位、クロマチン修飾、クロマチンアクセシ…

START App

RNAシーケンシング(RNAseq)を用いた転写プロファイリングは、シングルセルから組織全体に至るまで、様々な文脈でのグローバルな遺伝子発現パターンを定量化するための強力な手法として登場した。このプロファイリング技術によって生成された膨大な量のデー…

(microbial genomes)低分子量タンパク質のアノテーションを付ける SmORFinder

Sberroら(2019)が行った最近の研究により、ヒトマイクロバイオーム内に存在するスモールタンパク質の広大な未踏空間が明らかになった。現在のところ、これらの小さなオープンリーディングフレーム(smORF)は既存のリファレンスゲノムではアノテーションさ…

(コムギなど)倍数性ゲノムのホモログ特異的なプライマーを自動作成する AutoCloner

2020 7/27 誤字修正 小麦のような倍数性の生物は、分子生物学の最も単純な手順さえも複雑にしている。農作物のゲノム配列に関する知識は急速に増加しているが、研究者の間では、すべての種の完全な全ゲノムを作成するまでにはまだ長い道のりがある。そのため…

Linnean分類システムのランクに応じて分類学の系統を提供する分類学データベース Taxallnomy

あらゆる生物学的データは分類学的データと密接にリンクしており、いくつかのバイオインフォマティクス分析は目的を達成するために分類学的情報に依存している。メタゲノミクス、臨床法医学、その他の分野では、サンプル中に存在する生物を同定し、グループ…

Kmasker

多くの植物ゲノムは、高レベルのrepetitive sequencesを持っている。ハイスループットシーケンスリードを使用したこれらの複雑なゲノムのアセンブリは、依然として困難な作業である。これらのデータセットの repeat complexity を過小評価または無視すると、…

インタラクティブなオンラインの系統樹ツール Interactive Tree Of Life (iTOL) v4

2020 7/2 誤字修正 系統樹は、生物学やその他の科学分野において重要なツールであり、様々なデータタイプのコンテキスト化としても機能している。このことは、このような系統樹を作成するためのツールが頻繁に使われていることからもわかる(MEGA, (ref.2))。…

植物ゲノムの代謝遺伝子クラスターを検出する PhytoClust

代謝遺伝子クラスター(MGC)は、特定の代謝パスウェイのゲノム上で共局在し、潜在的に共制御される遺伝子である。細菌のオペロンとは対照的に、それらは単一の転写ユニットの制御下にはない。 MGCは真菌ゲノムによく見られ、MGCは植物の例外としてのみ発生…

バクテリアとアーキアのアミノ酸生合成パスウェイを調べる GapMind

ゲノム配列は何万もの微生物について利用可能である。これらの微生物のほとんどについては、分離された条件以外にその生理学についてはほとんど知られていない。また、酵母エキスのような複雑な基質を用いて単離された微生物の場合、その栄養所要量について…

動物(Metazoa)ミトコンドリアゲノムのアノテーション付けを行うウェブサーバー MITOS

信頼性の高い標準化されたゲノムアノテーションは、ゲノム配列データの系統的な比較解析に不可欠な前提条件である。これは、特に系統の再構成、ゲノムリアレンジメントのメカニズムの研究、配列変化の影響の調査に当てはまる。正確で偏りのないアノテーショ…

rRNA配列を探索し、分類、ツリー表示するSILVAのACTサービス

2020 6/19 説明追加 相同配列の解析では、マルチプルシーケンスアラインメント(MSA)の計算がボトルネックになっている。特にリボソームRNA(rRNA)のようなマーカー遺伝子の場合、数百万の配列がすでに公開されており、個々の研究で数十万の新しい配列を簡…

ウイルス性因子をゲノムから探索する VFDBデータベースのVFanalyzer

ウイルス性因子データベース(VFDB、http://www.mgc.ac.cn/VFs/)は、細菌の病原性を解読するための包括的なアーカイブとオンラインプラットフォームを研究者に提供することに専念している。ウイルス性因子(VF)の様々な組み合わせ、組織、および発現は、病…

IQ-TREE をwebで使える W-IQ-TREE

IQ-TREEはTREE-PUZZLEの後継プログラムであり、大規模な系統樹データの最尤解析を行うための効率的で汎用性の高い系統樹ソフトウェアである。IQ-TREEは効率的にツリー空間を探索し、RAxMLやPhyMLよりも高い尤度を達成することが多い。IQ-TREEの他の重要な特…

ジッタープロットを作成する SinaPlot

データ駆動型サイエンスの最近の発展により、研究者は複数のソースからのデータを、多様な実験手順やデータベース上で統合するようになった。特にデータポイントの数がクラス間で異なる場合、データを正確に可視化する上で大きな課題となっている。サンプル…

最小スパニングツリーの計算と視覚化を行う GrapeTree

2020 6/5 誤字修正 2020 6/8 追記 7つのハウスキーピング遺伝子に基づくレガシーMLST(multilocus sequence typing)は20年前に導入され(Maiden et al. 1998)、現在では多数の細菌病原体の特徴付けに日常的に使用されている(Jolley and Maiden 2014)。MLSTは、…

全ゲノムプロットをインタラクティブに作成するShinyアプケーション shinyChromosome

2020 5/14 フィーチャー => 観測値に変更 全ゲノムの非環状プロットは、全染色体に沿って配列されたゲノムデータを自然に表現したものである。現在のところ、非環状の全ゲノム図を作成するために設計された専用のグラフィカル・ユーザー・インターフェース(…

グラフィカルなリソース監視ツール Netdata

2020 5/8 説明追加 Netdata は、システムやアプリケーションのパフォーマンスをリアルタイムで監視する監視エージェントである。Netdata を使うと、非常にインタラクティブな Web ダッシュボードを使用して、実行中のシステム (Web サーバ、データベース、ア…

インタラクティブな主成分分析webサービスによってRNA seqデータを分析する PCAGO

過去10年の間に、全トランスクリプトームのシークエンス(RNA-Seq)は、多様な分子機構を理解し、様々な生物学的問題に取り組むための強力な技術として浮上してきた。RNA-Seq実験の初期段階では、異なる遺伝子発現レベルに基づいた生物学的サンプルの初期特…

多変量データのクラスタリングと可視化を行うwebサービス ClustVis

2020 4/30 文章修正、タイトル修正 ハイスループット実験の出現により、研究者はしばしば多変量データに直面している。これらは、通常、行列として提示される。この種のデータは様々なソースから得られることがあり、例えば、特定の遺伝的パスウェイを調べる…

GO annotation分析ウェブサービス WEGO2

2020 4/26 タイトル修正 WEGO (Web Gene Ontology Annotation Plot) は、2006年に発表された、GO (Gene Ontology) のアノテーション結果を可視化、比較、プロットするためのシンプルで便利なツールである。ハイスループットシーケンシングの急速な発展とGOの…

パスウェイデータベース間の共通性を探索、分析、キュレーションする ComPath

パスウェイは生物系の解析や表現に広く利用されているが、明確な境界線がなく、多数のデータベースに分散しており、相互運用性がないため、それらの間の網羅性、一致性、不一致を評価することができない。本研究では、データベース間のパスウェイマッピング…

ガン変異のCoMut plotを出力する CoMutPlotter

CoMut plotは、ガン研究のpublicationsで、ガンコホートにおける突然変異の分布を視覚的に要約したものとして広く使用されている。この要約プロットは、遺伝子変異率とサンプルの変異負担を関連する臨床的詳細とともに調べることができ、サンプル間の遺伝子…

ShinyCNV(立ち上げだけ紹介)

体細胞コピー数変化(CNV)は、ガンの開始、進行および再発において重要である(Caren et al、2010;Mullighan et al、2007;Mullighan et al、2009;Weir et al、2007)。ガンゲノム研究において、高密度一塩基多型(SNP)アレイは、従来の細胞遺伝学的カリ…

vcfをmafに変換する vcf2maf

2020 4/17 画面表示バグ修正, インストール手順修正 vcf2mafはVCFをMutation Annotation Format (MAF)に変換し、各バリアントがすべての可能な遺伝子アイソフォームのうちの1つだけにアノテーションする。VCFをMAFに変換するためには、各バリアントはそれが…

シーケンシング技術と解析フローチャートを学ぶためのナリッジベース SequencEnG

次世代シークエンシング(NGS)技術は、ゲノムおよびエピゲノムプロファイルを生成するための強力な方法を提供することで、生物医学研究に革命をもたらしている。この急速な進歩により、学生や研究者にとって、利用可能な数多くの方法を熟知しておくことが喫…

トキシン・アンチトキシンデータベース TADB 2.0

トキシン・アンチトキシン(TA)系は、最初はプラスミド中毒(addiction)モジュールとして同定されたが、ほとんどの自由に生きている細菌の染色体上に非常に豊富に存在する。TA系は、栄養飢餓(ref.1,2)、プログラムされた細胞死(ref.3)、バクテリオファージ…

REVIGO

今日のハイスループット実験では、マイクロアレイ、RNA-Seq、またはさまざまなプロテオミクス手法を使用して、数千の遺伝子の発現を同時に測定している。 ChIP-on-chipまたはChIP-Seq実験は、特定のタンパク質のゲノム全体のDNA結合パターンを決定するために…

全工程が自動化された高速なRNA seq解析webサービス RaNA-Seq(60以上のモデル生物に対応)

2020 4/10 タイトル修正、説明と図追加 RaNA-Seqは、RNA-Seqデータを迅速に解析・可視化するためのクラウドプラットフォームである。FASTQファイルの定量、品質管理指標の計算、発現変動遺伝子の解析の実行、機能解析による結果の説明を可能にすることで、数…

植物遺伝子のファミリー分類とエンリッチメント解析を行うwebサービス GenFam

ハイスループットシーケンシング(HTS)技術を用いたゲノムスケールの研究では、様々な実験条件で発現が異なる遺伝子のリストが作成されている。これらの遺伝子リストは、下流の機能的遺伝学的解析を導くために、生物学的に関連する遺伝子と関連する機能を絞…