macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

Nucleic Acids Research

NCBI Genome のBrowse by Organism機能

ハイスループットシークエンシング技術の普及により、NCBIなどの塩基配列データベースに登録されるゲノム数は爆発的に増大している。BLAST検索をやり直したら少し前は無かったゲノム情報が出てきた、という話も度々耳にする。特にバクテリアやアーキアはゲノ…

バクテリアゲノムの比較ゲノム解析を行うwebサービス EDGAR

Bergey's Manual of Systematics of Archaea and Bacteriaより 次世代シークエンシングアプローチの展開により、完全にシークエンシングされたゲノムの数は急速に増加している。その結果、単一ゲノムだけでなく、関連する大規模なゲノム群を比較的に解析する…

入力プロテオームから類似したタンパク質のデータベースを自動検索し、プロテオームから近い種を調べる AAI-profiler

全ゲノムショットガンシーケンスは、分類学的分類の再評価を推進し、シングルセルゲノミクスの出現は生物多様性に関する知識を大きく広げている(1)。これらすべての応用分野において、分類学的分類に関するオリジナルの文献を検索するよりも、配列データを直…

動物ミトコンドリアゲノムのアセンブリとアノテーションのパイプライン MitoZ

ハイスループットシーケンシング(HTS)技術の登場により、系統樹や生物多様性のモニタリング研究において、大規模な核酸シーケンシングが日常的に行われる時代になってきている。例えば、複雑なDNA抽出物(環境DNA(eDNA)など)を利用したメタバーコーディ…

複数の系統的証拠を利用してオルソログとパラログを予測する MetaPhOrs

2020 8/17 追記と誤字修正 異なる種の遺伝子間の相同性関係を推定することは、比較ゲノム学の中心的な課題である。そのため、長年にわたって多くのリソースと方法が開発されてきた。公開されているデータベースの中には、相同な遺伝子ファミリーの系統樹が含…

インタラクティブなオンラインの系統樹ツール Interactive Tree Of Life (iTOL) v4

2020 7/2 誤字修正 系統樹は、生物学やその他の科学分野において重要なツールであり、様々なデータタイプのコンテキスト化としても機能している。このことは、このような系統樹を作成するためのツールが頻繁に使われていることからもわかる(MEGA, (ref.2))。…

植物ゲノムの代謝遺伝子クラスターを検出する PhytoClust

代謝遺伝子クラスター(MGC)は、特定の代謝パスウェイのゲノム上で共局在し、潜在的に共制御される遺伝子である。細菌のオペロンとは対照的に、それらは単一の転写ユニットの制御下にはない。 MGCは真菌ゲノムによく見られ、MGCは植物の例外としてのみ発生…

ゲノム間のシンテニー領域を調べる MCScanX

2020 6/21 タイトル変更 MCScanは、複数のゲノムまたはサブゲノムをスキャンして、相同性のあると思われる染色体領域を特定し、遺伝子をアンカーにしてこれらの領域を整列させることができるアルゴリズムである。MCScanXツールキットは、syntenyとcollineari…

ウイルス性因子をゲノムから探索する VFDBデータベースのVFanalyzer

ウイルス性因子データベース(VFDB、http://www.mgc.ac.cn/VFs/)は、細菌の病原性を解読するための包括的なアーカイブとオンラインプラットフォームを研究者に提供することに専念している。ウイルス性因子(VF)の様々な組み合わせ、組織、および発現は、病…

IQ-TREE をwebで使える W-IQ-TREE

IQ-TREEはTREE-PUZZLEの後継プログラムであり、大規模な系統樹データの最尤解析を行うための効率的で汎用性の高い系統樹ソフトウェアである。IQ-TREEは効率的にツリー空間を探索し、RAxMLやPhyMLよりも高い尤度を達成することが多い。IQ-TREEの他の重要な特…

糖質活性酵素(CAZymes)のアノテーションを行うdbCAN2 webサーバーと、ローカルでアノテーション を行う run_dbcan

炭水化物は、核酸、タンパク質、脂質とともにすべての細胞に存在する4つの主要な生体高分子の1つである。炭水化物には、単糖類、オリゴ糖、多糖類がある。糖タンパク質や糖脂質などの他の生体高分子に糖質が共有結合したハイブリッド生体高分子は、糖質複合…

多変量データのクラスタリングと可視化を行うwebサービス ClustVis

2020 4/30 文章修正、タイトル修正 ハイスループット実験の出現により、研究者はしばしば多変量データに直面している。これらは、通常、行列として提示される。この種のデータは様々なソースから得られることがあり、例えば、特定の遺伝的パスウェイを調べる…

GO annotation分析ウェブサービス WEGO2

2020 4/26 タイトル修正 WEGO (Web Gene Ontology Annotation Plot) は、2006年に発表された、GO (Gene Ontology) のアノテーション結果を可視化、比較、プロットするためのシンプルで便利なツールである。ハイスループットシーケンシングの急速な発展とGOの…

トキシン・アンチトキシンデータベース TADB 2.0

トキシン・アンチトキシン(TA)系は、最初はプラスミド中毒(addiction)モジュールとして同定されたが、ほとんどの自由に生きている細菌の染色体上に非常に豊富に存在する。TA系は、栄養飢餓(ref.1,2)、プログラムされた細胞死(ref.3)、バクテリオファージ…

オルガネラゲノムをターゲットアセンブリする NOVOPlasty

次世代シークエンシング(NGS)技術の進化により、様々なアセンブルアルゴリズムが開発されてきたが、オルガネラゲノムのアセンブルに焦点を当てたものはほとんどない。これらのゲノムは、系統研究や食品の同定に利用されており、GenBankに登録されている真…

ゲノムから周期的なリピート配列を検出する SPADE

周期的に繰り返されるDNAやタンパク質要素は、ゲノムの進化、遺伝子制御、タンパク質複合体の形成、免疫を含む様々な重要な生物学的事象に関与している。特筆すべきは、現在使用されているZFNs、TALENs、CRISPRsなどのゲノム編集ツールも、すべて天然の生物…

パスウェイデータベース PathBank

2020 2/11 誤字修正 パスウェイマップは、分子生物学のロードマップである。ロードマップが村、町、都市間のつながりを示すように、パスウェイマップは遺伝子、タンパク質、代謝産物間のつながりを示す。よく描かれたパスウェイマップは、複雑な分子プロセス…

Genome properties (GP)

現代のDNAシーケンシング技術は、単離した生物のみならず、生物のコレクション(メタゲノミクス)のDNA配列を決定する能力に革命をもたらした。一握りの特徴づけられた配列から新規ゲノムにコードされた遺伝子への自動アノテーションは、特に原核生物ゲノムで…

KEGGのパスウェイアノテーションwebサービス KAAS

2020 2/6 タイトル修正 近年、完全(complete)なゲノムとドラフトゲノムの数は急速に増加しており、これらのゲノムの遺伝子の機能的特性と生物学的役割の特定を自動化することがますます重要になっている。 KEGGデータベースでは、Smith–Watermanスコアを使…

体細胞コピー数変化イベントを調べるFACETSをワンライナーで実行するcnv_facets

2019 12/27 誤字修正 Cancer Genome Atlas(TCGA)およびInternational Cancer Genome Consortium(ICGC)プロジェクトを含む大規模なシーケンス研究により、腫瘍と正常なサンプルペアの何万もの全ゲノム(WGS)および全エキソーム(WES)が生成された。対立…

HMMER web server

シーケンスの類似性を検出するためのプロファイル隠れマルコフモデル(HMM)の使用は広く普及している。それらの人気は、いくつかの関連およびアラインされた配列を使用してプロファイルHMMを構築できるという事実に由来し、それを使用して大きなシーケンス…

既知生合成遺伝子クラスターのデータベース MIBiG 2.0

植物、微生物、菌類は、多くの場合、1つまたはいくつかの種にユニークな多種多様な特殊な代謝物を生成する。文明の夜明けから、人間は薬用、経済的、またはレクリエーション目的でこの宝の山を利用している。過去10年以内に、ゲノムに基づいた特殊な代謝産物…

GenBankから配列やアノテーションを取り出すWebサービス FeatureExtract

イントロン/エクソン構造、プロモーター領域の内容、上流域および下流域における他の遺伝子の位置など、DNA配列の特徴のアノテーションに簡単にアクセスできることは、多くの生物学的問題に取り組むことが非常に有益である。たとえば、遺伝子内のイントロン…

ノンスペシャリストのための堅牢なphylogenetic analysis webサービス Phylogeny.fr

系統解析は、生物学の多くの研究分野の中心であり、通常、相同な配列の同定、それらのマルチプルアライメント、系統樹再構築、および推定されたツリーのグラフィカルな表現を伴う。 Phylogeny.frプラットフォームは、これらのタスクを自動的に実行するプログ…

プラスミドの分析と視覚化のwebサービス Plasmid ATLAS

2019 11/8 pATLASflow紹介リンク追加 プラスミドは、mobile genetic elements(MGE)として分類されるchromosome外遺伝因子であり、細菌間で自己複製および転移する能力があるため、遺伝子の水平伝播において極めて重要な役割を果たしている(ref.1〜3)。プ…

植物の生合成遺伝子クラスターを予測するwebサービス plantiSMASH

バクテリア、菌類、植物は、それぞれが関与する多様な生物間相互作用において、地球全体で独自の特定の生態学的役割を持つ特殊な代謝産物の非常に多様性を生み出している。この多様な特殊な代謝は、医薬品、農業、製造業で広く使用されている天然物の豊富な…

ノンスペシャリストのための系統解析webサービス NGPhylogeny.fr

系統樹の推論と解釈は、広範囲の生物学的領域(比較ゲノミクス、機能予測、メタゲノミクス、種同定、分類学、分子疫学、集団遺伝学など)を対象とする多数の研究で必要となる。Phylogeny.fr(ref.1)はもともと、次の手順に基づいてワークフローを実装するこ…

GTDBのオンライン系統樹 AnnoTree

2019 11/6 タイトル修正、説明追加 重要な生物学的および進化的洞察は、種の系統発生にわたる遺伝子および機能的アノテーションの有無を調査することにより生成できる。これらには、予期しない taxonomic occurrences の特定(ref.1)、遺伝子の進化的起源の…

eggNOG データベース

eggNOG 5.0のペーパーより 分化イベント後に共通の祖先から分岐したオルソログを同定することは、分子生物学および進化生物学における基本的な課題である。 duplication eventの後に分岐した配列であるパラログと比較して、オルソログは長い進化的タイムスケ…

パンゲノム解析を行うためのprokaryotesゲノム情報のデータベース proGenomes2

2019 10/27 twitter追記2 019 10/27 ブラウザについて追記 大規模ゲノミクスは、微生物の理解を深めるために役立っている。微生物学は、数千のシーケンスされたゲノムを利用できるデータ集約型の分野に発展した(ref.1–3)。過去20年以上にわたり、シークエ…