macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

web tool

(植物など)ゲノムアセンブリとアノテーションのクオリティを分析するwebサーバー GenomeQC

過去数十年にわたって、Genlisea aureaの63 Mb [ref.1]からPinus taedaの22 Gb [ref.2]までのサイズの多数の植物ゲノムアセンブリが生成された。このようなプロジェクトから生成されたゲノムリソースは、改良された作物品種の開発に貢献し、ゲノムサイズ、構…

メタゲノムのtaxonomic assignmentと定量を行う CCMetagen

環境試料および宿主関連試料(メタゲノミクスおよびメタトランスクリプトミクス)のDNAおよびRNAのハイスループットシークエンシングは、どの生物が試料中に存在するかを評価するための強力なツールである。Taxonomy同定ソフトウェアは通常、個々のショート…

バクテリア/アーキアの高速なアノテーションパイプライン DFAST

本著者らはパブリックシーケンスデータベースへのゲノム送信をサポートする原核生物ゲノムアノテーションパイプラインDFASTを開発した。 DFASTは元々オンラインアノテーションサーバーとして開始され、現在までに(論文執筆時点)、2016年の最初の立ち上げ以…

ヒトのバリアントを視覚化したりフィルタリングできるwebツール VCF/Plotein

エクソームシークエンシング(ES)は、多数のヒト表現型および疾患に寄与する遺伝的変異を同定することにおいて非常に成功している (Gilissen et al., 2011; Do et al., 2012).。しかしながら、疾患を引き起こす変異および突然変異を同定する実際のプロセス…

共通/非共通の要素をベン図で視覚化し、抽出する jvenn

ハイスループットの生物学は、ますます複雑な実験計画で、データの数を増やしている。これらのデータの分析では、多くの場合、遺伝子名やOTU(Operational Taxonomic Unit)を含む生物学的識別子のリストが生成される。これらは異なる方法(微分分析)または…

Human Phenotype Ontology (HPO)データベース(Exomiserについて紹介)

鑑別診断 (differential diagnostics, wiki) およびトランスレーショナルリサーチの基盤となるのは、詳細な表現型の特定である: 詳細な個々の臨床異常のコンピューター分析である(ref.1,2)。 Human Phenotype Ontology(HPO, wiki)は、計算によるdeep phe…

miRNAとそのターゲット遺伝子のデータベース miRTarBase

MicroRNA(miRNA)は、18〜25ヌクレオチドの小さな非コーディングRNAであり、動物と植物の両方で転写後レベルの中心的な調節因子である。 miRNAとそのターゲットmRNAの完全またはほぼ完全な相補的結合は、mRNAの分解を促進したり、mRNAの翻訳を抑制したりし…

タンパク質相互作用を調べる BioGRID

大量の個々のタンパク質または遺伝的相互作用、およびRNA、DNA、膜、炭水化物、低分子代謝産物の相互作用から集約された生物学的相互作用ネットワークは、遺伝子と表現型の関係およびすべての細胞の機構的基盤を理解するためのフレームワークとして機能する…

タンパク質のホモリピートを分析するwebサーバー dAPE

Low Complexity(LC)は、タンパク質中のタンデムリピートおよびcompositionally biased regions(CBR)のようなアミノ酸組成にほとんど多様性がない領域を説明するために使用される一般用語である。ホモリピート、またはpolyX領域は、単一のアミノ酸残基の…

ONTのロングリードから抗生物質耐性遺伝子の分布を調べるwebサーバー NanoARG

薬剤耐性(AMR)は、感染症を予防および治療する能力を損ない、世界的な公衆衛生の脅威になる[ref.1]。現在、抗生物質耐性による世界中の年間死亡者数は、2050年までに1,000万人を超えると推定されている[ref.2]。これに対応して、多くの国内および国際機関…

バクテリア/アーキアのゲノム距離を計算するwebツール GGDC

DNA-DNAハイブリダイゼーション(DDH)は、古細菌および細菌種の描写のための分類学的ゴールドスタンダードとして現在も使用されているウェットラボ法である。 2つのそれぞれの生物のゲノムDNAがDDHの類似性が70%未満であることが明らかになった場合、これ…

ユーザー指定の文献リストを使って文献を仕分ける分類器 BioReader

現在、生物医学科学が直面している「ビッグデータ問題」は、分析能力を超えるゲノム配列、プロテオミクス、トランスクリプトームおよびメタゲノムプロファイルなどの大量のraw biological dataによるものである。生物医学文献でも同様の傾向が観察されている…

tRNA配列を比較する tRNAviz

比較研究および豊富なシーケンシングに基づく分子アッセイに何千ものゲノムが利用可能な現在、tRNA遺伝子の全相補体がどのように展開され調節されるかについての我々の理解が進んでいる。トランスファーRNA(tRNA)はタンパク質翻訳の中心であり、さまざまな…

Functional enrichment analysisとID変換を行う g:Profiler

2019 9/12 誤字修正、おかしな文章削除 ハイスループット研究からの遺伝子リストの解釈には、最新のデータに基づいた有能で便利なツールが必要である。 Enrichr(ref.1)、WebGestalt(ref.2)、Metascape(ref.3)、KOBAS(ref.4)、AgriGO(ref.5)などのf…

興味があるタンパク質情報を文献やデータベースからマイニングする PaperBLAST

ゲノムシーケンスは、タンパク質の機能が決定される速度をはるかに超えて、新規タンパク質の発見を加速している(ref,1)。ゲノムシーケンスを解釈し、これらの予測されたタンパク質の役割のアノテーションを付けるには、新規タンパク質と特徴付けられたタン…

DAVID

2019 10/20 誤字修正 従来の生物学的研究アプローチでは、通常、一度に1つの遺伝子またはいくつかの遺伝子を研究する。対照的に、ハイスループットゲノム、プロテオミクス、およびバイオインフォマティクススキャニングアプローチ(発現マイクロアレイ、プロ…

NCBI GEO のRNA-seqデータを分析する GREIN

RNA-seqデータセットをGene Expression Omnibus(GEO)およびSequence Read Archive(SRA)のリポジトリに保存すると、公開されている研究の再現性が保証され、再利用が容易になる。これらのデータの再分析は、新しい科学的洞察をもたらす可能性があり、新し…

STRINGデータベース

個々のタンパク質の構造的および機能的情報が蓄積されているが(ref.1–3)、それらの相互作用に関する知識は断片化されたままになっている。いくつかの相互作用は、たとえばlarge cellular machineries(ref.4〜6)の3次元再構築のコンテキストで非常によく…

Uniprotデータベースに対する高速なタンパク質ホモロジーサーチを行う SANSparallel

近年、シーケンスの数が著しく増加している。これにより、データベース検索(ref.1〜4)がますます長くなり、無料のコンピューティングサービスと事前に計算されたデータベースが閉鎖に追い込まれたりまたは依存するようにクラウドソーシング(ref.5〜7)に…

GOアノテーション間の関係と類似性を調べるwebサーバー NaviGO

遺伝子の機能解明は、バイオインフォマティクスを含む現代の生物学における中心的な問題の1つである。体系的な機能的アノテーションのために、GOは遺伝子機能の語彙(以後、term)として広く使われている[ref.1]。 GO termは、term間の親の関係が表されてい…

Functional annotationを行うwebサーバー PANNZER2

正確なfunctional annotationを持つタンパク質は、生物学的研究に不可欠である。残念ながら、タンパク質配列の大部分は機能的に特徴付けられていない。つまり、実験的に検証されたアノテーションはない。ハイスループットシーケンスの進歩により、シーケンス…

UniProt のUniRef データベース

UniRefデータベース (UniProt Reference Clusters) は、UniProtナレッジベースと選択されたUniParcレコード(UniParc link)からクラスター化されたシーケンスセットを提供し、複数の解像度(100%、90%、50%の同一性)でシーケンススペースを完全にカバー…

Gene Ontologyデータベース AmiGO2

AmiGOのペーパーより Gene Ontologyプロジェクト[GO(http://www.geneontology.org); Gene Ontology Consortium、2000]は、構造化された統制語彙、またはオントロジーを開発し、遺伝子およびその産物(遺伝子産物)の基本的な特性を種に依存しない方法で記…

Functional annotationを行うwebサーバー GO FEAT

2019 8/17 タイトル修正 、tips追記 ゲノムデータおよびトランスクリプトームデータに生物学的意味を与えることは、特にハイスループットテクノロジーによって生成される大量のデータと、この目的のために開発されたツール、Webサーバー、およびデータベース…

FASTA配列のオンラインツールボックス FaBox

FaBoxは、生物学者や医学研究者がシーケンスデータを使用して典型的なタスクを迅速に実行できるようにする、シンプルで直感的なWebサービスのコレクションである。 このサービスを使用すると、シーケンスヘッダーを簡単に抽出、編集、置換し、ヘッダー情報に…

ヒトとマウスの様々なアライナー用indexをダウンロードできる Refgenie

2019 8/15 リンク追記 リファレンスゲノムの構築とキュレーションに多大な努力が注がれている (ref.1–5)。これらのリファレンスアセンブリは結果を比較するための共通の表現を提供し、それらはシーケンスアラインメントとアノテーションを行う広範囲の下流ツ…

PGAPとPGAP-Xを組み込んだバクテリアのパンゲノム解析webサーバー PGAweb

2019 7/21追記 2019 10/2 コードエラー修正 "PGAP-X: extension on pan-genome analysis pipeline"より パンゲノムの概念は2005年に提案されて以来[ref.1、2]、過去10年間でバクテリアゲノムの進化と動態を調査するために急速に採用されてきた[ref.3、6]。最…

アセンブリ配列の16S rRNA相同性からシーケンシングデータの汚染を素早く見積もる ContEst16S

近年、次世代シークエンシング(NGS)と呼ばれる新しいDNAシークエンシング技術の開発により、ゲノムシークエンシングのコストと時間が劇的に減少した。現在、publicデータベースの原核生物ゲノム配列数は約7万に達している(論文執筆時点)。大規模ゲノムデ…

バクテリアの表現型情報データベース BacDive

原核生物は、研究開発との関連性が高い多種多様な表現型形質を発現する。バクテリアのメタデータのホットスポットとしてよく利用できるのは、最初の(一次)文献で報告された種の説明と、生物資源センター(BRC)によって管理されているデータベースである(…

メタゲノムcontigのビニングとアノテーションwebサーバー BusyBee Web

メタゲノムシーケンシング、すなわち微生物混合群集から無差別に抽出されたDNAの全ゲノムシーケンシングは、分類学的組成および環境マイクロバイオームの機能的可能性を研究するために首尾よく使用されてきた(ref.1-4)。従来の単離培養工程の独立性は、費…