macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

database

ユーザー指定の文献リストを使って文献を仕分ける分類器 BioReader

現在、生物医学科学が直面している「ビッグデータ問題」は、分析能力を超えるゲノム配列、プロテオミクス、トランスクリプトームおよびメタゲノムプロファイルなどの大量のraw biological dataによるものである。生物医学文献でも同様の傾向が観察されている…

DAVID

従来の生物学的研究アプローチでは、通常、一度に1つの遺伝子またはいくつかの遺伝子を研究する。対照的に、ハイスループットゲノム、プロテオミクス、およびバイオインフォマティクススキャニングアプローチ(発現マイクロアレイ、プロモーターマイクロアレ…

UniProtKBデータベースを3つのレベルでクラスタリングした Uniclust データベース

UniProt(ref.1)やGenBank(ref.2)などの公共データベースのタンパク質配列の数は、さまざまな大規模ゲノミクスプロジェクト(ref.3〜5)のために急速に増加している。急速な成長により、多くのアプリケーションが代表的なサブセットで動作するようになっ…

STRINGデータベース

個々のタンパク質の構造的および機能的情報が蓄積されているが(ref.1–3)、それらの相互作用に関する知識は断片化されたままになっている。いくつかの相互作用は、たとえばlarge cellular machineries(ref.4〜6)の3次元再構築のコンテキストで非常によく…

UniProt のUniRef データベース

UniRefデータベース (UniProt Reference Clusters) は、UniProtナレッジベースと選択されたUniParcレコード(UniParc link)からクラスター化されたシーケンスセットを提供し、複数の解像度(100%、90%、50%の同一性)でシーケンススペースを完全にカバー…

Gene Ontologyデータベース AmiGO2

AmiGOのペーパーより Gene Ontologyプロジェクト[GO(http://www.geneontology.org); Gene Ontology Consortium、2000]は、構造化された統制語彙、またはオントロジーを開発し、遺伝子およびその産物(遺伝子産物)の基本的な特性を種に依存しない方法で記…

ヒトとマウスの様々なアライナー用indexをダウンロードできる Refgenie

2019 8/15 リンク追記 リファレンスゲノムの構築とキュレーションに多大な努力が注がれている (ref.1–5)。これらのリファレンスアセンブリは結果を比較するための共通の表現を提供し、それらはシーケンスアラインメントとアノテーションを行う広範囲の下流ツ…

バクテリアの表現型情報データベース BacDive

原核生物は、研究開発との関連性が高い多種多様な表現型形質を発現する。バクテリアのメタデータのホットスポットとしてよく利用できるのは、最初の(一次)文献で報告された種の説明と、生物資源センター(BRC)によって管理されているデータベースである(…

メタバーコディングのデータベース配列キュレーションなどを行うツールキット MetaCurator

配列ベースの生物学的コミュニティの特徴付けの過程において、配列の教師ありのtaxonomic classification は重要な目標である。多数の配列分類ソフトウェアプログラムは、配列類似性を測り、そして配列類似性と分類学的所属との間の関係をモデル化することに…

バクテリア、アーキア、プラスミドの複製起点(ori)データベース DoriC

2019 6/21 誤字修正、コマンド修正 すべての生物において、DNA複製は複製機構の構築段階で正確に制御されている(ref.1)。複製起点は特定のゲノム遺伝子座であり、そこでは二本鎖DNAがほどけて一本鎖DNA鋳型を形成して新しい鎖の合成を開始する。大部分の細…

ホモログ及びオルソログタンパク質を検索するwebデータベース orthoFind

相同配列を見つけることは、機能転移によるタンパク質の機能的アノテーションを可能にし、これらの配列が共通の進化起源を有するために推論され、そして進化研究の支持としてしばしば使用される[ref.1−3]。ホモログ内では、オルソログは種分化事象から進…

複数データベースを統合した包括的な薬剤耐性遺伝子データベース ARGminer

2019 5/4 タイトル修正 薬剤耐性(AMR)は、世界保健機関(WHO)によって世界規模の主要な健康上の脅威として認識されている。 AMRは2050年までに指数関数的に増加し、実質的なヒトの罹患率と死亡率をかなり増やすと予測されている。したがって、モニタリン…

SRAのRNA seqデータを素早く比較・分析する Digital expression explorer 2(手持ちのデータにも対応)

10年前の最初の記述以来、RNAシーケンス(RNA-seq)はトランスクリプトームにおける強力な方法となり、非常に正確な遺伝子発現の定量を可能にした[ref.1]。シークエンシングのコストが下がるにつれて、RNA seqのデータは科学文献でより一般的になりつつある…

種の形質をコレクションするデータベース Traitpedia

種はそれらの遺伝子型および表現型によって一義的に定義することができる。この遺伝子型および表現型は非常に密接に絡み合っており、追加の環境コンポーネントがこの関係の広い理解を複雑にしている。表現型、または形質は、生物の遺伝情報にある程度依存し…

2005-2017年の各大学のバイオイオンフォマティクス系論文出版数と内容を視覚化した BIOLITMAP

科学および技術のさまざまな分野の科学的貢献に価値を置くことがますます重要になっている。バイオインフォマティクスの急速な発展とその本質的な学際的性質のために、さまざまな応用分野や機関の貢献がどのように発展しているかを視覚化することは特に難し…

表現型や遺伝子情報からどんな菌かを絞り込めるwebツール BaFF

現在のシナリオでは、生物学的データの大量生成は、特に原核生物のような多数の生物に関していくつかの実験的および計算技術の結果として、ますます一般的になっている。例えば、メタゲノミクス実験からは、所与の試料(例えば、腸、海水など)中でDNA断片か…

バクテリアとアーキアのデータベース EzBioCloud

2019 7/5 関連ツール追記について追記 現代のバクテリアと古細菌の分類学の目標の1つは種の客観的定義である。分類を決定するプロセスは、新しいテクノロジーの出現により、時とともに継続的に改善されてきた。 PCRとそれに続く16S rRNA遺伝子のシークエンシ…

review article要約 16Sアンプリコンシーケンシングによる微生物コミュニティの定量

いくつかの例を挙げると、微生物群集は、地球規模の元素循環、排水処理プラントでの廃棄物除去、およびバイオガスプラントでのメタン生産を促進する、多くの自然および人工生態系における隠れたチャンピオンである。これらのシステムを理解しモデル化するた…

冗長性がある配列データベースに対する正確なリードアライメントを行う KMA

バイオインフォマティクスで最も古く、おそらく最も重要なツールは1つ以上の配列のアライメントである。アライメントは、ある配列が別の配列とどの程度類似しているかを知らせ、類似の配列パターンの存在量を定量化するために使用できる。見つかったパターン…

k-merベースのスケーラブルなメタゲノムの全配列比較ツール Libra

ショットガンメタゲノミクスは、微生物群集の生物多様性と機能に対する強力な洞察を提供する。しかしながら、メタゲノム研究からの推論は、データセットのサイズと複雑さや既存のデータベースの可用性と完全性によって制限される。 de novo比較メタゲノミク…

NCBIデータベースをダウンロードする ncbi-blast-dbs

2018 12/10 タイトル訂正 ncbi-blast-dbsはデータベースファイルを並行してダウンロードすることで、NCBIのデータベースをローカルに用意するのにかかる時間を短縮する。使用するスレッド数は自動的に決定される。 MD5チェックサムが検証され、ダウンロード…

de novo transcriptomeのアノテーションツール dammit

dammitは、単純なde novo transcriptome annotatorである。 アノテーションのプロセスの個々の部分は全てすでに存在しているが、既存の解決策は過度に複雑であるか、または無駄な非フリーソフトウェアに依存しているという観測から生まれた。 dammitは無料で…

ターゲットキャプチャシーケンシングをシミュレートする capsim

高スループットシークエンシング(HTS)は、費用対効果が高く時間効率の良いサンプルの完全な遺伝情報を得る能力を持ち、ゲノム研究に大きく革命をもたらした。多くの臨床応用において、作用可能な領域のパネルのみが調査対象である(Bellos et al、2014; Sa…

32のバクテリアの1万以上の機能未知遺伝子欠損の影響をまとめた Fitness Browser

注意: タイトルには 機能未知遺伝子だけ相手にしたように書いてますが、実験はゲノム全体の遺伝子をターゲットにランダムかつ網羅的に行われており、mutant phenotypeの影響を調べた遺伝子数自体は1万よりずっと多くなります。実験結果をまとめたFitness Br…

バイオインフォマティクスデータの検索と分析サイト Datasets2Tools

ウェブの導入により、研究成果の伝統的な印刷出版物のソフトウェアベースの拡張が可能になった。a)研究論文をより簡単にコピー及び配布できるよりソフトウエアベースでpublishできる。 b)研究によって収集されたデータは、再利用および統合的で遡った(ret…

解析内容などから適したインフォマティクスツールを探せる Bio-TDS

バイオインフォマティクスと計算生物学は、バイオサイエンスとバイオメディカル研究において重要な役割を果たす。研究者が実験プロジェクトを設計する際には、データから新しい知識発見に至る最も関連性の高いバイオインフォマティクスツールキットを見つけ…

既知の二次代謝産物生合成遺伝子クラスターを検出する antiSMASH

2019 6/17 インストール追記 二次代謝産物または特殊代謝産物とも呼ばれる天然の産物(Natural products)は、多くの薬の基礎であり、農業および栄養学の応用にとって重要な分子でもある。さらに、分子生物学および細胞生物学の多くの側面を研究する化学プロ…

データに適したグラフフォーマットとその描画コードを教えてくれる From Data to Viz

From Data to Vizは、決定木(wiki)を使ってデータの可視化に適したフォーマットを教えてくれるwebサイト。 From Data to Vizに関するツイート。 From data to Viz | Find the graphic you need 下記の決定木を使い、自分の所有しているデータタイプに適し…

様々なインフォマティクスツールを簡単に実行できるサイバー環境 CyVerse

2019 1/10 追記 Cyberinfrastructureは、直訳するとサイバー空間のインフラとなる。計算科学の分野では大規模な計算化学の課題に対する解決策を提供するもの、というような意味で使われている(wiki)。CyVerseはこのCyberinfrastructureを提供する、様々な…

ヒトゲノムの変異データマイニングプラットフォーム DaMold

次世代シークエンシング(NGS)は、日常的な遺伝子検査のための強力かつ効率的で費用効果の高い臨床ツールとなっている。それは、遺伝子的に多くの遺伝病を解読することによって有用性が証明されており、これが最も顕著なのは癌である(Ardeshirdavani et al…