macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

web tool

海洋環境ゲノムをマイニングするためのオンラインサービス The Ocean Gene Atlas v2.0

Tara Oceansの海洋メタゲノムやメタトランスクリプトームのような大規模データリソースを用いて遺伝子の生物地理に関する仮説を検証するには、多大なハードウェアリソースとプログラミングスキルが必要になる。今回リリースされた「Ocean Gene Atlas」(OGA2…

GenBank Flat File FormatとJSON間の変換を行う GBSON

HPの解説より GenBank Flat File Format (.gb または .gbk) は、核酸やタンパク質の配列とそのアノテーションを保存できるファイルフォーマットとして広く利用されている。NIHの遺伝子配列データベース「GenBank」(https://www.ncbi.nlm.nih.gov/genbank/)…

フラボノイド生合成候補を探索する KIPEs

フラボノイドの生合成は、植物における特殊な代謝と転写制御のモデル系としてよく知られている。フラボノイドは、紫外線防御や花粉媒介者の誘引など多くの生物学的機能を持つだけでなく、バイオテクノロジーの可能性も秘めている。ここでは、フラボノイド生…

真菌のコア遺伝子データベースとゲノムワイド系統解析のためのパイプライン UFCG

系統発生学では、生物の進化的関係をゲノム情報によって研究する。各生物から関連する遺伝子を抽出し、多重配列アラインメントを構築し、系統樹によって進化関係を再構築するのが一般的なアプローチである。この解析には、分類群内での効率的な自動化を可能…

アンプリコンベースの菌叢解析のための包括的なプラットフォーム MOCHI

微生物叢の解析は、健康や科学にとって重要な意味を持つ。これらの解析では、16S/18S rRNA遺伝子シーケンスを利用して分類群を同定し、種の多様性を予測する。しかし、微生物叢データを解析するための利用可能なツールのほとんどは、適切な実装のために熟練…

バクテリアパンゲノムの探索的解析と可視化のためのウェブベースツール PanExplorer

パンゲノムアプローチは細菌の比較ゲノム解析や進化解析に多く用いられているが、バイオインフォマティシャンのいない生物学者にはまだ難しいため、細菌パンゲノムの探索を容易にする革新的なツールが必要である。PanExplorerは、様々なゲノム解析とレポート…

Foldseekを使ってAlphaFold UniProt DBから類似構造タンパク質を探す Foldseek server

2022/08/03 誤字修正 2023/07/10 追記 高精度な構造予測手法により、一般に公開されているタンパク質の構造が雪崩のように増えている。これらの構造を検索することが、構造解析の主なボトルネックになりつつある。Foldseekは、大規模な構造セットを高速かつ…

ディープラーニングを用いたタンパク質の翻訳後修飾部位予測と可視化のためのウェブサーバ MusiteDeep

MusiteDeepは、タンパク質の翻訳後修飾(PTM)部位の予測および可視化のためのディープラーニングフレームワークを提供するオンラインリソースである。この予測ツールは、タンパク質の配列のみを入力とし、複雑な特徴を必要としないため、多数のタンパク質に…

真菌ミトコンドリアDNAのオンラインリソース MitoFun

HPより ミトコンドリアDNAのサイズや構造は様々である。菌類では、mtDNAの大きさは約16-110kbsである。ミトコンドリアに必要な成分の大部分はコードされておらず、核の遺伝子からコードされてミトコンドリアに輸入される。 小さな例外を除き、ミトコンドリア…

原核生物の保存された遺伝子クラスターを視覚化するwebリソース GeCoViz

シンテニー保存性の解析は、原核生物の未知遺伝子の潜在的な機能的役割を調査するための確立された方法論である。しかし、ゲノムコンテキストの再構築と可視化を行うバイオインフォマティクスツールは、通常、計算速度に依存し、狭い分類学上の範囲に限定さ…

ヒートマップと遺伝子セットエンリッチメント解析のオンラインサービス HemI 2.0

近年のハイスループットなオミックス技術により、大量の生物学的データが生み出されている。このようなビッグオミックスデータを可視化することは、様々な生物学的問題に答えるために必要不可欠である。簡潔でありながら包括的な戦略として、ヒートマップは…

(主にヒト)バリアントを視覚化する ProteinPaint

小児がんの遺伝子病変(sequence mutations や遺伝子融合など)とRNA発現を同時に可視化するウェブアプリケーション、ProteinPaintについて説明する。小児がんデータセットは、17サブタイプの小児がんから診断時または再発時に取得された27,188の検証済み体…

遺伝子発現解析と可視化のためのウェブサーバー GEOexplorer

2022/06/10 追加 Gene Expression Omnibus (GEO) は、一般に公開されているハイスループットな遺伝子発現データのかなりの割合をホストしているデータベースリポジトリである。遺伝子発現解析は、サンプルグループ間の生物学的および表現型の違いの根底にあ…

原核生物の遺伝子セットエンリッチメント解析を行うユーザーフレンドリーなウェブサーバー FUNAGE-Pro

近年のハイスループット(メタ)トランスクリプトミクスやプロテオミクスの分野では、単一の遺伝子やタンパク質だけでなく、拡張された生物システムを探索するための簡便で迅速な方法が求められている。遺伝子セットエンリッチメント解析は、遺伝子セット内…

(ヒトゲノム)バリアントが転写因子結合に及ぼす影響を予測する FABIAN-variant

コーディングバリアントの影響予測は大きく進歩したが、ノンコーディングバリアントの評価は依然として困難である。特にプロモーター領域内のバリアントは、遺伝子の過剰発現を引き起こしたり、発現を低下させたり、あるいは消失させたりする可能性があるた…

シロイヌナズナの生物学的特徴を調べるFINderデータベース

近年の計算機アプローチや実験ワークフローの進歩により、ゲノムワイドな生物学的・ゲノムデータを比較的容易に、かつ一般的に取得することができるようになった。このハイスループット・データは、数百種類の植物のDNA(配列、メチル化、クロマチンアクセシ…

複数リファレンスゲノムを用いたコンティグのスキャフォールディングを行うサーバ Multi-CSAR

Multi-CSAR は、ターゲットゲノムのアセンブリにおいて、複数のリファレンスゲノムに基づくより大きなスキャフォールドにコンティグを効率的かつ正確に順序付け、方向付けることができるウェブサーバである。Multi-CSAR は、ターゲットゲノムと複数のリファ…

病原性細菌の抗生物質耐性関連可動遺伝因子を検出する VRprofile2

VRprofile2は、細菌ゲノム配列中の多様な mobile genetic elementsを高速に同定するパイプラインを更新したものである。前バージョンと比較して、3つの大きな改善がなされた。まず、モザイク構造を持つ多剤耐性領域において、抗生物質耐性遺伝子カセットと様…

メタゲノム解析を行う BusyBee Webのアップデート

近年、分類学的プロファイリングツールの方法論やリファレンスデータベースの改良が進んでいるが、メタゲノム解析ワークフローにおいては、メタゲノムアセンブリとゲノムビニングが依然として重要な柱である。リファレンス情報がない場合、ゲノムビニングはm…

連続した配列ブロックのクラスターを検出する FMSClusterFinder

本論文では、DNAやRNAの配列内部の連続した配列ブロックのクラスターを同定・検出するための新しいツールおよびアルゴリズムであるFMSClusterFinderについて説明する。遺伝子発現やゲノムグループの性能は、機能的要素がクラスターとして互いに協調して制御…

タンパク質セットの2次元の特徴を表現するカスタマイズ可能なwebツール ProFeatMap

ProFeatMapは、ドメイン、繰り返し配列、翻訳後修飾の位置などのタンパク質の特徴を、カスタマイズ可能なグラフィカルな2Dマップに素早く表示する、Pythonベースの直感的なウェブサイトである。ProFeatMap は、ユーザー定義のタンパク質リストから出発して、…

サンガーシークエンスデータの自動アセンブルと解析のためのサーバー YAQAAT

サンガーシーケンスが普及しても、自動アセンブリソフトウェアはデスクトップやラップトップ用のスタンドアローンソフトウェアが主流で、同等のオンラインソフトウェアはほとんどないため、配列解析やアセンブリは地理的な制約を受けている。また、世界的な…

オックスフォードナノポアのシーケンスデータの解析のための統合サーバー NanoForms

次世代シーケンス(NGS)技術は、今日の遺伝学およびゲノミクス研究の展望を支配している。イルミナは依然として世界のシーケンサーを支配しているが、オックスフォード・ナノポアは、現在、生物学者、医学者、遺伝学者がさまざまな用途で使用している主要技…

系統樹検索エンジン SHOOT.bio

遺伝子間の進化的関係を明らかにすることは、比較生物学研究の基本である。ここでは、SHOOTを紹介する。SHOOTは、ユーザからのクエリー配列を系統樹のデータベースと照合し、クエリー配列が正しく配置された系統樹を返す。SHOOTはBLAST検索に匹敵する速度で…

バクテリアゲノムとプラスミド配列のアノテーションを行うBaktaのwebバージョン

以前このブログで細菌ゲノム配列およびプラスミド配列のアノテーションを行うBaktaというツールを紹介しました(リンク)。BaktaはFAIRの原則に従った標準アノテーションを高速に実行でき、アノテーション結果をNCBIやENAに直接登録できる(レポジトリ参照)…

オーファン遺伝子の発見のための検索エンジン ORFanID

現在、多くのゲノムが解読され、ある分類群の遺伝子のかなりの割合が他の分類群にオルソログ配列を持っていないことが示されている。これらの配列は、通常、1つの種にのみ存在する場合はorphans/ORFansと呼ばれ、より高い分類学上のランクで見つかった場合は…

ショートリードから全ゲノム系統樹の自動再構築を行う REALPHY

微生物の進化動態の研究は、手頃な価格のハイスループットシーケンス技術の利用により、一度の研究で何百もの関連する分類群の全ゲノム配列の解読が可能となり、大きく変貌を遂げてきている。一般に、これらの分類群の系統樹を再構築することは、あらゆる進…

(ヒト)パスウェイエンリッチメント解析のためのウェブアプリケーション DecoPath

過去20年間で、パスウェイデータベースとパスウェイエンリッチメント法は着実に発展してきた。しかし、パスウェイデータの出現に伴い、データベース間の相互運用性が改善されていないため、複数のデータベースから得られたパスウェイ知識をパスウェイ・エン…

ヒトおよびモデル生物のタンパク質相互作用データベース Integrated interactions database

バイオアッセイの改良により、新しいタンパク質間相互作用(PPI)の同定率が大幅に向上し、検出されたヒトPPIの数は、初期のヒト・インタラクトームの推定サイズを大幅に上回っている。これらの新しいPPIは、疾患メカニズムのより完全な見解を提供しているが…

カスタマイズ可能なボルケーノプロットを作成するwebサービス ggVolcanoR

ボルケーノプロットやその他の分析プロット(相関プロット、アップセットプロット、ヒートマップなど)は、トランスクリプトームやプロテオーム解析において重要なデータ可視化方法として機能する。これらのプロットをカスタマイズして作成することは、発現…