macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

結果の視覚化 (visualization)

ゲノム領域を柔軟に調整して視覚化と比較ができるユーザーフレンドリーなアプリケーション GenoFig

生物の分子進化の歴史を理解するには、通常、近縁種や系統のゲノム領域を視覚的に比較する必要がある。このタスクを達成するためのアプリケーションはすでにいくつか存在するが、それらは古すぎたり、限定的すぎたり、あるいは複雑すぎたりして、ほとんどの…

タンパク質ファミリーの機能に重要なアミノ酸残基をインタラクティブに調べるwebツール SitesBLASTとSites on a Tree

タンパク質の機能は、その結合特異性や触媒活性を決定する機能的残基によって左右されるが、通常、タンパク質の機能をアノテーションする際にこれらの残基は考慮されない。生物学者がタンパク質の機能的残基を調べるのを助けるために、本著者らは2つの対話型…

タンパク質のドメインレベルのアノテーションを行う Domainator

2024/06/03 タイトル修正、誤字修正 生物学的配列の大規模なデータベースが利用可能になったことで、遺伝子の多様性と機能を深く探求する機会がもたらされた。細菌防御系は、多様であるがアノテーションが困難な遺伝子の豊富な供給源であり、バイオテクノロ…

植物ゲノムのLTRレトロトランスポゾンのアノテーションを行うパイプライン DANTEとDANTE_LTR

ロングターミナルリピート(LTR)レトロトランスポゾンは、ほとんどの植物種のゲノムにおいて、反復DNAエレメントの主要なクラスである。配列決定された植物ゲノムの数は加速度的に増加しており、植物ゲノムアセンブリ中のLTRレトロトランスポゾンの効率的な…

複数のロングリードシークエンシングデータの一括した分析を行う Giraffe

第3世代シークエンシング技術は、高品質でウルトラロングリードを生成できることから人気を博している。さまざまなサンプルや複数のシーケンスプラットフォームから得られたデータセットを比較および包括的な解析に活用することは、生物学的メカニズムの解明…

ウェブブラウザ上で高品質な高分子構造の可視化を行う Protein Imager

分子ビューアーの長い学習曲線は、研究者が初めて構造生物学の分野にアプローチする際の妨げとなっている。ここでは、次世代のオンライン分子ビューアーとして、軽量で強力かつ使いやすいインターフェースである'The Protein Imager'を紹介する。さらに、こ…

DNA配列中のk-merを2次元空間に視覚化する KMAP

DNA配列中のパターンを同定し図示することは、様々な生物学的データ解析において極めて重要な作業である。この作業では、DNA配列の基本的な構成要素であるkmmerの集合によってパターンが表現されることが多い。これらのパターンを視覚的に明らかにするために…

複雑な反復配列を迅速にインタラクティブなドットプロットで可視化する ModDotPlot

ゲノムの反復配列を分析する一般的な方法は、ドットプロットによって可視化された配列類似性マトリックスを作成することである。StainedGlassのような革新的なアプローチは、ドットプロットを配列同一性のヒートマップとしてレンダリングすることにより、こ…

細菌・古細菌の高速な比較ゲノムブラウザ Fast.genomics

ゲノムシークエンシングにより、細菌や古細菌の驚くべき多様性が明らかになったが、これらのゲノムを横断的に閲覧するための高速で便利なツールは存在しない。原核生物の多様性の中で、目的のタンパク質のホモログの存在率や、それらのホモログの遺伝子近傍…

複数ゲノムにまたがるシンテニー関係を可視化する使いやすいツール NGenomeSyn

大規模な比較ゲノム研究は、種の進化や多様性に関する重要な知見を提供してきたが、同時に可視化という大きな課題にもつながっている。膨大なゲノムデータに隠された重要な情報や、複数のゲノム間の関係を素早くキャッチし、提示するには、効率的な可視化ツ…

>100,000の植物論文アブストラクトを網羅するナリッジネットワーク PlantConnectome

遺伝子の機能予測は生物学の理解に不可欠である。しかし、これらの予測は、実験的に特徴付けられた遺伝子の大規模なコレクションに依存しており、そのコンパイルには労力と時間がかかるだけでなく、科学文献の量と多様性を考慮すると不可能に近い。ここでは…

バクテリアの比較ゲノム解析を簡単に行う zDB

ゲノムの解析と比較は、アノテーション、オルソロジー予測、系統推論などのタスクのために、さまざまなツールに依存している。しかし、ほとんどのツールは単一のタスクに特化しており、結果を統合して可視化するためにはさらなる努力が必要である。このギャ…

(ヒト)遺伝子発現解析のためデータ可視化とパスウェイエンリッチメント解析を統合したウェブツール STAGEs

遺伝子発現プロファイリングは、生物学的プロセスや疾患の理解に多大な貢献をしてきた。しかし、データ可視化ツールやパスウェイ解析ツールの多くは、膨大なデータフォーマットを必要とするため、特にバイオインフォマティシャンでない人にとっては、処理さ…

RNA-Seqの正規化手法を比較し、発現変動遺伝子の解析まで行う NormSeq

2023 5/30 タイトル修正 RNAシーケンスは、様々なRNAサブポピュレーションの発現に関する知識を得るために最も使用されるハイスループットなアプローチの1つとなっている。しかし、ライブラリー調製時やデータ解析時に発生する技術的なアーチファクトが、検…

相同な遺伝子クラスターを迅速に検索・可視化する webサーバー CAGECAT

特殊な機能をコードする遺伝子の共局在は、微生物ゲノムに共通し、より大きな真核生物のゲノムにも存在する。重要な例として、薬用、農業用、工業用として価値のある特殊な代謝物(例:antimicrobials)を生産する生合成遺伝子クラスター(BGC)がある。BGC…

出版品質のプラスミドマップを生成、編集、注釈、視覚化するためのウェブサーバー PlasMapper 3.0

PlasMapper 3.0は、出版品質のプラスミドマップを生成、編集、注釈、対話的に可視化できるウェブサーバーである。プラスミドマップは、遺伝子クローニング実験に関する重要な情報を計画、設計、共有、公開するために使用される。PlasMapper 3.0は、PlasMappe…

(主にヒトRNA-seq)大規模RNA-seqデータセットからデータセットに関する情報を提供する Kmerator Suite

一般に公開されている膨大な数のRNA-sequencing (RNA-seq) ライブラリは、組織における既知または新規の転写産物の発現を定量化するための機能情報の宝庫である。しかし、転写産物の定量は、多くの計算資源と処理時間を必要とするアライメント手法に依存する…

krakenの出力をMultiQCで分析する

MultiQCはkraken1と2のレポート出力の分析にも対応している。使用するには--reportをつけてkrakenを実行し、レポートファイルを作成しておく。 対応しているツール一覧 https://multiqc.info/modules/ kraken1とkraken2への対応 https://multiqc.info/module…

細菌・古細菌の環状ゲノムプロットを出力する GenoVi

2023/04/10 タイトル変更 2023/04/11追記 2024/04/20 dockerイメージ追記 純粋培養やメタゲノムから得られる微生物のゲノム配列の増加は、全ゲノムおよびショットガンシーケンス法の現在の達成可能性を反映している。しかし、ゲノムの可視化のためのソフトウ…

コード不要で高度なRNA-seq解析を行う RNAlysis

次世代シーケンサーによる実験では、データの探索的解析、トレンドの解釈、ターゲット/候補の特定、結果のわかりやすい直感的な可視化などが大きな課題となってる。これらの課題は、利用可能な解析ツールの大半がプログラミングスキルを必要とするため、コン…

KEGGパスウェイをペイントする KPP

ハイスループット技術は、ゲノムワイドな遺伝子発現パターンの変化を読み解くための一般的なツールとなった。遺伝子発現パターンの機能解析は、生物学的知識の公開リポジトリにしばしばアクセスする必要があるため、困難な作業である。一方、多くの場合、研…

クロロプラストゲノムの詳細な構造を可視化する CPGView

クロロプラストゲノムは、植物の系統や進化を研究する上で広く利用されている。クロロプラストゲノムの可視化ツールは、ゲノム上の遺伝子の分布を表示するためにいくつか開発されている。しかし、これらのツールは、エクソン、イントロン、繰り返し要素、可…

2 つのアセンブリ間のアライメントを比較するNCBIの Comparative Genome Viewer

2024/05/09 論文追記 NCBI Insightsより NCBIのComparative Genome Viewer (CGV)では、2 つのアセンブリ間のアライメントを表示および比較し、欠失、逆位、転座を含むゲノム配列および構造の違いを確認することができます。 NCBIのComparative Genome Viewer…

vgのゲノム配列グラフを可視化するためのJavaScriptモジュール Sequence Tube Maps

レポジトリより近年の科学の進歩により、利用可能なゲノム配列情報は膨大な量に達している。以前は、この配列情報は単一の参照配列から構成されており、比較的容易に線形に可視化することができた。今日、私たちはしばしば、特定のDNA配列の複数のvariantsを…

染色体間で類似した遺伝子ブロックを可視化する AccuSyn

HPより 単純な生物でさえ膨大な数の遺伝的特徴を持つため、シンテニックプロットでは膨大な数の接続が乱立し、構造を理解することが困難となる。AccuSynは、ゲノムビューとブロックビューの2つのビューでシンテニック関係を可視化することにより、高いレベル…

線形遺伝子マップを生成する LinearDisplay

LinearDisplayは、ユーザー定義の遺伝的特徴(ORF、プロモーター、転写ターミネーター、制限酵素認識部位、プライマー結合部位、ファージ付着部位、標的部位重複、アセンブリ/コンティグ切断、RNA構造など)の出版品質の線形マップを生成するプログラムであ…

スプライシングバリエーションを視覚化する sashimi.py

クロマチンの発現、タンパク質-DNA/RNA相互作用、アクセス性、構造などが条件や細胞種によってどのように異なるかを同時に可視化することにより、オルタナティブスプライシングの制御機構や機能的影響について理解を深めることができる。しかし、既存のSashi…

全自動のトランスポーザブル・エレメントのアノテーションと解析のパイプライン Earl Grey

2024/04/06 論文追記 トランスポーザブル・エレメント(TE)は、ほぼ全ての真核生物ゲノムに存在し、様々な進化過程に関与している。TEに関する研究は非常に盛んだが、そのアノテーションと特性解析は、特に非専門家にとって依然として困難である。(i)断片的…

ユーザーフレンドリーなデータ可視化ウェブサーバー ImageGP

データの可視化は,研究者の間で結果を説明し,知識を共有するために重要な役割を果たす.しかし、多くの可視化ツールは十分なコーディング経験を必要としたり、特殊な用途のために設計されていたり、無償でなかったりする。ここでは、生物・化学データの可…

(主にヒト)バリアントを視覚化する ProteinPaint

小児がんの遺伝子病変(sequence mutations や遺伝子融合など)とRNA発現を同時に可視化するウェブアプリケーション、ProteinPaintについて説明する。小児がんデータセットは、17サブタイプの小児がんから診断時または再発時に取得された27,188の検証済み体…