shiny
オックスフォード・ナノポア・テクノロジーズ(ONT)のシーケンスプラットフォームは、シーケンス中にリアルタイム解析を実行する優れた機会を提供する。この機能により、実験データに対する早期の洞察が可能になり、さらなる解析のための潜在的な意思決定プ…
オミックスデータは大量に生産され、通常、高度な可視化解析が必要とされる。これらの解析にはプログラミングのスキルが必要な場合が多く、実験生物学者にとっては難しい。したがって、より使いやすいツールが早急に求められている。 本発表では、オミックス…
マイクロアレイデータは、生物学者が複数の表現型にわたって差次的に発現した遺伝子(DEG)を抽出することを可能にする。マイクロアレイ解析のためのパイプラインやツールはいくつか存在するが、それらは中級から上級の計算理解者を対象としており、使いやす…
ゲノムワイド関連研究(GWAS)は、一塩基多型(SNPs)などの遺伝的バリアントと特定の形質や疾患との関連を明らかにすることを目的としている。これらの結果をさらに探求し、解釈するためには、パスウェイ、生物学的プロセス、疾患との関連などの共通テーマ…
ゲノム編集後の突然変異の結果を確立することは、高効率のゲノムターゲティングツールの出現により、ますます重要となっている。次世代シーケンサー(NGS)は、特定の標的部位における変異誘発の程度を調査するために不可欠な方法となっている。そのため、研…
オミックスプロファイリングは、生物の行動や環境中の反応を捉えるなど、大規模な生物学的データセットを得るための、ますます顕著なアプローチのcollectionである。このような大規模なデータセットを、プログラミングの経験なしに手作業で解析し、解釈する…
新しいMonorail解析パイプラインによって一様に処理された750,000以上の一般に公開されているヒトとマウスのRNAシーケンス(RNA-seq)サンプルからなるリソース、recount3を紹介する。データへのアクセスを容易にするために、recount3およびsnapcountのR/Bio…
2022/01/30 誤字修正 主成分分析(PCA)は、RNAシーケンス(RNA-seq)遺伝子発現アッセイなどの高次元データにおける品質評価や探索的分析に、ゲノミクスアプリケーションで頻繁に使用されている。この目的のために開発された多くのソフトウェアパッケージが…
ボルケーノプロットやその他の分析プロット(相関プロット、アップセットプロット、ヒートマップなど)は、トランスクリプトームやプロテオーム解析において重要なデータ可視化方法として機能する。これらのプロットをカスタマイズして作成することは、発現…
2022 1/5 複数比較の例追記、コマンドの誤字修正 バルクRNA-seqデータが処理されると、すなわちアラインメントされ、発現および差分表が作成されると、生物学的性質の探索、視覚化および解釈が行われる重要なプロセスが残る。可視化・解釈パイプラインを使用…
リボソームプロファイリング(Ribo-seq)は,コドン占有率のプロファイリング,活発に翻訳されているオープンリーディングフレーム(ORF)の同定から,様々な生理学的・実験的条件下での翻訳効率の定量化まで,RNAの翻訳をグローバルにモニタリングする強力…
miRNA-seq は様々な分野で幅広く使用されているが、その品質管理は PhredScore ベースのフィルターに限定されることが多くなっている。microRNAの収量、推定分解産物(rRNA断片など)の割合、アダプターダイマーの割合など、品質に関連する他の重要な側面は…
分子生物学研究や臨床現場におけるRNA-sequencing(RNA-seq)の利用は、過去10年間で大幅に増加している。しかし、広く普及しているにもかかわらず、RNA-seqデータを解析・探索するためのシンプルでインタラクティブなツールが不足している。既存のツールの…
オミックスデータの解析において、遺伝子の機能アノテーションは不可欠なステップである。現在、遺伝子群の機能をオントロジーや分子パスウェイなどの高次の表現にまとめるためのデータベースや手法が複数存在する。オミックス実験の結果を機能カテゴリにア…
DNAシークエンスが開発されて以来、遺伝的変異に関する多くの研究が行われてきたが、エピジェネティックなレベルでの広範な研究は最近になって登場した。生体内のほとんどの細胞は、そのゲノム配列が同一であるが、組織や細胞の種類によっては、それぞれのア…
ヒトの健康や病気の形成に腸内細菌叢が果たす複雑な役割は、培養に依存しない分子ベースのハイスループットシーケンシング技術が利用できるようになったこともあって、近年、精力的に調査・研究が行われている。ヒトのすべての宿主は、平均500~1000種の異な…
異なる条件で得られたデータを定量的に比較することは、実験科学の重要な側面である。定量的比較のために最も広く使われている統計量はp値である。しかし、p値にはいくつかの欠点がある。定量的比較に関連する最も顕著な欠点は、p値が違いの大きさを伝えられ…
2022/04/26 追記 RプログラミングShinyパッケージを用いて開発されたWebベースのデータ解析・可視化ツールが研究者に提案されることが増えている。これらのツールは、様々な視点からデータを解析したり、インタラクティブな可視化を提供したりするのに便利で…
データ駆動型サイエンスの最近の発展により、研究者は複数のソースからのデータを、多様な実験手順やデータベース上で統合するようになった。特にデータポイントの数がクラス間で異なる場合、データを正確に可視化する上で大きな課題となっている。サンプル…
2020 6/3 文章修正 ドットプロットは、異なるサイズと色のドットを用いて2つの定量情報を同時に表示するコンパクトな方法を提供するヒートマップのようなチャートである。この可視化方法は、特にシングルセルRNA-seq研究で人気があるにもかかわらず、ドット…
2020 5/14 フィーチャー => 観測値に変更 全ゲノムの非環状プロットは、全染色体に沿って配列されたゲノムデータを自然に表現したものである。現在のところ、非環状の全ゲノム図を作成するために設計された専用のグラフィカル・ユーザー・インターフェース(…
2020 4/30 文章修正、タイトル修正 2022/04/06 リンク修正 ハイスループット実験の出現により、研究者はしばしば多変量データに直面している。これらは、通常、行列として提示される。この種のデータは様々なソースから得られることがあり、例えば、特定の遺…
2020 3/13 誤字修正、補足説明追加 要約だけでなく、個々の測定からの実際のデータを表示することで、実験結果の理解が深まり、より完全な全体像が得られることは長年にわたって強調されてきた[ref.1-3]。これは、ダイナミクスを研究するための時間依存デー…
2020 5/12 説明追加 2020 10/1 リンク追加 ライブラリによって要求するRのバージョンが異なり、新しいツールをテストできないことがある。そのような場合、 r-baseのバージョン管理されたdockerイメージを使うと、その場限りの仮想環境にツールをインストー…
植物と病原体の相互作用の結果を決定する多数の遺伝子が現在発見されている。たとえば、免疫受容体、感受性因子、病原体エフェクター、およびそれらの宿主標的など。ターゲットエンリッチメントシーケンスは、遺伝子型固有のゲノムアセンブリを最初に生成す…
2020 2/29 誤字修正 クラスターヒートマップは、高次元のデータを視覚化するための一般的なグラフィカルな方法である。その中で、数値のテーブルは、色付きセルのタイル状のマトリックスとしてスケーリングおよびエンコードされる。マトリックスの行と列は、…
2021 6/5 バージョンアップのツイート 2019年最後の投稿になります。今年もお世話になりました。来年もどうぞよろしくお願い致します。 ゲノムワイドな研究で特定された一連の遺伝子について、遺伝子オントロジー(GO)によって定義されたものなど、特定のパ…
生物学的システムの統合モデルを構築し、疾病を予防または治療するための実現可能な戦略を考案するには、適切な実験計画法とインタラクティブなインタフェースを備えた高度な計算ツールが必要である。 RNA-Seqは膨大な量の遺伝子発現データを作成しており、…
RNA-seqデータセットをGene Expression Omnibus(GEO)およびSequence Read Archive(SRA)のリポジトリに保存すると、公開されている研究の再現性が保証され、再利用が容易になる。これらのデータの再分析は、新しい科学的洞察をもたらす可能性があり、新し…
2019 4/11 twitterリンク追記 2020 3/2 関連リンク追加 近年、いくつかのグループが、データの要約ではなく実際のデータをグラフで表示することを提唱している[ref.1-4]。生データは、ヒストグラムやドットプロットなど、さまざまな方法で視覚化できる。デー…