macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2022-05-01から1ヶ月間の記事一覧

パンコムギ16ゲノムの存在・不在バリエーションを表現したパンゲノムグラフデータベース Wheat Panache

パンコムギ(Triticum aestivum L.)は最も広く栽培されている作物の一つであるが、増大する世界人口の予測需要に対応するために収量を増加させることが大きな課題である。気候変動に関連した収量損失は、21世紀半ばまでに17~31%に及ぶと予測されており(Ob…

ショートリードの遺伝子予測の高速化 FragGeneScanRs

FragGeneScanは現在、短くてエラーが起こりやすいリードの遺伝子予測に最も正確で人気のあるツールであるが、その実行速度は大規模データセットで使用するには不十分である。この問題を解決するはずの並列化も非効率的であった。その代替実装であるFragGeneS…

対話型マイクロアレイデータ解析ツール sMAP

マイクロアレイデータは、生物学者が複数の表現型にわたって差次的に発現した遺伝子(DEG)を抽出することを可能にする。マイクロアレイ解析のためのパイプラインやツールはいくつか存在するが、それらは中級から上級の計算理解者を対象としており、使いやす…

生物学的配列の可視化のためにアップグレードされたイラストレーター IBS 2.0

分子生物学や細胞生物学の分野において、様々な機能要素を持つ生体配列を可視化することは、科学的成果を発表する上で基本的なことである。しかし、現在使用されているアプリケーションの限界により、生物学的な模式図の作成にはまだかなりの課題が残ってい…

ハプロタイプを考慮してロングリードシーケンスからマッピング困難な領域のSNPやインデルを正確に検出する NanoCaller

ロングリードシーケンスでは、ショートリードシーケンスではマッピングが困難とされているゲノム領域でのバリアント検出ができる。この手法では、長距離ハプロタイプ情報を用いてSNPを検出し、検出されたSNPとロングリードを位相合わせし、ローカルリアライ…

バリアントエンリッチメント解析を行うshinyサーバー Varanto

ゲノムワイド関連研究(GWAS)は、一塩基多型(SNPs)などの遺伝的バリアントと特定の形質や疾患との関連を明らかにすることを目的としている。これらの結果をさらに探求し、解釈するためには、パスウェイ、生物学的プロセス、疾患との関連などの共通テーマ…

腫瘍全ゲノムの体細胞変異エンリッチメント解析のための柔軟なツールセット MutEnricher

腫瘍の全エキソームから体細胞変異を解析することで、新規のガンドライバー遺伝子の発見が加速されている。しかし、ゲノムの約98%はノンコーディングであり、その中には変異によって正常な細胞機能が損なわれる可能性のある調節エレメントも含まれている。一…

シロイヌナズナの生物学的特徴を調べるFINderデータベース

近年の計算機アプローチや実験ワークフローの進歩により、ゲノムワイドな生物学的・ゲノムデータを比較的容易に、かつ一般的に取得することができるようになった。このハイスループット・データは、数百種類の植物のDNA(配列、メチル化、クロマチンアクセシ…

ロングリードのアセンブルとエラー訂正によるコンセンサス配列の生成パイプライン MAECI

ナノポアシーケンスは長いリードを生成し、特にドラフト細菌ゲノムのアセンブリにおいて、次世代シーケンシングと比較してユニークな利点を提供する。しかし、データの特性やアセンブリアルゴリズムに起因するアセンブリエラーが発生することがある。これら…

clusterProfilerを使ってGO Enrichment Analysisを行う

2022/05/23 step5を画像に差し替え 2024 03/05 dockerイメージ例追記 先日clusterProfilerを使ってKEGG termのエンリッチメント解析を行う例を紹介しました。今回はclusterProfilerを使ってGO Enrichment Analysisを行う流れを紹介します。Bioconductor Anno…

複数リファレンスゲノムを用いたコンティグのスキャフォールディングを行うサーバ Multi-CSAR

Multi-CSAR は、ターゲットゲノムのアセンブリにおいて、複数のリファレンスゲノムに基づくより大きなスキャフォールドにコンティグを効率的かつ正確に順序付け、方向付けることができるウェブサーバである。Multi-CSAR は、ターゲットゲノムと複数のリファ…

clusterProfiler を使ってKEGG pathway Enrichment Analysisを行う

2022/05/30 タイトル修正 2024/03/06 追記 機能エンリッチメント解析は、生命科学におけるハイスループットなオミックスデータを解釈するために極めて重要である。この種のツールは、できるだけ多くの生物について最新のアノテーションデータベースを使用す…

配列のアノテーションに用いられる Sequence Ontology

Sequence Ontology(SO)は、配列のアノテーションに用いられる、配列の特徴を定義するための共同オントロジー・プロジェクト。SOのサイトでは、既存のオントロジーを確認することができる。簡単に見ていきます。 Request A Term https://github.com/The-Seq…

病原性細菌の抗生物質耐性関連可動遺伝因子を検出する VRprofile2

VRprofile2は、細菌ゲノム配列中の多様な mobile genetic elementsを高速に同定するパイプラインを更新したものである。前バージョンと比較して、3つの大きな改善がなされた。まず、モザイク構造を持つ多剤耐性領域において、抗生物質耐性遺伝子カセットと様…

アセンブリの内容をどれだけ反映したコールであるかに基づいてSVコールを評価する TT-Mars

大規模なシークエンス研究により、一般的な構造バリアント(SV)やレアバリアントなどの遺伝子バリアントと形質や疾患との関連付けが可能になった。SVには、欠失、挿入、重複、50塩基以上のリアレンジメントが含まれ、これらは遺伝的多様性、発達障害、ガン…

Trinityのインストール

Trinityはバグ修正と性能改善のバージョンアップが続けられていて、2022年5月現在ではv2.14が利用できます。v2.14はまだcondaでは導入できないので、ソースからビルドします。 Installing Trinity https://github.com/trinityrnaseq/trinityrnaseq/wiki/Inst…

環状細菌ゲノムアセンブラ B-assembler

細菌ゲノムの正確なde novoアセンブリは、新しい細菌種の進化や病原性を理解するための基礎となるものである。Third-Generation Sequencing (TGS)の出現と普及により、バクテリアゲノムのアセンブルはかつてないほどのスピードで可能になった。しかし、現在…

MAGとSAGのゲノム品質を評価する MDMcleaner 

2022/05/21 ツイート追記 現在、環境微生物の大部分は未培養のままであり、「微生物ダークマター」(MDM)と呼ばれている。そのため、これらの微生物に関するゲノム解析は、シングルセルオミクスやメタゲノム解析などの培養に依存しないアプローチに限定され…

階層的ガイドゲノムアセンブラ HGGA

De novoゲノムアセンブリでは、通常、完全なゲノムではなく、コンティグのセットが作成される。そのため、ゲノムの完全な構造を決定するためには、遺伝的連鎖地図、オプティカルマップ、Hi-Cデータなどの追加データが必要となる。従来の研究では、コンティグ…

メタゲノム由来配列のインサートライブラリのアセンブリアーノテーションツール MINTIA

地球上には、多様な生態系に適応した何兆もの細菌種が存在している。固有の代謝機能を獲得することで、多様な生態系に適応している。これらの機能を担う遺伝子の多くは未培養のバクテリアに属しており、まだ発見されていない。機能的活性スクリーニングに基…

ロングリードcDNAシーケンスも利用できる真核生物ゲノムの自動化されたアノテーションツール LoReAn

1分子完全長相補DNA(cDNA)配列決定は、転写産物の構造やスプライス形態を明らかにすることで、ゲノムアノテーションを支援することができるが、現在のアノテーションパイプラインにはそのような情報が組み込まれていない。本研究では、ロングリードアノテ…

DESeq2

2022/05/09 誤字修正、インストール手順修正(ggplot) 2022/06/09 heatmapのコマンド修正. 10/24 インストール手順修正(Rのバージョン4指定) 2023/06/18 追記 2024/02/27 docker image例追記 比較ハイスループットシーケンスアッセイでは、RNA-seqにおける…

メタゲノム解析を行う BusyBee Webのアップデート

近年、分類学的プロファイリングツールの方法論やリファレンスデータベースの改良が進んでいるが、メタゲノム解析ワークフローにおいては、メタゲノムアセンブリとゲノムビニングが依然として重要な柱である。リファレンス情報がない場合、ゲノムビニングはm…

メタゲノムデータから集団の微細多様性をプロファイリングする inStrain

同種の微生物細胞が共存すると、栄養嗜好から病原性までの表現型に影響を与える遺伝的変異を示すことが多い。本発表では、メタゲノムのペアエンドリードを用いて、全ゲノムにわたる集団内の遺伝的多様性(マイクロダイバーシティ)をプロファイリングし、マ…

メタゲノムのOTU解析を行う singleM

2024/02/01 論文引用 Githubより SingleMは、参照配列データベースに過度に依存することなく、ショットガンメタゲノムデータから直接、個別の操作的分類単位(OTU)の存在量を求めるツールである。このツールは、近縁の生物種を区別することができ、その生物…

SeqWho

シーケンサー技術の大幅な向上とプロトコルの増加により、シーケンサーは複雑な生物学的問題に答えるために使用されるようになってきた。それに伴い、解析パイプラインはより時間と複雑さを増し、通常、非常に大規模な事前検証ステップを必要とするようにな…