macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

plant

キュレーションされたBUSCOセット(CUSCOs)を使ってCompleasm によるアノテーション精度を向上させる phyca

ユニバーサルシングルコピーオルソログは、ゲノムの最も保存された構成要素である。これらは進化の歴史の研究や新しいアセンブリの評価に日常的に使用されているが、現在の方法は利用可能なゲノムデータからの情報を組み込んでいない。本研究ではまず、進化…

NCBIのRefSeqデータベースで利用可能な全ゲノムのデータに簡単にアクセスできる包括的データベース GBRAP

進化研究においては、生命のあらゆる領域にわたるゲノム情報の広範な調査が必要である。GenBankを通じて多数のゲノムが利用可能であるにもかかわらず、ゲノム情報の効果的な可視化や比較は、そのサイズなど多くの理由から困難である。ゲノムファイルを解析す…

深層学習で植物の防御機構に関与する抵抗性遺伝子を予測する PRGminer

植物抵抗性遺伝子は、様々な病気や害虫に対する植物の防御システムにおいて極めて重要である。これらの植物特異的遺伝子は、植物に侵入する病原体に関連する特定の分子パターンを識別するタンパク質をコードしている。これらの抵抗性遺伝子が活性化されると…

植物の機能的アノテーションを行う GFAP

遺伝子の機能的アノテーション(GFA)はゲノム解析において重要であり、広範なゲノム研究の基礎となる。 配列を入力とする一般的なGFAツールは2つのカテゴリーに分けられる: (i)リファレンスベースのツールは、ユーザーが新たに配列決定されたゲノムをアノ…

ディスペンサブル遺伝子(dispensable genes)を評価する QUOD

系統(種、属、高次のクレード)における遺伝子の非消耗性は、多くのゲノムシーケンスプロジェクトがパンゲノームレベルに移行するにつれて重要性を増している。ほとんどの解析では、遺伝子を、調査対象となったすべてのゲノムに存在する「コア遺伝子」と、…

被子植物7種8器官の遺伝子発現アトラス DevSeq

生物種間の表現型の違いはタンパク質コード配列と遺伝子発現の変化によって大きく左右される。ここでは、7種8器官のトランスクリプトームを解析することにより、被子植物のタンパク質コード遺伝子の発現パターンが急速に進化していることを示す。4,500万年以…

(主に動植物)遺伝子ノテーションの品質向上のためのシンテニーベースのツールキット SynGAP

2024/09/06 追記 ゲノム配列決定は生物学者にとって日常的な作業となったが、遺伝子構造アノテーションの課題は依然として残っており、正確なゲノム・遺伝子研究を妨げている。SynGAPは、遺伝子のシンテニー情報を利用して、ゲノムの遺伝子構造アノテーショ…

植物ゲノムのLTRレトロトランスポゾンのアノテーションを行うパイプライン DANTEとDANTE_LTR

ロングターミナルリピート(LTR)レトロトランスポゾンは、ほとんどの植物種のゲノムにおいて、反復DNAエレメントの主要なクラスである。配列決定された植物ゲノムの数は加速度的に増加しており、植物ゲノムアセンブリ中のLTRレトロトランスポゾンの効率的な…

植物プロテオームの機能的アノテーションを行う mercator4

2019年の論文より すでに200種以上の植物のゲノム配列が発表されており、シーケンス技術の進歩により、この数は急速に増加すると予想されている。新しいゲノムが構築され、遺伝子が同定されると、オントロジーを用いてその推定翻訳産物であるタンパク質の機…

LAIスコアによる連続性の高い植物・藻類ゲノムアセンブリの品質比較を行うサイト PlantLAI

近年のゲノム解読の進歩により、解読されたゲノム数は増加している。しかし、反復配列の存在は植物ゲノムのアセンブリを複雑にしている。LTRアセンブリインデックス(LAI)は、LAIが高いほどアセンブリの質が高いことを意味することから、近年、ゲノムアセン…

植物の比較トランスクリプトームデータベース Plant Expression Omnibus(PEO)

Plant Expression Omnibus (PEO)は、100以上の植物種、約60,000の手作業でアノテーションされたRNA-seqサンプル、400万以上の遺伝子の遺伝子発現に関する知見を生物学者に提供するウェブアプリケーションである。このツールにより、ユーザーは異なる器官にわ…

>100,000の植物論文アブストラクトを網羅するナリッジネットワーク PlantConnectome

遺伝子の機能予測は生物学の理解に不可欠である。しかし、これらの予測は、実験的に特徴付けられた遺伝子の大規模なコレクションに依存しており、そのコンパイルには労力と時間がかかるだけでなく、科学文献の量と多様性を考慮すると不可能に近い。ここでは…

オルソログデータを探索・可視化する統合プラットフォーム OrthoVenn3

比較ゲノム研究の進歩により、種の進化や遺伝的多様性を研究することに関心が高まっている。この研究を促進するために、OrthoVenn3は、ユーザーが効率的にオルソログクラスターの同定とアノテーションを行い、さまざまな種にわたる系統関係を推論できる強力…

ヒートマップと遺伝子セットエンリッチメント解析のオンラインサービス HemI 2.0

近年のハイスループットなオミックス技術により、大量の生物学的データが生み出されている。このようなビッグオミックスデータを可視化することは、様々な生物学的問題に答えるために必要不可欠である。簡潔でありながら包括的な戦略として、ヒートマップは…

パンコムギ16ゲノムの存在・不在バリエーションを表現したパンゲノムグラフデータベース Wheat Panache

パンコムギ(Triticum aestivum L.)は最も広く栽培されている作物の一つであるが、増大する世界人口の予測需要に対応するために収量を増加させることが大きな課題である。気候変動に関連した収量損失は、21世紀半ばまでに17~31%に及ぶと予測されており(Ob…

シロイヌナズナの生物学的特徴を調べるFINderデータベース

近年の計算機アプローチや実験ワークフローの進歩により、ゲノムワイドな生物学的・ゲノムデータを比較的容易に、かつ一般的に取得することができるようになった。このハイスループット・データは、数百種類の植物のDNA(配列、メチル化、クロマチンアクセシ…

系統樹検索エンジン SHOOT.bio

遺伝子間の進化的関係を明らかにすることは、比較生物学研究の基本である。ここでは、SHOOTを紹介する。SHOOTは、ユーザからのクエリー配列を系統樹のデータベースと照合し、クエリー配列が正しく配置された系統樹を返す。SHOOTはBLAST検索に匹敵する速度で…

真核生物のシンテニックパンゲノムアノテーションを行う GENESPACE

多くの分類群において高品質な複数のリファレンスゲノム配列が利用可能になったことで、分子進化のパターンやプロセスを高解像度で見ることができるようになった。しかし、真核生物のほぼすべての系において、複数のリファレンスハプロタイプの情報を活用す…

植物の公共RNA-Seqライブラリを分析するためのユーザーフレンドリ―なデータベース PPRD

ハイスループットRNA-sequencing(RNA-seq)は、その低コストと高いカバレッジにより、ここ10年で最も人気のある遺伝子発現プロファイリング技術になった。その結果、植物界からのRNA-seqライブラリの数は近年飛躍的に増加している。トウモロコシ、イネ、ダ…

ゲノムアセンブリを修正したりscaffoldingするためのツールコレクション RagTag

作物のゲノム解析を進めるためには、高品質な個別ゲノムアセンブリによる効率的な遺伝子システムが必要である。ここでは、アセンブリーのscaffoldingやパッチを自動化するツールセットであるRagTagを紹介し、広く使われているトマトの遺伝子型M82と、機能的…

真核生物の比較ゲノミクスのためのゲノムブラウザ Genomicus

Genomicusは、真核生物の比較ゲノミクスに特化したデータベースおよびウェブサーバである。Genomicusの主な機能は、複数のゲノム間でのゲノムブロックの保存状態をグラフィカルに表現することであり、特定の遺伝子を中心とした局所的な保存状態や、核型比較…

オルガネラゲノムの遺伝子の多重整列を自動で構築するパイプライン HomBlocks

オルガネラの系統解析を行うためには、あらかじめアラインメントされた単一遺伝子データセットを連結したマルチ遺伝子アラインメントマトリクスを正確に構築する必要がある。しかし、数十から数百の相同遺伝子からなる高品質なマルチ遺伝子アラインメントを…

(イネ科)比較ゲノミクスとパスウェイの力を植物研究に生かす Gramene

Gramene(http://www.gramene.org)は、モデル植物と主要作物のゲノムおよびパスウェイデータの比較機能解析に基づいたナリッジベースで、世界中の農業研究者をサポートする。このリソースは、FAIRデータ原則に基づいて、オープンアクセスと再現可能な科学を…

植物の発現データの視覚化と探索を行う ePlant

現在のシステムバイオロジー研究では、異なる種類のデータを別々のソースからアクセスし、別々のツールを使って視覚化しなければならないという大きな課題がある。このようなワークフローをナビゲートするために必要な高い認知的負荷は、仮説の生成に悪影響…

事前計算された植物の遺伝子ファミリーの系統樹 PhyloGenes

著者らは、シロイヌナズナや他のモデル生物から得られた遺伝子機能に関する知識を、他の植物種に正確かつ効率的に伝達できるようにすることを目指している。このような知識移転は、植物の系統における個々の遺伝子やゲノム全体の重複のために、植物において…

HiFiロングリードを使ってhaplotype-resolved assemblyを行う Hifiasm

2022/03/26 Hi-Cと組み合わせた論文引用、ツイート追記 2023/02ツイート追記 2024/04/06 追記、help更新、9/5 レポジトリリンク修正 Haplotype-resolved de novo assemblyは、ゲノム配列のバリエーションを研究するための究極のソリューションである。しかし…

様々な種のバリアント情報をまとめたデータベース Genome Variation Map(GVM)

Genome Variation Map (GVM; http://bigd.big.ac.cn/gvm/) は、ゲノム変異の公開データリポジトリである。幅広い種のゲノム変異を収集・統合することを目的としており、世界中から様々な変異タイプの投稿を受け付けており、世界中の研究活動を支援するために…

LTRレトロトランスポゾンを識別可能な割合でゲノムアセンブリを評価するIndex LAI

2020 11/7 タイトル修正 2020 11/8 感想追加 2020 11/11 誤字修正, タイトル修正(”主に植物”を削除) 構造的特徴に基づくコンピュータプログラムを用いたLTR要素の同定は効率的であるが(10,11)、多数の偽陽性(4)に悩まされている。最近、インタクトなLTRレ…

ゲノムアセンブリからLTR-RTを同定する LTR_retriever

2020 11/6 追記 2023/01/010. 01/11 インストール手順修正 Long terminal repeat retrotransposons (LTR-RT)は植物ゲノムに多く存在する。LTR-RTの同定は、高品質な遺伝子アノテーションを実現するために重要である。しかし、これらのプログラムは特異性が低…

(植物)葉緑体ゲノム配列を自動で完全にアノテーションする CPGAVAS2

葉緑体ゲノムの完全長配列は、種の進化の歴史に関する豊富な情報を提供している。次世代シークエンシング技術の進展に伴い、葉緑体ゲノムの完全配列の数は飛躍的に増加すると予想されており、ゲノム配列をアノテーションするための強力な計算機ツールが急務…