macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2024

HiFiリードを使う複雑な植物オルガネラゲノムのde novoアセンブリツール Oatk

植物オルガネラゲノム、特に複雑な繰り返し構造を持つ巨大なミトコンドリアゲノムは、アセンブリにとって大きな課題である。ロングリードシーケンス技術の登場は、完全長のゲノムを構築する画期的な機会を提供するが、代替構造を解決する問題は依然として残…

高速なトランスクリプトームアノテーションパイプライン TransAnnot

深くシークエンシングされ、de novoアセンブルされたトランスクリプトームのアノテーションは、最新のツールの中には動作が遅く、インストールが難しく、使いにくいものがあるため、依然として難題である。TransAnnotはトランスクリプトームのアノテーション…

細菌ゲノムにコードされた二次代謝産物の多様性を探索するためのウェブリソース BGC Atlas

2024/11/01 タイトル変更 二次代謝産物とは、生物の発生には必須ではないが、生態学的・生理学的に重要な利益をもたらす化合物のことである。これらの化合物は、医療、バイオテクノロジー、農業に応用されている。二次代謝産物の生産は、生合成遺伝子クラス…

AlphaFastPPi

2024/10/31追記、論文引用、11/02追記 プロテオーム全体にわたる新しいタンパク質間相互作用(PPI)を発見することは、新しいタンパク質の機能を理解し、生物内あるいは生物間のシステム特性を解明する上で大きな可能性をもたらす。近年の計算構造生物学、特…

被子植物7種8器官の遺伝子発現アトラス DevSeq

生物種間の表現型の違いはタンパク質コード配列と遺伝子発現の変化によって大きく左右される。ここでは、7種8器官のトランスクリプトームを解析することにより、被子植物のタンパク質コード遺伝子の発現パターンが急速に進化していることを示す。4,500万年以…

自動化されたラージゲノムアセンブリと評価のためのツール Pipeasm

高品質なリファレンスゲノムを用いた生物多様性研究の取り組みが活発化し、さまざまな生物の塩基配列決定が可能になっていることから、大規模ゲノムアセンブリのための最先端の方法論を取り入れた、アクセスしやすく、再現性が高く、使いやすいツールの開発…

グラフベースのパンゲノムアノテーションとクラスタリングを行う ggCaller

細菌ゲノムは、遺伝子含有量と配列変異の両方において異なっており、抗菌薬に対する感受性やワクチン誘発免疫の変異など、広範な表現型の多様性の根底にある。重要な変異を同定し定量化するためには、集団内のすべての遺伝子を予測し、機能アノテーションを…

ウイルスゲノムの超高速・高精度配列アライメント、ANI計算とクラスタリングを行う vclust

Viromicsは毎年数百万個のウイルスゲノムと断片を産生し、従来の配列比較法を圧倒している。Vclustは、Lempel-Ziv構文解析によって平均塩基同一性を決定し、権威ある viral genomics and taxonomy consortiaによって承認された閾値でウイルスゲノムをクラス…

複雑な構造変異を検出するためのロングリードベースの手法 FindCSV

構造変異は遺伝病や進化のメカニズムにおいて重要な役割を果たしている。過去10年間、単純な構造変異を検出するために広範な研究が行われ、確立された検出方法が開発された。しかし、最近の研究では、単純な構造変異に比べて複雑な構造変異が個体に与える影…

大規模なゲノム配列セットのANI値を計算する LZ-ANI

LZ-ANIは、大規模なゲノム配列セットの平均ヌクレオチド同一性(ANI)を決定するための、高速でメモリ効率のよいツールである。このツールはLempel-Ziv構文解析を使用し、一致するヌクレオチドと不一致のヌクレオチドを高感度で識別し、ANIの正確な決定を可…

比較ゲノミクスのための遺伝子座の可視化ツール LoVis4u

比較ゲノム解析では、ゲノムの遺伝子座のアラインメントを可視化することがよくある。PythonやRのライブラリからスタンドアローンのGUIまで、このタスクのためにいくつかのソフトウェアツールが利用可能であるが、高速で自動化された使用法と出版可能なベク…

k-merの起源となる配列を見つける Back to sequences

2024/10/09追記 生のシーケンスデータの処理に特化したバイオインフォマティクスツールの大部分は、k-mersの概念を多用している。これにより、データの冗長性(ひいてはメモリの圧迫)を減らし、シーケンスエラーを破棄し、操作可能で容易に比較できる固定サ…

minimap2インデックスに既知バリアント情報を組み込むことで、WGSでのSNVコールを改善する minimap2_index_modifier

リファレンスゲノム配列に対するリードのアライメントは、次世代シーケンサー(NGS)技術によって得られたヒト全ゲノムシーケンスデータの解析における重要なステップの1つである。遺伝的変異の臨床的解釈の結果やゲノムワイド関連研究GWASの結果など、その…

ロングリードメタゲノムアセンブリから株レベルのphasingアセンブリを行う Strainy

微生物群集に含まれる細菌種は、ゲノムの小さな変異によって区別される菌株の混合物であることが多い。ショートリード法は、菌株間の小規模な変異を検出するために使用できるが、これらの変異を連続したハプロタイプにphasing(位相を揃える)することはでき…

タンパク質配列のゲノム配列へのスプライスアライメントの速度と精度を向上させた Spaln3

Spalnは、哺乳類サイズの真核生物ゲノム配列にタンパク質のクエリ配列をスプライスアライメントし、自己完結的にゲノムマッピングを行うための最も初期の実用的なツールである。しかし、その計算速度は、急速に増加するゲノムおよび転写産物配列データの解析…

(主に動植物)遺伝子ノテーションの品質向上のためのシンテニーベースのツールキット SynGAP

2024/09/06 追記 ゲノム配列決定は生物学者にとって日常的な作業となったが、遺伝子構造アノテーションの課題は依然として残っており、正確なゲノム・遺伝子研究を妨げている。SynGAPは、遺伝子のシンテニー情報を利用して、ゲノムの遺伝子構造アノテーショ…

細菌の種レベル以上でのパンゲノム計算のための包括的コアゲノムアノテーションパイプライン RIBAP

2024/09/03 追記, 9/5追記 微生物パンゲノム解析は、原核生物ゲノム中の遺伝子の有無を同定する。しかし、現在のツールでは、配列の多様性が高い種や、属や科のような分類学上の上位の種を解析する場合には限界がある。Roary ILP Bacterial core Annotation…

出版品質の一塩基多型可視化プロットを出力する Snipit

Snipitは、配列中の一塩基多型を参照配列と比較して要約するためにデザインされた解析・可視化ツールである。このツールは、ヌクレオチドやアミノ酸の違いを効率的にカタログ化し、カスタマイズ可能な出版用の図を通して明確な比較を可能にする。設定可能な…

タンパク質構造検索・アライメントアルゴリズム Reseek

アミノ酸配列からのタンパク質フォールド予測における最近のブレークスルーは、新しい構造の洪水を解き放った。タンパク質空間への洞察を広げ、生物工学や治療法への実用化を追求する新たな機会をもたらすと同時に、新たな課題も提示している。それと同時に…

ゲノム領域を柔軟に調整して視覚化と比較ができるユーザーフレンドリーなアプリケーション GenoFig

生物の分子進化の歴史を理解するには、通常、近縁種や系統のゲノム領域を視覚的に比較する必要がある。このタスクを達成するためのアプリケーションはすでにいくつか存在するが、それらは古すぎたり、限定的すぎたり、あるいは複雑すぎたりして、ほとんどの…

タンパク質の機能的アノテーションを行う AnnoPRO

タンパク質の機能アノテーションは生物科学における長年の課題の一つであり、様々な計算手法が開発されてきた。しかし、既存の方法では、GOファミリーの数が多く、アノテーションされたタンパク質が少ないという深刻なロングテール問題に悩まされている。そ…

生物間の遺伝子機能の類似点と相違点をインタラクティブに探索するウェブツール Comparative Genome Dashboard

Comparative Genome Dashboardは、生物間の遺伝子機能の類似点と相違点をインタラクティブに探索するためのウェブベースのソフトウェアツールである。このツールは細胞機能のハイレベルなグラフィカルな調査を提供し、興味のあるサブシステムをより詳細に調…

高忠実度なin silicoモデリングによるRNA-Seqシミュレータ BEERS2

RNA-seqリードのシミュレーションは、バイオインフォマティクスツールの評価、比較、ベンチマーク、開発において極めて重要である。しかし、RNA-seqシミュレータの分野は過去10年間ほとんど進歩していない。このニーズに応えるため、本著者らは柔軟で高度に…

高い特異性と感度で外来配列を除去する ContScout

ゲノムのコンタミネーションは、比較進化ゲノミクスからメタゲノミクスに至るまで、様々なダウンストリームアプリケーションに影響を及ぼす問題として、ますます認識されるようになってきている。ここでは、ContScoutを紹介する。ContScoutは、アノテーショ…

T2Tゲノムアセンブリの評価ツール Genome Continuity Inspector (GCI)

最近のロングリードシーケンス技術の進歩により、高品質なゲノムアセンブリの作成が大幅に容易になった。テロメアtoテロメアなギャップレス(T2T)アセンブリは、ゲノムアセンブリの新たなゴールデンスタンダードとなっている。最近、T2Tレベルのリファレン…

生のメタゲノムシークエンシングリードからターゲットのタンパク質を読んだリードを同定する Lapidary

ゲノムおよびメタゲノムの比較は、サンプル間で異なる、または共通する遺伝的エレメントを同定することに依存している。これらの遺伝的エレメントは、シークエンシングリードをアセンブルし、アセンブリ中の遺伝的エレメントを同定することによって、または…

タンパク質のドメインレベルのアノテーションを行う Domainator

2024/06/03 タイトル修正、誤字修正 生物学的配列の大規模なデータベースが利用可能になったことで、遺伝子の多様性と機能を深く探求する機会がもたらされた。細菌防御系は、多様であるがアノテーションが困難な遺伝子の豊富な供給源であり、バイオテクノロ…

リガンド誘導性転写因子のゲノムマイニングを行う Ligify

原核生物の転写因子はリガンドによって遺伝子発現を制御するバイオセンサーとして利用可能であるが、現在はバイオセンサーが存在する化学リガンドのランドスケープは極めて限られている。この状況を拡大するために、本著者らは、enzyme reaction databasesの…

公開されているシークエンシングデータを取得する統合ツール iSeq

ハイスループットシーケンス技術(Next Generation Sequencing; NGS)は、多様な生物学的探究に取り組む研究者によってますます活用されるようになっている。最新のシーケンシングの驚くべきスケールと効率を活用し、ゲノム解析からタンパク質-核酸相互作用…

植物ゲノムのLTRレトロトランスポゾンのアノテーションを行うパイプライン DANTEとDANTE_LTR

ロングターミナルリピート(LTR)レトロトランスポゾンは、ほとんどの植物種のゲノムにおいて、反復DNAエレメントの主要なクラスである。配列決定された植物ゲノムの数は加速度的に増加しており、植物ゲノムアセンブリ中のLTRレトロトランスポゾンの効率的な…