macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2022

超高速なfastqの前処理ツール RabbitQCPlus

2023/01/28 追記 シーケンサーデータの品質評価は、ダウンストリームデータ解析において重要な役割を担っている。しかし、既存のツールは、特に圧縮ファイルを扱う場合や、過剰発現解析のような複雑な品質管理操作を行う場合、最適とは言えない効率を達成す…

3'UTRのアノテーションを行う peaks2utr

非モデル生物のアノテーションは未解決の問題であり、特に非翻訳領域(UTR)の検出が重要である。UTRの正確なアノテーションはトランスクリプトーム解析において各遺伝子の発現を正確に把握するために非常に重要であるが、アノテーションパイプラインではほ…

リファレンスアセンブリにアライメントした後のリードの品質を評価する best

高精度なシーケンシング技術を開発するためには、プラットフォーム依存のシーケンシングエラーを理解する必要がある。bestは、高品質のリファレンスアセンブリにアライメントされたリードを取り込み、リードごとのメトリクス、サマリー統計、ゲノム区間ごと…

タンパク質のMSA中のSNPを比較することにより、SNP共起パターンを同定する SpydrPick

共分散に基づく共選択的圧力下での多型の発見やエピスタシスは、近年、集団ゲノム科学において非常に注目されている。染色体上の対立遺伝子の集団レベルでの共分散を統計的にモデル化し、多型のペア間の依存性をモデルフリーで検定することで、細菌集団にお…

ロングリード配列やコンティグ配列をビニングする LRBinner

メタゲノム解析の進歩により、環境から直接微生物群集を研究することが可能になった。メタゲノム解析は、微生物群集の種を特定するための重要なステップである。次世代シーケンサーのリードは、ショートリードの情報が限られているため、通常コンティグにア…

ハイブリッドRNAシーケンスデータを使ってゲノムアノテーションを改善する annotate_my_genomes

2022/12/27,28 追記 ハイブリッドシーケンステクノロジーの進歩により、ハイブリッドシーケンス・トランスクリプトミクスを用いてしばしばアノテーションされるゲノムアセンブリがますます拡大し、ゲノムの特性解析が向上し、さまざまな生物における新規遺伝…

EMBL-EBIのMGnifyのアップデート

MGnifyプラットフォーム(https://www.ebi.ac.uk/metagenomics)は、微生物由来の核酸配列のアセンブリ、解析、保存を容易にする。このプラットフォームでは、メタバーコード、メタトランススクリプトーム、メタゲノムなど、様々な環境由来のデータセットを…

高品質の原核生物ゲノムを正確かつ一貫してアノテーション付けた proGenomes3

ゲノム、トランスクリプトーム、その他の微生物オミックスデータの解釈は、十分にアノテーションされたゲノムの利用可能性に大きく依存している。公開されている微生物ゲノムの数が指数関数的に増加し続ける中、品質管理と一貫したアノテーションの必要性が…

メタゲノム情報も利用するメタトランスクリプトームアセンブラ MetaGT

メタゲノムシーケンスは、微生物コミュニティのゲノム配列と構成に関する洞察を提供することができるが、メタトランスクリプトーム解析は、微生物コミュニティの機能的活性を研究するために有用であると考えられる。RNA-Seqデータは、コミュニティ内の活性な…

MinHashスケッチで数百万個のバクテリアゲノムの高速クラスタリング解析を可能にする RabbitTClust

スケッチベースの距離推定に基づく、高速でメモリ効率の良いゲノムクラスターツールRabbitTClustを紹介する。本手法は、次元削減技術とストリーミング、最新のマルチコアプラットフォーム上での並列化を組み合わせることで、大規模データセットの効率的な処…

一塩基変異や逆転写酵素によるアレストイベントを検出する JACUSA2

シーケンシングデータからRNA修飾を検出するためのハイスループットな抗体不要の方法がいくつか開発されている。ここでは、IlluminaまたはNanoporeプラットフォームをベースとするRNA修飾検出アッセイのための多用途ソフトウェアソリューションおよび包括的…

BAM/SAM/CRAM、VCF、FASTQ、GFF3の効率的な圧縮器 genozipのバージョン14アップデート

2022/12/05, 06 HP更新 Genozip は、広く利用されている FASTQ、BAM、VCF ファイル形式を含む、幅広いゲノムデータの圧縮を行う。ここでは、BAMおよびCRAMファイルの圧縮に焦点を当てた、Genozip技術の最新の進歩を紹介する。様々な種類の研究(全ゲノムシー…

パンゲノムグラフのためのツール ODGI

Pangenomeグラフは、ゲノムコレクションの相互アラインメントを完全に表現するものである。このモデルは、構造的に複雑な領域を含む集団の全ゲノム多様性を研究する機会を提供する。しかしながら、パンゲノムグラフを用いた数百ギガスケールのゲノムの解析は…

オミックスデータを簡単に可視化できるWebアプリケーション GraphBio

オミックスデータは大量に生産され、通常、高度な可視化解析が必要とされる。これらの解析にはプログラミングのスキルが必要な場合が多く、実験生物学者にとっては難しい。したがって、より使いやすいツールが早急に求められている。 本発表では、オミックス…

真菌のITSやコアタンパク質コード遺伝子を使った系統解析を自動で実行する UFCG pipeline

UFCG pipelineを使うと、真菌のITSやコアタンパク質を使った系統解析を自動で実行できます。簡単にですが、使い方を確認しておきます。 UFCG is a database&pipeline for fungi phylogenomics. Our db contains 61 marker genes, 20 widely used & 41 novel …

ショートリードからの株レベルメタゲノムアセンブリを行う StrainXpress

次世代シーケンサーを用いたメタゲノム解析により、長時間の培養を必要とせず、特徴的な生息環境にある微生物を同定することが可能になった。重要なことは、薬剤耐性、病原性、環境との相互作用など、臨床に関連する現象が種内で既に変化している可能性があ…

原核生物ゲノムのアセンブリ結果およびアノテーションを改善するためのWebプラットフォーム ReNoteWeb

DNA塩基配列の解読にかかる費用と時間が短縮されたことにより、NCBI(National Center for Biotechnology Information)のような公開データベースへの生物情報の寄託が大幅に増加した。1回の実行で大量のデータが生成されるため、この新しい特徴を持つデータ…

全自動のトランスポーザブル・エレメントのアノテーションと解析のパイプライン Earl Grey

トランスポーザブル・エレメント(TE)は、ほぼ全ての真核生物ゲノムに存在し、様々な進化過程に関与している。TEに関する研究は非常に盛んだが、そのアノテーションと特性解析は、特に非専門家にとって依然として困難である。(i)断片的で重複するTEアノテー…

(ヒト)バリアントの機能的アノテーションリソース FAVOR

大規模な全ゲノムシークエンシング(WGS)研究とバイオバンクにより、多数のコーディングおよびノンコーディングバリアントが急速に生成されている。これらは、ヒト疾患の遺伝的基盤を明らかにするための前例のないリソースを提供する。バリアント機能アノテ…

バリアントコーリングを自動化する柔軟でスケーラブルなパイプライン grenepipe

本著者らは、個体や集団のハイスループットな生シーケンスデータから遺伝子型バリアントコールまでのデータ処理を効率化するオールインワンSnakemakeワークフローであるgrenepipeを開発した。このパイプラインは、一般的なソフトウェアツールを単一の設定フ…

海洋環境ゲノムをマイニングするためのオンラインサービス The Ocean Gene Atlas v2.0

Tara Oceansの海洋メタゲノムやメタトランスクリプトームのような大規模データリソースを用いて遺伝子の生物地理に関する仮説を検証するには、多大なハードウェアリソースとプログラミングスキルが必要になる。今回リリースされた「Ocean Gene Atlas」(OGA2…

keggcharter

Githubより KEGGCharter は KEGG API と Pathway 機能のユーザーフレンドリーな実装です。特徴は KEGG ID から KEGG Orthologs (KO) への変換、および KO から EC 番号への変換。 主要な分類群の代謝ポテンシャルを KEGG メタボリックマップで表現(上位 10 …

未知微生物種も含めてメタゲノムプロファイリングする MetaPhlAn 4

2022/8/26 追記 2022/09/07 インストール修正 メタゲノム解析は、微生物群集から新規生物を発見することを可能にするが、多くのメタゲノムからは、少数の豊富な生物しか捕らえることができない。そこで、メタゲノム解析と単離ゲノムの情報を統合し、より包括…

メタゲノムの分類学的プロファイリングを行う mOTUs3

2022/09/07 誤字修正、オプション追記, 10/17 インストール手順修正 2022/12/18 論文引用 分類学的プロファイリングは、生物試料中の微生物の相対的な存在量を検出・定量することを目的としたマイクロバイオーム研究の基本的なタスクである。ショットガンメ…

真菌のコア遺伝子データベースとゲノムワイド系統解析のためのパイプライン UFCG

系統発生学では、生物の進化的関係をゲノム情報によって研究する。各生物から関連する遺伝子を抽出し、多重配列アラインメントを構築し、系統樹によって進化関係を再構築するのが一般的なアプローチである。この解析には、分類群内での効率的な自動化を可能…

2ラウンドのオーバーラッピングとキャッシュに基づく高速エラー訂正を行う Fec

第3世代シーケンサーは長いリード長でゲノム解析を進めるが、リードのエラーレートが高いため、エラー訂正が必要になる。特にシーケンスカバレッジが高い場合、エラー訂正は時間のかかる作業である。一般に、既存の誤り訂正手法は、重複するリードAを訂正す…

ゲノムアセンブリ間でリードを素早くリマッピングする FastRemap

ゲノムリードデータセットは、一般的に使用されている CrossMap ツールなどの様々なツールを用いて、あるリファレンスから別の類似したリファレンス(例えば、2つのバージョンの異なる間や2つの類似した種間)へ迅速かつ効率的に再マッピングすることができ…

関心のあるあらゆる生物のWGSデータセットに対して、SV、SNP、IN/DEL、およびCNVのコールとアノテーションを実行する PerSVade

2022/08/22 オプション追記 構造バリアント(SV)はゲノムの変異の根底にあるものだが、ショートリードからの検出が困難なため、見落とされることがよくある。ほとんどのアルゴリズムはヒトでテストされており、他の生物にどの程度適用できるかはまだ不明で…

InParanoidをDIAMONDにより高速化した InParanoid-DIAMOND

バイオインフォマティクスにおいて、祖先を共有する異なる生物種の遺伝子であるオルソログを予測することは重要な課題である。オルソログ予測ツールは、大量のデータを実行可能な時間内に解析するために、正確かつ高速に予測することが要求される。InParanoi…

ユーザーフレンドリーなデータ可視化ウェブサーバー ImageGP

データの可視化は,研究者の間で結果を説明し,知識を共有するために重要な役割を果たす.しかし、多くの可視化ツールは十分なコーディング経験を必要としたり、特殊な用途のために設計されていたり、無償でなかったりする。ここでは、生物・化学データの可…