macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2021-01-01から1年間の記事一覧

ゲノムアセンブリを修正したりscaffoldingするためのツールコレクション RagTag

作物のゲノム解析を進めるためには、高品質な個別ゲノムアセンブリによる効率的な遺伝子システムが必要である。ここでは、アセンブリーのscaffoldingやパッチを自動化するツールセットであるRagTagを紹介し、広く使われているトマトの遺伝子型M82と、機能的…

STRINGデータベースのランクベース機能的エンリッチメント解析

パスウェイ解析(PA)は、機能的エンリッチメント解析としても知られている(引用)。パスウェイ解析ツールの目的は、ハイスループットテクノロジーから得られたデータを解析し、コントロールと比較してケースサンプルで変化している関連した遺伝子群(特定…

真核生物の比較ゲノミクスのためのゲノムブラウザ Genomicus

Genomicusは、真核生物の比較ゲノミクスに特化したデータベースおよびウェブサーバである。Genomicusの主な機能は、複数のゲノム間でのゲノムブロックの保存状態をグラフィカルに表現することであり、特定の遺伝子を中心とした局所的な保存状態や、核型比較…

転写産物の正確な翻訳と評価を行う TranSuite

タンパク質の翻訳プログラムでは、転写産物の中で最も長いオープンリーディングフレーム(ORF)が選択されることが多いため、データベースには不正確なORFや誤ってアノテーションされたORFが多数存在する。早期終止コドン(PTC)を含む非生産的な転写産物の…

Pathview

パスウェイ解析はオミックス研究で広く用いられている。パスウェイベースのデータ統合と可視化は、解析の重要な要素である。このニーズに応えるために、本著者らは、Pathviewという新しいRパッケージを開発した。Pathviewは、多種多様な生物学的データを分子…

遺伝子構造に基づいてメタゲノム中の真核生物と原核生物のコンティグを区別する Whokaryote

2022/05/04 追記 メタゲノミクスは、微生物群集に含まれるすべての生物の機能的可能性を研究するための著名な技術となっている。しかし、ほとんどの研究では、真核微生物を無視して、微生物群集に含まれるバクテリアに焦点を当てている。実際、多くのメタゲ…

Nanopore RNAseqのためのフルスタックで軽量なウェブサーバ Duesselpore

トランスクリプトームのゲノムワイドな解析は、既知のすべての生物種の生理学の基礎となる分子メカニズムに関する広範な洞察を提供し、まだ隠されているものを発見することを可能にする。近年、オックスフォード・ナノポア・テクノロジー(ONT)は、次世代シ…

ロングリードを使ったゲノムアセンブリの評価とミスアセンブリ修正を行う Inspector

全ゲノムde novoアセンブリはリファレンスゲノムを持たない種の研究には不可欠であり、リファレンスゲノムを持つ種の遺伝的変異の全容を明らかにするためにも重要である。ロングリードシーケンシング技術の進歩により、ロングリードはより正確に、より長く、…

MetaProb 2

現在の技術では、事前に培養することなく、環境から直接微生物群集の配列を決定することができる。微生物サンプルを解析する際の大きな問題の一つは、そのサンプルに含まれる種を特定するために、リードを分類学的にアノテーションすることである。分類学的…

Hi-Cシーケンスデータのリファレンスベースもしくはリファレンスフリーの品質評価ツール qc3C

Hi-Cは、DNA分子間の空間的な相互作用をゲノム全体で捉えることができるハイスループットシーケンシングを可能にするサンプル調製法である。この技術は、クロマチンの3次元構造解析、大規模ゲノムアセンブリのスキャフォールド構築、最近ではメタゲノムアセ…

ロングリードゲノムアセンブリのミスアセンブリ修正およびスキャフォールディングを行う LongStitch

モデル生物や非モデル生物のゲノム研究では、高品質なデノボゲノムアセンブリの作成が不可欠である。近年、ロングリードシーケンシングは、ゲノムアセンブリやスキャフォールディング(ロングレンジ情報を利用してアセンブリされた配列を順番と方向付けする…

(海洋)メタゲノムを原核生物、真核生物、ウイルスに分類する DeepMicrobeFinder

配列の分類は、メタゲノムの複雑さを軽減し、メタゲノムサンプルの構成を基本的に理解するために有効である。しかし、ほとんどの自然環境におけるメタゲノムは、原核生物、真核生物、そしてその両方のウイルスを含む複数の配列ソースから得られているため、2…

オックスフォードナノポアのハプロイドアセンブリを2倍体アセンブリに変換する hapdup

ロングリードシーケンシングは、現在マッピングが困難な領域に到達し、隣接するバリエーションを日常的にリンクさせてリードベースのフェージングを可能にすることで、バリアント検出に変革をもたらす可能性がある。第3世代のナノポアシーケンスデータは、長…

2倍体アセンブリのシンプルなSVコーラー dipdiff

dipdiffは2倍体アセンブリのためのシンプルなSVコールパッケージである。svim-asmの修正版を使用している。このパッケージは、アライナーのバージョンとパラメータに依存する可能性があるため、実行間の再現性を確保するために、独自のバージョンのminimap2…

ショートリードマッピングの高速化 strobealign

2022/04/15 インストール手順更新 ショートリードのゲノムへのアラインメントは、多くのバイオインフォマティクス解析で用いられる基本的な計算ステップである。そのため、このような計算をできるだけ高速に行うことが望まれている。多くのアラインメントア…

効果的な配列類似性検出を行うStrobemers

k-merベースの手法は、バイオインフォマティクスにおいて様々なタイプの配列比較に広く用いられている。しかし、1回の変異でk個の連続したk-merが変異するため、配列比較のためのほとんどのk-merベースのアプリケーションは、変動する変異率に敏感に反応して…

ナノポアのロングリードの品質管理とサマリーレポートを高速に生成する nanoq

2022/02/02 追記 Githubより Nanoqは超高速リードフィルターとサマリーレポートを実装している。品質スコアは、技術文書や別の記事で説明しているように、ナノポア・シーケンス・データからのベースコールに対して計算される。 I recently pushed an update …

STITCHデータベース

2021 11/8 文章修正 タンパク質と低分子の間の相互作用は、生体の生物学的プロセスに不可欠な要素である。これらの相互作用に関する情報は、多くのデータベース、テキスト、予測手法に分散しているため、利用可能な証拠を包括的に把握することは困難である。…

リボソームプロファイリング解析のための統合プラットフォーム RiboToolkit

リボソームプロファイリング(Ribo-seq)は,コドン占有率のプロファイリング,活発に翻訳されているオープンリーディングフレーム(ORF)の同定から,様々な生理学的・実験的条件下での翻訳効率の定量化まで,RNAの翻訳をグローバルにモニタリングする強力…

Circosプロットをインタラクティブに作成するためのR/Shinyアプリケーション shinyCircos

2023/11/01 URL修正 Circosプロットの作成は、ゲノムデータを視覚化する最も効率的なアプローチの一つである。しかし、Circosプロットを作成するための既存のツールをインストールして使用することは、コーディングの経験がないユーザーにとっては難しい。こ…

miRNA-seqデータの比較的品質管理のためのウェブサーバ miRNA-seq

miRNA-seq は様々な分野で幅広く使用されているが、その品質管理は PhredScore ベースのフィルターに限定されることが多くなっている。microRNAの収量、推定分解産物(rRNA断片など)の割合、アダプターダイマーの割合など、品質に関連する他の重要な側面は…

バリアントフィルタリングとポリッシングを行う Merfin

ノイズの多いロングリードから正確なジェノタイピングを行い、コンセンサスの質を向上させるために、リードマッピングやバリアントコーリングの手法が広く用いられている。バリアントコールの精度は、リードの品質、リードマッピングアルゴリズムとバリアン…

包括的かつ品質管理されたタンパク質間相互作用のデータベース STRINGデータベース

2021 11/8 タイトル修正 細胞の生命活動は、生体分子間の複雑な機能的相互作用によって成り立っている。その中でも、タンパク質-タンパク質間の相互作用は、その多様性、特異性、適応性から特に重要である。STRINGデータベースは、物理的相互作用と機能的相…

タンデムリピートとその周辺のリードアラインメントをハプロタイプに分解して可視化する REViewer

2021 10/27、20/28追記 ショートタンデムリピート拡張は、家族性筋萎縮性側索硬化症やハンチントン病をはじめとする多くの神経遺伝性疾患の原因となっている。最近では、全ゲノムやエクソームのシーケンスデータからリピートの拡大を同定する方法が複数開発…

包括的なマイクロRNAおよびtRFシーケンシング解析パイプライン miRge3.0

マイクロRNAとtRFは、遺伝子の翻訳制御に関与することで知られる低分子ノンコーディングRNAの一種である。次世代シーケンサー(NGS)の進歩により、high-throughput small RNA-seq研究が可能になったが、これには強固なアラインメントパイプラインが必要であ…

miRNA解析の手法を集めたプラットフォーム Tools4miR

miRNAは、遺伝子の発現を抑制する短いノンコーディング分子であり、生物にとって重要な役割を果たしている。miRNA関連の研究のために、何十もの計算手法が開発されているが、それらはさまざまな面で大きく異なっている。比較が難しい手法が数多く存在するた…

指定されたカバレッジになるようにリードをランダムサブサンプリングする rasusa

レポジトリより 私(オーサー)の要件を満たすリードのサブサンプリング用ツールは見つかりませんでした。私が見つけたツールは、サブサンプルするリードの数や割合を指定するだけのものや、カバレッジに合わせてサブサンプルする場合、すべてのリードが同じ…

オックスフォードナノポアのリードのアセンブルを素早く行う dragonflye

2022/03/26 インストールコマンドの間違い修正 レポジトリより バクテリアの配列を扱ったことがある人なら、おそらくTorsten Seemann氏(HP)のツールの一つを使ったことがあるでしょう。そのようなツールの1つがShovill(紹介)で、バクテリアのゲノムアセ…

原核生物ゲノム中の偽遺伝子候補を検出する Pseudofinder

2022/07/09 論文引用 原核生物のゲノムは一般的に遺伝子密度が高く、偽遺伝子(機能していない、あるいは不活性化された遺伝子の残骸)は比較的少ない。しかし、近年の生態系の変化や、共生生物や病原体が経験したような極端な個体数の減少など、特定の状況…

シアノバクテリアのキュレーションされた16S rRNA遺伝子のwebデータベース Cydrasil 3

シアノバクテリアは、広く普及している重要な細菌門であり、地球上の炭素・窒素固定のかなりの部分を担っている。しかし、シアノバクテリアの16S rRNA遺伝子配列の信頼性の高い正確な自動分類は、相反する体系的なフレームワーク、一貫性のない分類学的な定…