macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2021-11-01から1ヶ月間の記事一覧

バクテリアのプロモーター認識のための一般的なツール Promotech

2021 11/29 コマンド修正 プロモーターとは、転写装置が結合して特定の遺伝子の転写を開始するゲノム領域のことである。細菌のプロモーターを同定するための計算機ツールは何十年も前から存在している。しかし、これらのツールのほとんどは、1つまたは少数の…

グラフ構造に基づいてキメラコンティグを識別する、ショートリードのde novo transcriptomeアセンブラCStone

RNA-Seq実験で得られたコンティグを含め、過去10年間に蓄積された配列情報は飛躍的に増加しており、リードデータをアセンブルする際にはキメラ配列の定量が必須となっている。トランスクリプトームでは、de novoでアセンブリされたキメラは、基本的な転写産…

DRAGENのCPUのみ使う実装 DRAGMAP

2021 11/27 追記 まだ初期のアルファリリースということですが、DRAGMAPを試してみました。詳しくはGATKのブログを読んで下さい。BWA-MEMとの性能比較では、興味深い結果が提示されています。 GATK blog Introducing DRAGMAP, the new genome mapper in DRAG…

ゲノムアセンブリを修正したりscaffoldingするためのツールコレクション RagTag

作物のゲノム解析を進めるためには、高品質な個別ゲノムアセンブリによる効率的な遺伝子システムが必要である。ここでは、アセンブリーのscaffoldingやパッチを自動化するツールセットであるRagTagを紹介し、広く使われているトマトの遺伝子型M82と、機能的…

STRINGデータベースのランクベース機能的エンリッチメント解析

パスウェイ解析(PA)は、機能的エンリッチメント解析としても知られている(引用)。パスウェイ解析ツールの目的は、ハイスループットテクノロジーから得られたデータを解析し、コントロールと比較してケースサンプルで変化している関連した遺伝子群(特定…

真核生物の比較ゲノミクスのためのゲノムブラウザ Genomicus

Genomicusは、真核生物の比較ゲノミクスに特化したデータベースおよびウェブサーバである。Genomicusの主な機能は、複数のゲノム間でのゲノムブロックの保存状態をグラフィカルに表現することであり、特定の遺伝子を中心とした局所的な保存状態や、核型比較…

転写産物の正確な翻訳と評価を行う TranSuite

タンパク質の翻訳プログラムでは、転写産物の中で最も長いオープンリーディングフレーム(ORF)が選択されることが多いため、データベースには不正確なORFや誤ってアノテーションされたORFが多数存在する。早期終止コドン(PTC)を含む非生産的な転写産物の…

Pathview

パスウェイ解析はオミックス研究で広く用いられている。パスウェイベースのデータ統合と可視化は、解析の重要な要素である。このニーズに応えるために、本著者らは、Pathviewという新しいRパッケージを開発した。Pathviewは、多種多様な生物学的データを分子…

遺伝子構造に基づいてメタゲノム中の真核生物と原核生物のコンティグを区別する Whokaryote

2022/05/04 追記 メタゲノミクスは、微生物群集に含まれるすべての生物の機能的可能性を研究するための著名な技術となっている。しかし、ほとんどの研究では、真核微生物を無視して、微生物群集に含まれるバクテリアに焦点を当てている。実際、多くのメタゲ…

Nanopore RNAseqのためのフルスタックで軽量なウェブサーバ Duesselpore

トランスクリプトームのゲノムワイドな解析は、既知のすべての生物種の生理学の基礎となる分子メカニズムに関する広範な洞察を提供し、まだ隠されているものを発見することを可能にする。近年、オックスフォード・ナノポア・テクノロジー(ONT)は、次世代シ…

ロングリードを使ったゲノムアセンブリの評価とミスアセンブリ修正を行う Inspector

全ゲノムde novoアセンブリはリファレンスゲノムを持たない種の研究には不可欠であり、リファレンスゲノムを持つ種の遺伝的変異の全容を明らかにするためにも重要である。ロングリードシーケンシング技術の進歩により、ロングリードはより正確に、より長く、…

MetaProb 2

現在の技術では、事前に培養することなく、環境から直接微生物群集の配列を決定することができる。微生物サンプルを解析する際の大きな問題の一つは、そのサンプルに含まれる種を特定するために、リードを分類学的にアノテーションすることである。分類学的…

Hi-Cシーケンスデータのリファレンスベースもしくはリファレンスフリーの品質評価ツール qc3C

Hi-Cは、DNA分子間の空間的な相互作用をゲノム全体で捉えることができるハイスループットシーケンシングを可能にするサンプル調製法である。この技術は、クロマチンの3次元構造解析、大規模ゲノムアセンブリのスキャフォールド構築、最近ではメタゲノムアセ…

ロングリードゲノムアセンブリのミスアセンブリ修正およびスキャフォールディングを行う LongStitch

モデル生物や非モデル生物のゲノム研究では、高品質なデノボゲノムアセンブリの作成が不可欠である。近年、ロングリードシーケンシングは、ゲノムアセンブリやスキャフォールディング(ロングレンジ情報を利用してアセンブリされた配列を順番と方向付けする…

(海洋)メタゲノムを原核生物、真核生物、ウイルスに分類する DeepMicrobeFinder

配列の分類は、メタゲノムの複雑さを軽減し、メタゲノムサンプルの構成を基本的に理解するために有効である。しかし、ほとんどの自然環境におけるメタゲノムは、原核生物、真核生物、そしてその両方のウイルスを含む複数の配列ソースから得られているため、2…

オックスフォードナノポアのハプロイドアセンブリを2倍体アセンブリに変換する hapdup

ロングリードシーケンシングは、現在マッピングが困難な領域に到達し、隣接するバリエーションを日常的にリンクさせてリードベースのフェージングを可能にすることで、バリアント検出に変革をもたらす可能性がある。第3世代のナノポアシーケンスデータは、長…

2倍体アセンブリのシンプルなSVコーラー dipdiff

dipdiffは2倍体アセンブリのためのシンプルなSVコールパッケージである。svim-asmの修正版を使用している。このパッケージは、アライナーのバージョンとパラメータに依存する可能性があるため、実行間の再現性を確保するために、独自のバージョンのminimap2…

ショートリードマッピングの高速化 strobealign

2022/04/15 インストール手順更新 ショートリードのゲノムへのアラインメントは、多くのバイオインフォマティクス解析で用いられる基本的な計算ステップである。そのため、このような計算をできるだけ高速に行うことが望まれている。多くのアラインメントア…

効果的な配列類似性検出を行うStrobemers

k-merベースの手法は、バイオインフォマティクスにおいて様々なタイプの配列比較に広く用いられている。しかし、1回の変異でk個の連続したk-merが変異するため、配列比較のためのほとんどのk-merベースのアプリケーションは、変動する変異率に敏感に反応して…

ナノポアのロングリードの品質管理とサマリーレポートを高速に生成する nanoq

2022/02/02 追記 Githubより Nanoqは超高速リードフィルターとサマリーレポートを実装している。品質スコアは、技術文書や別の記事で説明しているように、ナノポア・シーケンス・データからのベースコールに対して計算される。 I recently pushed an update …

STITCHデータベース

2021 11/8 文章修正 タンパク質と低分子の間の相互作用は、生体の生物学的プロセスに不可欠な要素である。これらの相互作用に関する情報は、多くのデータベース、テキスト、予測手法に分散しているため、利用可能な証拠を包括的に把握することは困難である。…

リボソームプロファイリング解析のための統合プラットフォーム RiboToolkit

リボソームプロファイリング(Ribo-seq)は,コドン占有率のプロファイリング,活発に翻訳されているオープンリーディングフレーム(ORF)の同定から,様々な生理学的・実験的条件下での翻訳効率の定量化まで,RNAの翻訳をグローバルにモニタリングする強力…

Circosプロットをインタラクティブに作成するためのR/Shinyアプリケーション shinyCircos

2023/11/01 URL修正 Circosプロットの作成は、ゲノムデータを視覚化する最も効率的なアプローチの一つである。しかし、Circosプロットを作成するための既存のツールをインストールして使用することは、コーディングの経験がないユーザーにとっては難しい。こ…

miRNA-seqデータの比較的品質管理のためのウェブサーバ miRNA-seq

miRNA-seq は様々な分野で幅広く使用されているが、その品質管理は PhredScore ベースのフィルターに限定されることが多くなっている。microRNAの収量、推定分解産物(rRNA断片など)の割合、アダプターダイマーの割合など、品質に関連する他の重要な側面は…