macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

BMC Bioinformatics

ショートリードの遺伝子予測の高速化 FragGeneScanRs

FragGeneScanは現在、短くてエラーが起こりやすいリードの遺伝子予測に最も正確で人気のあるツールであるが、その実行速度は大規模データセットで使用するには不十分である。この問題を解決するはずの並列化も非効率的であった。その代替実装であるFragGeneS…

腫瘍全ゲノムの体細胞変異エンリッチメント解析のための柔軟なツールセット MutEnricher

腫瘍の全エキソームから体細胞変異を解析することで、新規のガンドライバー遺伝子の発見が加速されている。しかし、ゲノムの約98%はノンコーディングであり、その中には変異によって正常な細胞機能が損なわれる可能性のある調節エレメントも含まれている。一…

階層的ガイドゲノムアセンブラ HGGA

De novoゲノムアセンブリでは、通常、完全なゲノムではなく、コンティグのセットが作成される。そのため、ゲノムの完全な構造を決定するためには、遺伝的連鎖地図、オプティカルマップ、Hi-Cデータなどの追加データが必要となる。従来の研究では、コンティグ…

オミックスデータを探索するためのウェブベースアプリケーション ShinyOmics

オミックスプロファイリングは、生物の行動や環境中の反応を捉えるなど、大規模な生物学的データセットを得るための、ますます顕著なアプローチのcollectionである。このような大規模なデータセットを、プログラミングの経験なしに手作業で解析し、解釈する…

RNA-seqの主成分分析のためのR/Bioconductorパッケージ pcaExplorer

2022/01/30 誤字修正 主成分分析(PCA)は、RNAシーケンス(RNA-seq)遺伝子発現アッセイなどの高次元データにおける品質評価や探索的分析に、ゲノミクスアプリケーションで頻繁に使用されている。この目的のために開発された多くのソフトウェアパッケージが…

非コード転写産物のマルチマッピングおよびマルチオーバーラッピングアラインメントのあいまいさに対処するRNA-seq定量ツール MGcount

2022 1/27追記 トータルRNAシーケンス(total-RNA-seq)により、コーディングとノンコーディングの両方のトランスクリプトームを同時に研究することができる。しかし、計算パイプラインは従来、特定のバイオタイプに焦点を当て、total-RNA-seqデータセットが…

複数の生物をサポートする機能的エンリッチメント解析ツール GeneSCF

ChIP-sequencing、RNA-sequencing、DNA sequencing、定量的メタボロミクスなどのハイスループット技術により、膨大な量のデータが生成される。研究者は、これらのハイスループット研究から影響を受けた遺伝子の生物学的意義を解釈するために、しばしばfuncti…

動的に生成されるRスクリプトを用いてバルクRNA-seqの自動探索と可視化を行う Searchlight2

2022 1/5 複数比較の例追記、コマンドの誤字修正 バルクRNA-seqデータが処理されると、すなわちアラインメントされ、発現および差分表が作成されると、生物学的性質の探索、視覚化および解釈が行われる重要なプロセスが残る。可視化・解釈パイプラインを使用…

ATAC-Seq、ChIP-Seq、WESなどのcDNA汚染の検出と除去を行う cDNA-detector

意図的または偶然に実験システムに導入された外因性cDNAは、そのシステムから得られた次世代シーケンサーライブラリーにおいて、その遺伝子に対するリードカバレッジの追加として現れることがある。適切に認識・管理されない場合、この外来シグナルによるク…

シーケンスアラインメントやHMMER3のHMMプロファイルをlogoで視覚化する skylign

ロゴは、分子生物学において、配列の保存パターンをコンパクトなグラフで表現するためによく用いられる。ロゴは、配列アラインメントや隠れマルコフモデルに含まれる情報を、各位置に文字のスタックを描くことで表現する。スタックの高さはその位置の保存度…

機械学習を利用してゲノムアセンブリ品質を総合的に評価する EvalDNA

興味のある生物に対して最も完全で、継続的で、正確なアセンブリを選択するためには、アセンブリの包括的な品質評価が必要である。本著者らは、Evaluation of De Novo Assemblies (EvalDNA)という新しいツールを開発した。このツールは、教師付き機械学習を…

ロングリードゲノムアセンブリのミスアセンブリ修正およびスキャフォールディングを行う LongStitch

モデル生物や非モデル生物のゲノム研究では、高品質なデノボゲノムアセンブリの作成が不可欠である。近年、ロングリードシーケンシングは、ゲノムアセンブリやスキャフォールディング(ロングレンジ情報を利用してアセンブリされた配列を順番と方向付けする…

(ヒトとマウス) RNA-seqデータの探索と可視化のためのブラウザベースのツール BEAVR

分子生物学研究や臨床現場におけるRNA-sequencing(RNA-seq)の利用は、過去10年間で大幅に増加している。しかし、広く普及しているにもかかわらず、RNA-seqデータを解析・探索するためのシンプルでインタラクティブなツールが不足している。既存のツールの…

バクテリアのゲノム縮小のための遺伝子必須性予測と欠失の設計を行う DELEAT

2021 10/7 追記 遺伝子の必須性を研究することは、生命の基本原理を理解する上で基本的なことであり、また多くの分野で応用されている。ここ数十年の間に、さまざまな実験やバイオインフォマティクスの手法を用いて、何十もの必須遺伝子セットが決定され、こ…

RNA-Seqデータ解析のためのスタンドアローンおよびクラウドベースのシステム RNAdetector

2022 1/18追記 RNA-Seqはトランスクリプトームプロファイリングに広く用いられている技術であり、コーディングおよびノンコーディングRNA分子の解析が可能である。しかし、この技術は、Real-Time PCRやマイクロアレイなどの他の伝統的な技術に比べて、解析に…

公開されているプラスチドゲノムのアノテーションとinverted repeatsを調べる airpg

2021 9/18 使い方を理解していなかったので一旦コマンドは消去 ほとんどの顕花植物では、プラスチドのゲノムは、大小のシングルコピーと2つの逆方向反復配列領域からなる4分割構造をしている。近年、何千ものプラスチドのゲノムが配列決定され、公的な配列リ…

複数の実験で得られた機能的な遺伝子アノテーションを階層的に整理し、視覚的にナビゲートする FunMappOne

オミックスデータの解析において、遺伝子の機能アノテーションは不可欠なステップである。現在、遺伝子群の機能をオントロジーや分子パスウェイなどの高次の表現にまとめるためのデータベースや手法が複数存在する。オミックス実験の結果を機能カテゴリにア…

mmquant

現在、RNA-Seqは日常的に使用されており、遺伝子の転写に関する正確な情報を得ることができる。しかし、この方法では、重複した遺伝子の発現を正確に推定することができない。これまでに、いくつかの方法(重複した遺伝子を削除する、リードを一様に分配する…

全ゲノムバイサルファイトシーケンスデータのためのエンドツーエンド解析パイプライン wg-blimp

DNAシークエンスが開発されて以来、遺伝的変異に関する多くの研究が行われてきたが、エピジェネティックなレベルでの広範な研究は最近になって登場した。生体内のほとんどの細胞は、そのゲノム配列が同一であるが、組織や細胞の種類によっては、それぞれのア…

原核生物のゲノムに存在するISエレメントを高感度に検出する digIS

ISエレメントは、原核生物のゲノムの中で最も小さく、最も多く存在する mobile elementsである。ISエレメントは、ゲノムの構成や進化に重要な役割を果たしていることが示されている。宿主ゲノムにおけるISエレメントの機能をよりよく理解するためには、効果…

計算生物学のシンタックスハイライトパッケージ bioSyntax

計算生物学では、生物学的データファイルの読み取りと理解が必要になる。SAM、VCF、GTF、PDB、FASTAなどの平文フォーマットには、データ構造の複雑さによって難読化された重要な情報が含まれていることが多い。bioSyntax (https://biosyntax.org/) は、vim、…

ANGSD

ハイスループットのDNAシーケンス技術は、膨大な量のデータを生成する。何千ものサンプルを同時に解析するためには、高速で柔軟性があり、メモリ効率の良い実装が必要である。ここではANGSDと呼ばれるマルチスレッド・プログラム・スイートを発表する。この…

特定された生合成遺伝子群から代謝経路を再構築する BiGMeC

生合成遺伝子群(BGCs)にコードされた酵素や酵素複合体によって、さまざまな生理活性物質が生産されている。これらのBGCは、そのDNA配列に基づいて同定され、機能的な注釈が付けられる。さらなる研究開発のための候補は、その機能的なアノテーション、既知…

ナノポアリード用の新しい高精度メタゲノム分類器 BugSeq

20211114 論文引用 メタゲノム解析にナノポアシーケンサーを使用する機会が増えるにつれ、ロングリードの分類学的な分類を高速かつ正確に実行できるツールが必要となっている。既存のツールは、ショートリードデータ用に設計されているか(例:Centrifuge)…

FINDER

2021 9/1 論文追記 真核生物の遺伝子アノテーションは、蓄積された転写産物のデータを緻密に解析する必要があり、簡単な作業ではない。真核生物の遺伝子アノテーションには、重複する遺伝子を含むゲノムの転写活性領域、多数の転写産物を産生する遺伝子、ト…

染色体の遺伝子密度マップを描く DensityMap

2021 3/14 修正 ゲノムデータを可視化するためのツールはいくつか存在する。GbrowseやJbrowseのようないくつかのツールは、小さなゲノム領域に対しては非常に効率的であるが、ゲノム全体には適していない。また、PhenogramやCViTのように、ゲノム全体の可視…

連結コアタンパク質の多重整列を素早く生成する cognac

ゲノムデータの量は増加の一途をたどっている。そのためには、利用可能なデータ量に合わせた系統解析のためのツールが必要とされている。本研究では、このようなニーズに対応するために、系統解析のための遺伝子連結アラインメントを迅速に生成するためのユ…

バリアントアノテーションを含むマンハッタンプロットを描く Manhattan++

過去10年間で、3300以上のゲノムワイド関連研究(GWAS)が行われている。ほぼすべてのGWAS研究は、主図または補足図としてマンハッタンプロットを提供している。いくつかのソフトウェアパッケージがマンハッタンプロットを生成することができるが、それらは…

GO エンリッチメント解析を実行し、バックグラウンドセットと比較して過剰に存在する語彙を調べる FunSet

遺伝子オントロジーエンリッチメント解析は、複雑な生物学的データセットから意味のある情報を抽出する効果的な方法を提供する。遺伝子セットの中で有意に過剰発現している語彙を特定することで、研究者は遺伝子が共有する生物学的特徴を明らかにすることが…

非線形な低次元プロットを用いてデータパターンを可視化して調査するStreamlitアプリ GECO

シーケンシング技術の継続的な進歩により、「オミクス」というレンズを通して生物学的システムを理解する上での限界は、もはやデータの生成ではなく、それを解析する能力にある。重要なことは、この豊富な「-omics」データの多くは一般に公開されており、さ…