macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2021-10-01から1ヶ月間の記事一覧

バリアントフィルタリングとポリッシングを行う Merfin

ノイズの多いロングリードから正確なジェノタイピングを行い、コンセンサスの質を向上させるために、リードマッピングやバリアントコーリングの手法が広く用いられている。バリアントコールの精度は、リードの品質、リードマッピングアルゴリズムとバリアン…

包括的かつ品質管理されたタンパク質間相互作用のデータベース STRINGデータベース

2021 11/8 タイトル修正 細胞の生命活動は、生体分子間の複雑な機能的相互作用によって成り立っている。その中でも、タンパク質-タンパク質間の相互作用は、その多様性、特異性、適応性から特に重要である。STRINGデータベースは、物理的相互作用と機能的相…

タンデムリピートとその周辺のリードアラインメントをハプロタイプに分解して可視化する REViewer

2021 10/27、20/28追記 ショートタンデムリピート拡張は、家族性筋萎縮性側索硬化症やハンチントン病をはじめとする多くの神経遺伝性疾患の原因となっている。最近では、全ゲノムやエクソームのシーケンスデータからリピートの拡大を同定する方法が複数開発…

包括的なマイクロRNAおよびtRFシーケンシング解析パイプライン miRge3.0

マイクロRNAとtRFは、遺伝子の翻訳制御に関与することで知られる低分子ノンコーディングRNAの一種である。次世代シーケンサー(NGS)の進歩により、high-throughput small RNA-seq研究が可能になったが、これには強固なアラインメントパイプラインが必要であ…

miRNA解析の手法を集めたプラットフォーム Tools4miR

miRNAは、遺伝子の発現を抑制する短いノンコーディング分子であり、生物にとって重要な役割を果たしている。miRNA関連の研究のために、何十もの計算手法が開発されているが、それらはさまざまな面で大きく異なっている。比較が難しい手法が数多く存在するた…

指定されたカバレッジになるようにリードをランダムサブサンプリングする rasusa

レポジトリより 私(オーサー)の要件を満たすリードのサブサンプリング用ツールは見つかりませんでした。私が見つけたツールは、サブサンプルするリードの数や割合を指定するだけのものや、カバレッジに合わせてサブサンプルする場合、すべてのリードが同じ…

オックスフォードナノポアのリードのアセンブルを素早く行う dragonflye

2022/03/26 インストールコマンドの間違い修正 レポジトリより バクテリアの配列を扱ったことがある人なら、おそらくTorsten Seemann氏(HP)のツールの一つを使ったことがあるでしょう。そのようなツールの1つがShovill(紹介)で、バクテリアのゲノムアセ…

原核生物ゲノム中の偽遺伝子候補を検出する Pseudofinder

2022/07/09 論文引用 原核生物のゲノムは一般的に遺伝子密度が高く、偽遺伝子(機能していない、あるいは不活性化された遺伝子の残骸)は比較的少ない。しかし、近年の生態系の変化や、共生生物や病原体が経験したような極端な個体数の減少など、特定の状況…

シアノバクテリアのキュレーションされた16S rRNA遺伝子のwebデータベース Cydrasil 3

シアノバクテリアは、広く普及している重要な細菌門であり、地球上の炭素・窒素固定のかなりの部分を担っている。しかし、シアノバクテリアの16S rRNA遺伝子配列の信頼性の高い正確な自動分類は、相反する体系的なフレームワーク、一貫性のない分類学的な定…

スケーラブルなインフラ上での比較ゲノミクスサービス EDGAR3.0

EDGARプラットフォームは、何千もの微生物ゲノムの事前計算されたオルソロジーデータのデータベースを提供するウェブサーバーで、比較ゲノミクスおよび系統学の分野で最も確立されたツールの一つである。EDGARは、事前に計算された遺伝子アラインメントに基…

(ヒトとマウス) RNA-seqデータの探索と可視化のためのブラウザベースのツール BEAVR

分子生物学研究や臨床現場におけるRNA-sequencing(RNA-seq)の利用は、過去10年間で大幅に増加している。しかし、広く普及しているにもかかわらず、RNA-seqデータを解析・探索するためのシンプルでインタラクティブなツールが不足している。既存のツールの…

アセンブルされた微生物ゲノムのクオリティ評価を行う miComplete

2022/03/18 インストール手順追記 ハイスループットシーケンスの開発により、大規模なシーケンスプロジェクトが手頃な価格になり、可用性がますます向上している。膨大な量のメタゲノムデータが生成され、未培養微生物から数千のmetagenome-assembled genome…

ハプロタイプresolved のSNV、SV、およびメチル化を包括的に検出するPRINCESS

ロングリードシーケンスは、構造変異(SV)の検出やメチレーションコールに有利であることが示されている。多くの研究では、SV、メチル化、またはSNVのphasingのいずれかに焦点が当てられているが、バリアントの組み合わせによってのみ、サンプルに関する包…

大規模なメタゲノムアセンブリ(MAG)を対象とした比較ゲノミクスツール群 EnrichM

EnrichMは、大規模なメタゲノム・アセンブリゲノム(MAG)を対象とした比較ゲノミクスツール群である。現在の機能は以下の通りである。 MAGの基本的なアノテーションパイプライン。 KEGGモジュールを参考にして、MAGがコード化している代謝パスウェイを決定…

アンサンブル学習による病原性配列の正確で高感度な機能スクリーニングを行う SeqScreen

2022/06/23 論文引用 2023/04/3 関連論文へのリンク 現代の卓上DNA合成技術と新興病原体への関心の高まりにより、懸念される病原体に対するオリゴヌクレオチドのスクリーニングの重要性が高まっている。しかし、オリゴヌクレオチドの正確で高感度な特性評価…

DASHデータベース

HPより DASH(Database of Aligned Structural Homologs)は、PDBに登録されている既知の構造的に相同なタンパク質のドメインと鎖の構造アライメントを集めたデータベースである。 その処理方法は、(a) CD-HITを用いてPDBから配列固有のタンパク質を99%の配列…

BAMファイルからカバレッジトラックを抽出するシンプルで高速なツール covtobed

バイオインフォマティクスの一般的な課題は、次世代シーケンシング実験で生成されたDNAシーケンシングリードを参照ゲノムにマッピングすることである。アラインメントの出力は、一般的にBAMファイルにエンコードされる(Li et al.2009)。DNAシーケンシング…

コンポジション、カバレッジ、アセンブリグラフによるメタゲノムビニングを行う MetaCoAG

2021 10/8 追記 メタゲノムビニングにより、様々な種の様々な遺伝物質を研究し、特性を明らかにし、微生物群集についての洞察を得ることができるようになった。既存のビニングツールはメタゲノミクスのde novoアセンブリをビニングするが、アセンブリグラフ…

深層学習に基づく真核生物配列の分類ツール Tiara

多くのメタゲノムデータが利用可能になるにつれ、真核生物のメタゲノム解析が新たな課題として浮上してきた。真核生物の核およびオルガネラのゲノムを適切に分類することは、真核生物の多様性をより深く理解するために不可欠なステップである。 メタゲノムデ…

バクテリアのゲノム縮小のための遺伝子必須性予測と欠失の設計を行う DELEAT

2021 10/7 追記 遺伝子の必須性を研究することは、生命の基本原理を理解する上で基本的なことであり、また多くの分野で応用されている。ここ数十年の間に、さまざまな実験やバイオインフォマティクスの手法を用いて、何十もの必須遺伝子セットが決定され、こ…

生物の生存に不可欠な遺伝子のデータベース DEG(バージョン15アップデート)

必須遺伝子とは、生物が特定の条件下で生存するために必要な遺伝子のことである。バクテリアの最小遺伝子セットの研究では、生命を維持するための基本的な細胞プロセスが解明されている。この5年間、CRISPR/Cas9をさまざまな種類のヒト細胞に適用することに…

RNA-Seqデータ解析のためのスタンドアローンおよびクラウドベースのシステム RNAdetector

2022 1/18追記 RNA-Seqはトランスクリプトームプロファイリングに広く用いられている技術であり、コーディングおよびノンコーディングRNA分子の解析が可能である。しかし、この技術は、Real-Time PCRやマイクロアレイなどの他の伝統的な技術に比べて、解析に…

リファレンスゲノム情報を半教師あり深層学習で取り込むことで、より優れたビニングを実現する SemiBin

2022/02/09 ツイート追記 2022/02/27 追記 2022/03/01 help更新 メタゲノムビニングとは、メタゲノムアセンブルゲノム(MAG)を構築する際に、同一ゲノムに由来すると予測される配列を自動的にグループ化するステップである。最も広く利用されているビニング…

(ヒトゲノム)ランダムフォレストを用いてバリアントの品質による分類を行う ForestQC

次世代シーケンシング技術(NGS)は、ゲノム上に存在するほぼすべての遺伝子バリアントの発見を可能にする。しかし、これらのバリアントの一部は、NGSやバリアントコーラーの限界により、シーケンスの質が低い場合がある。多数のシーケンスされた個体を解析…