macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2023-02-01から1ヶ月間の記事一覧

多様な節足動物ゲノムの迅速な機能アノテーションのためのワークフロー(interproscan)

ゲノム技術によって遺伝子に関する情報はかつてないほど急速に蓄積されており、Earth BioGenome Project、i5k、Ag100Pest Initiativeなどのシーケンスイニシアティブによって、この取得速度がさらに加速されると予想される。しかし、ゲノム解読を人の健康や…

ネットワークベースのパスウェイアノテーションのためのウェブサーバー PathBIX

パスウェイアノテーションは、生命科学における実験データを解釈し、意味を与えるための重要なツールである。このタスクのために数多くのツールが存在するが、最新世代のパスウェイエンリッチメント解析ツールであるネットワークベース法は、単に遺伝子の内…

ヒト腸内細菌データベースを用いたオンラインのマイクロバイオーム解析を可能にする GutMeta

ヒトの腸内細菌は、多くの疾患と関連している。全ゲノムショットガンメタゲノミクスにより、膨大な量の腸内細菌データが蓄積されている。しかし、この膨大なデータセットを探索するためのキュレーションされた統合プラットフォームはほとんどない。データ生…

クロロプラストゲノムの詳細な構造を可視化する CPGView

クロロプラストゲノムは、植物の系統や進化を研究する上で広く利用されている。クロロプラストゲノムの可視化ツールは、ゲノム上の遺伝子の分布を表示するためにいくつか開発されている。しかし、これらのツールは、エクソン、イントロン、繰り返し要素、可…

2 つのアセンブリ間のアライメントを比較するNCBIの Comparative Genome Viewer

2024/05/09 論文追記 NCBI Insightsより NCBIのComparative Genome Viewer (CGV)では、2 つのアセンブリ間のアライメントを表示および比較し、欠失、逆位、転座を含むゲノム配列および構造の違いを確認することができます。 NCBIのComparative Genome Viewer…

タンパク質の構造的近傍を探索する Structome

タンパク質の構造は、共通の祖先のシグナルを持ち、そのため進化の歴史を再構築するのに役立つ。構造情報推論を迅速に行うために、Structomeというウェブサーバーが開発され、ユーザーはクエリータンパク質に類似した構造を迅速に特定し、構造に基づく系統学…

nf-coreのRNA seq解析パイプライン nf-core/rnaseq

2023/02/24 誤字修正 2023/09/06 追記 nf-core/rnaseqはnextflow DSL2を使って構築されているRNAシーケンスデータを解析するためのパイプライン。2023年2月現在、nf-coreのベストプラクティスに従ったパイプラインは76個公開されている。このnf-coreの中で最…

細菌の分類学的に制限された遺伝子を探索するためのリソース TRGdb

TRGdbデータベースは、バクテリアの分類学的制限遺伝子(TRG)に特化したリソースである。最新の細菌分類学に基づき、異なる属や種に特異的な遺伝子を包括的に収集している。ユーザーインターフェースは、ブラウズや検索、配列の類似性探索を容易にする。また…

保存されているタンパク質ドメインを検索するNCBIの CD-Search

2023/02/22 タイトル修正 2004年に最初の論文(ref.1)が出たNCBIのCD-Searchサービスは、RPS-BLASTを用いてクエリタンパク質配列を多くのソースデータベースから収集された保存ドメインモデルと比較し、保存されているタンパク質ドメインヒットを提示する。…

ゲノムワイドなスプライシング効率を定量する SPLICE-q

一般にイントロンは一次転写産物から取り除かれ、成熟RNA分子を形成するために、スプライシングと呼ばれる転写後プロセスが行われる。一次転写産物の効率的なスプライシングは、遺伝子発現に不可欠なステップであり、その制御ミスは多くのヒト疾患に関連して…

スプライシングに変化を与えるバリアントを発見するためのスケーラブルなツール Spliceogen

インシリコ予測ツールは、シススプライシングモチーフを形成または破壊するバリアントを同定するために不可欠である。しかし、スプライシングモチーフを変化させるバリアントをゲノム規模で発見するための選択肢は限られている。Spliceogenは、スプライシン…

機能的な重複遺伝子を予測する OLGenie

タンパク質をコードする遺伝子では、部位ごとの非同義置換と同義置換の比(dN/dS)を用いて検出することが可能である。しかし、2つの遺伝子が異なるフレームで同じ塩基部位に重なる場合、一方の遺伝子の同義性変化が他方では非同義性変化となり、dN/dSが乱さ…

既存のシークエンスデータからリアルな人工メタゲノムを生成する SEQ2MGS

全ゲノムシークエンスデータからメタゲノム解析のためのバイオインフォマティクスツールの評価には、現実的なベンチマークセットが必要である。本著者らは、実シーケンス実験から人工メタゲノムを効率的かつ簡便に生成するツールを開発した。このツール(SEQ…

vgのゲノム配列グラフを可視化するためのJavaScriptモジュール Sequence Tube Maps

レポジトリより近年の科学の進歩により、利用可能なゲノム配列情報は膨大な量に達している。以前は、この配列情報は単一の参照配列から構成されており、比較的容易に線形に可視化することができた。今日、私たちはしばしば、特定のDNA配列の複数のvariantsを…

アセンブリ時のハプロタイプ重複に対処するためのツール群 Mabs

真核生物のゲノム解析は、ゲノム解読法の進歩にもかかわらず、未だエラーフリーには至っていない。真核生物のゲノムアセンブリの問題の中には、対立遺伝子が誤ってパラロガスとしてアセンブリされるケースとして現れる、いわゆる「ハプロタイプ重複」と呼ば…

GTF/GFFファイルのツールキット AGAT

2023/02/27 intron addに追記 HPより AGATは、あらゆる種類のGTFやGFFの欠落情報(特徴や属性)をチェック、修正、追加し、完全でソートされた標準的なgff3形式を作成する能力を備えている。長年にわたり、GTF/GFFフォーマットファイルに関連するあらゆるタ…

染色体間で類似した遺伝子ブロックを可視化する AccuSyn

HPより 単純な生物でさえ膨大な数の遺伝的特徴を持つため、シンテニックプロットでは膨大な数の接続が乱立し、構造を理解することが困難となる。AccuSynは、ゲノムビューとブロックビューの2つのビューでシンテニック関係を可視化することにより、高いレベル…

線形遺伝子マップを生成する LinearDisplay

LinearDisplayは、ユーザー定義の遺伝的特徴(ORF、プロモーター、転写ターミネーター、制限酵素認識部位、プライマー結合部位、ファージ付着部位、標的部位重複、アセンブリ/コンティグ切断、RNA構造など)の出版品質の線形マップを生成するプログラムであ…

配列アライメントのための高速かつ効率的なプリアライメントフィルタ Shouji

ほとんどのバイオインフォマティクス分析における最も基本的な計算ステップの1つは、2つのゲノム配列間の相違点/類似点の検出である。Edit distanceとペアワイズアラインメントは、このステップを実現するための2つのアプローチで、近似文字列マッチングとし…

文献探索を支援する citation gecko

citation geckoは、自分の研究において見逃している可能性がある文献を、引用のネットワークに可視化して発見を助けてくれるツールです。誰も引用していない論文は探せませんが、何度も引用されている自分の研究分野で影響力の強い論文を見つけることに適し…

ウイルスバリアント解析のための統合アプリケーション MALVIRUS

COVID-19のパンデミックでも示されたように、日々増加する複数のウイルス株のシーケンスデータから効率的にバリアントをコールできることは、世界中に広がるウイルス株を追跡するために最も重要なことである。 SARS-CoV-2のようなウイルス集団の解析に必要な…

ノイズの多いロングリードの高感度で高速なマッピングを行う kngMap

PacBioやOxford Nanoporeのような1分子シーケンスの急速な発展に伴い、出力されるリードの長さは増加し続けており、最先端のゲノムアプリケーションに劇的な可能性を与えている。これらのリードをリファレンスゲノムにマッピングすることは、ダウンストリー…

ScrapPaper

本論文では、PubMedやGoogle Scholarの検索結果から雑誌情報を抽出するPythonスクリプト、ScrapPaperを紹介する。現在、このプログラムを開発した動機は、科学文献のタイトルやリンクなどの情報を取得し、リストとして保存してメタ分析や文献の比較研究など…

専門家が監修した培養メディアデータベース MediaDive

MediaDive (https://mediadive.dsmz.de) は、専門家が監修した包括的な培養培地データベースで、あらゆる生命領域の4万以上の微生物株について、3200以上の標準培養培地のレシピ、手順、分子組成が収録されている。MediaDiveは、研究・診断ラボでの日常的な…

fastqのためのgrepコマンド fqgrep

fqgrep ユーティリティは、任意の入力 FASTQ ファイルを検索し、塩基が 1 つ以上のパターンに一致するレコードを検索する。 grep, but for FASTQS, but now more grep-likeWe've done a lot of work @fulcrumgenomics to try emulate grep, but for FASTQs. …

Bandageのフォーク Bandage-NG

Gihtubより Bandage-NGは、SPAdesやMEGAHITなどのde novoアセンブラが作成するアセンブリグラフを操作するためのGUIプログラムである。 重要: オリジナルのBandageレポのフォークである。新しい機能やバグが含まれている可能性があり、Ryan WickによるBandag…

1個のメタゲノムbin配列へマッピングされたロングリードの抽出

2023/02/13 誤字修正 ロングリードを使ったメタゲノムシークエンシングが徐々に増えてきています。一般に、ロングリードシークエンシングでは、メタゲノムアセンブリによってショートリードよりも連続性の高いMAGを得ることができます。連続性の高いMAGが得…

線形時間のロングリードゲノムアセンブラ GoldRush

2023/02/112 誤字修正 最新のロングリードDNOVOゲノムアセンブラは、OLC(Overlap Layout Consensus)パラダイムに従っており、そのネイティブ実装ではO(n2)アルゴリズムであった。OLCの最も時間とメモリを消費するステップであるall-vs-allシーケンシングリ…

全ゲノムシークエンスデータのデジタル正規化を行う ROCK

ROCK (Reducing Over-Covering K-mers) は、デジタル正規化法 (Brown et al. 2012, Wedemeyer et al. 2017, Durai and Schulz 2019 など) の代替実装を実行するC++で書かれたコマンドライン・プログラムである。ROCKの主な目的は、1つまたは複数のFASTQファ…

統計モデルを使った倍数性推定を行う nQuire

酵母や真菌などの病原性真核生物や非病原性真核生物など、様々な生物種で種内変異が起こっている。次世代シーケンサー(NGS)を用いた実験から、DNA量を測定することなく、間接的に倍数体を推定することができる。著者らは、NGSを用いて2倍体、3倍体、4倍体…