macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

2019

変異のlandscape visualizationを提供するwebサービス LandScape

シーケンシング技術の莫大な発展はゲノムデータの蓄積を加速させ、指数関数的蓄積を引き起こし、ヒトゲノム研究を著しく加速させた。一方、生物学的研究では、増加するサンプルからのトランスオミクスデータを分析している。多くの適切に設計された視覚化は…

StringTie2

RNAシーケンス(RNAシーケンス)データセット内の転写産物の量を測定することは、細胞の働きを理解するための強力な方法である。リードをリファレンスゲノムに合わせるだけで、遺伝子の平均発現の大まかな推定値が得られ、スプライス部位の異なる使用のヒン…

真核生物のゲノムプロジェクトにおいて共同研究者と共にアノテーションを効率的に進めるためのwebサービス GenSAS

2020 1/9 タイトル修正 Genome Sequence Annotation Server(GenSAS、https://www.gensas.org)は、構造的および機能的アノテーション、および手動キュレーションのための安全なWebベースのゲノムアノテーションプラットフォームである。 GenSASは、ユーザー…

エラーの多いロングリードをタンデムリピートにマッピングする tandemmapper

タンデムリピートは、不均等なクロスオーバーによってしばしば生成される複数の連続するほぼ同一のシーケンスによって形成される(Smith、1976)。初期のDNAシーケンスプロジェクトから、タンデムリピートが真核生物ゲノムに豊富にあることが明らかになった…

ラージゲノムにもスケールする高速且つ精度の高いドラフトゲノムポリッシャー hypo

DNAシーケンサーによって生成されたフラグメント(リード)からゲノムを再構築するゲノムアセンブリと、種間または種内の遺伝的変異を調べるためのその解析は、ゲノミクスの中心である。 Pacific Biosciences(PacBio)やOxford Nanopore Technologies(ONT…

Whisper 2

第3世代のシーケンシングの開発にもかかわらず、高いスループットと低いエラーレートのショートリードプラットフォームは多くの生物学的分析に不可欠なままである。 これらは、とりわけ、スモール(Kim et al、2018)および構造(Cameron et al。、2019)変…

メタゲノムのデータセットからコアオペロンを探索する POEM

オペロンはDNAの機能単位であり、その遺伝子はポリシストロン性mRNAとして共転写される。オペロンは、細菌に機能的複雑さをもたらす強力なメカニズムであり、したがって微生物の遺伝学、生理学、生化学、および進化から関心がある。全ゲノム中のオペロンを同…

包括的なメタゲノム解析パイプライン MAGO

微生物種はさまざまな環境で重要な役割を果たしているが、メタゲノムデータセットからの高品質のゲノムの生成は、その生態学的および進化のダイナミクスを理解する上で大きな障害となっている。 Metagenome-Assembled Genomes Orchestra(MAGO)は、複数のマ…

RNA seqのライブラリタイプを推測する GUESSmyLT

ショートリードRNAシーケンシング(RNA-seq)は、特に遺伝子発現の調査、ゲノムアノテーションの実行、SNVの検出、またはオルタナティブスプライシングされた転写物の確認を可能にする強力なアプローチである。シーケンスリードには、使用するRNA-seqライブ…

RNA seqのバリアントコールにも対応したABRA2

次世代シーケンス(NGS)は、さまざまなアプリケーションで広く使用されるツールになっている。バリアントコールは大きな関心が寄せられている領域であり、RNAへの関心も高まっている。NGSバリアントコールパイプラインの最初のステップの1つは、シーケンス…

既知生合成遺伝子クラスターのデータベース MIBiG 2.0

植物、微生物、菌類は、多くの場合、1つまたはいくつかの種にユニークな多種多様な特殊な代謝物を生成する。文明の夜明けから、人間は薬用、経済的、またはレクリエーション目的でこの宝の山を利用している。過去10年以内に、ゲノムに基づいた特殊な代謝産物…

植物のRNA seqデータからvirus配列を検出する Kodoja

ウイルス感染は、食物と燃料のために栽培される作物で特に重要な問題である。ウイルスは収量と品質の大きな損失を引き起こし、その結果、ウイルスは重要な経済的悪影響を及ぼす[ref.1]。英国では、ポテトウイルスYは年間3,000〜4,000万ポンドのジャガイモの…

IRIS-EDA(立ち上げだけ紹介)

生物学的システムの統合モデルを構築し、疾病を予防または治療するための実現可能な戦略を考案するには、適切な実験計画法とインタラクティブなインタフェースを備えた高度な計算ツールが必要である。 RNA-Seqは膨大な量の遺伝子発現データを作成しており、…

(ヒトゲノム向け)ニューラルネットワークを使用したロングリードのSVコーラー NanoVar

構造変異は、多くのヒト疾患の発症に関与しており、ヒト集団の遺伝的変異の大部分を占めている(ref.3,4)。 50 b5を超えるゲノム変化として定義される構造変異(SV)は、遺伝子調節異常または新規遺伝子融合を引き起こす可能性のある遺伝子病変を形成するこ…

GFF3のツールキット GFF3toolkit

i5k Workspace @ NAL (HP) でサポートされているGFF3toolkit(https://github.com/NAL-i5K/GFF3toolkit)は、節足動物ゲノムプロジェクトとその研究コミュニティからのGFF3形式の遺伝子アノテーションを処理するためのツールスイートを提供する。 遺伝子アノ…

ラージデータにも対応したマルチプルシーケンスアラインメントツール Kalign 3

マルチプルシーケンスアラインメント(MSA)は、生物学的シーケンス解析の重要なタスクのままである。 MSAプログラムは、Consistency-based のメソッドとprogressive なメソッドに分けることができる。後者は、ペアワイズシーケンス距離を推定し、ガイドツリ…

Ensemblの Variant Effect Predictor (VEP)

2019 11/10 タイトル修正 ゲノムまたはエクソームシーケンシングから生じるバリアントデータの分析は、クリニックでの基礎研究からトランスレーショナルゲノミクスまで、生物学の進歩の基本である。機能を調査し、標準化された治療に基づく医療システムから…

プラスミドの分析と視覚化のwebサービス Plasmid ATLAS

2019 11/8 pATLASflow紹介リンク追加 プラスミドは、mobile genetic elements(MGE)として分類されるchromosome外遺伝因子であり、細菌間で自己複製および転移する能力があるため、遺伝子の水平伝播において極めて重要な役割を果たしている(ref.1〜3)。プ…

ノンスペシャリストのための系統解析webサービス NGPhylogeny.fr

系統樹の推論と解釈は、広範囲の生物学的領域(比較ゲノミクス、機能予測、メタゲノミクス、種同定、分類学、分子疫学、集団遺伝学など)を対象とする多数の研究で必要となる。Phylogeny.fr(ref.1)はもともと、次の手順に基づいてワークフローを実装するこ…

ゲノムを分類、クラスタリングし、視覚化する JGI-GenomeConstellation

2019 11/3 タイトル修正 これまでに特定されていない分類群を含む分類群の分類は、南極の乾燥した谷にある永久に氷に覆われた湖を含む、記載されていない生息地の微生物群集を特徴付ける重要なタスクである。現在の監視された系統発生ベースの方法は、そのよ…

GTDBのオンライン系統樹 AnnoTree

2019 11/6 タイトル修正、説明追加 重要な生物学的および進化的洞察は、種の系統発生にわたる遺伝子および機能的アノテーションの有無を調査することにより生成できる。これらには、予期しない taxonomic occurrences の特定(ref.1)、遺伝子の進化的起源の…

eggNOG データベース

eggNOG 5.0のペーパーより 分化イベント後に共通の祖先から分岐したオルソログを同定することは、分子生物学および進化生物学における基本的な課題である。 duplication eventの後に分岐した配列であるパラログと比較して、オルソログは長い進化的タイムスケ…

パンゲノム解析を行うためのprokaryotesゲノム情報のデータベース proGenomes2

2019 10/27 twitter追記2 019 10/27 ブラウザについて追記 大規模ゲノミクスは、微生物の理解を深めるために役立っている。微生物学は、数千のシーケンスされたゲノムを利用できるデータ集約型の分野に発展した(ref.1–3)。過去20年以上にわたり、シークエ…

Metagenomic contigsの分析と可視化のための自動化されたパイプライン MetaErg

2019/10/24 MetaCycの結果追記 ゲノムアノテーションは、文字通り、アセンブリされたDNA分子の特徴の注釈である。そのような特徴は、そもそも、タンパク質をコードする遺伝子[「オープンリーディングフレーム」(ORF)]およびリボソームまたはトランスファー…

microbiome研究のためのプラットフォーム iMicrobe

iMicrobeは、研究者自身のデータを公開し、精選された微生物のメタゲノムデータセットと分析のための高性能コンピューティング(HPC)メソッドに接続するプラットフォームである[ref.1]。過去10年間で、シーケンシングのコストはムーアの法則をはるかに上回…

ウィルス専用の遺伝子予測webツール Vgas

2019 10/22 タイトル修正 ウイルス感染によって引き起こされるヒト感染症の治療のためのウイルスゲノム研究の途方もない価値のために、Webサーバーやデータベースを含む多くのウイルス情報学リソースが開発された(Sharma et al、2015)。 RefSeqデータベー…

プラスミド配列を予測する PlasClass

高スループットシーケンスを使用して細菌宿主内のプラスミドの存在とダイナミクスを研究する場合、多くの場合、シーケンスをプラスミドまたは細菌起源のものとして分類する必要がある。これは、メタゲノムシーケンスの場合に特に当てはまる。メタゲノムシー…

(植物など)ゲノムアセンブリとアノテーションのクオリティを分析するwebサーバー GenomeQC

過去数十年にわたって、Genlisea aureaの63 Mb [ref.1]からPinus taedaの22 Gb [ref.2]までのサイズの多数の植物ゲノムアセンブリが生成された。このようなプロジェクトから生成されたゲノムリソースは、改良された作物品種の開発に貢献し、ゲノムサイズ、構…

メタゲノムのtaxonomic assignmentと定量を行う CCMetagen

環境試料および宿主関連試料(メタゲノミクスおよびメタトランスクリプトミクス)のDNAおよびRNAのハイスループットシークエンシングは、どの生物が試料中に存在するかを評価するための強力なツールである。Taxonomy同定ソフトウェアは通常、個々のショート…

コア遺伝子有無など視覚化できるスケーラブルな原核生物間のゲノム比較ツール Chromatiblock

完全な原核生物ゲノム間の構造的変化を視覚化することは、系統の違いの遺伝的基盤を特定するために重要である。これは通常、連続したペアワイズ比較または複数の線形の結果を線形レイアウトまたは環状レイアウトで表示することで実現される。シリアルペアワ…