macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2020-02-01から1ヶ月間の記事一覧

インタラクティブなヒートマップを描く heatmaply

2020 2/29 誤字修正 クラスターヒートマップは、高次元のデータを視覚化するための一般的なグラフィカルな方法である。その中で、数値のテーブルは、色付きセルのタイル状のマトリックスとしてスケーリングおよびエンコードされる。マトリックスの行と列は、…

(ヒトゲノム)個人のサンプルが汚染または交換されている可能性があるかどうかを調べる verifybamid

DNAサンプル汚染の検出と推定は、高品質の遺伝子型コールと信頼性の高いダウンストリーム分析を確保するための重要なステップである。既存の方法は、汚染率の正確な推定のために母集団対立遺伝子頻度情報に依存している。シーケンス解析の初期段階で各個体の…

指定したCOG近傍の遺伝子を視覚化するwebサービス COGNAT

2020 2/27 コメント追加 原核生物のゲノムでは、機能的に結合した遺伝子を保存された遺伝子クラスターに組織化して、それらの協調的な調節を可能にしている。このようなクラスターには、1つまたは複数のオペロンが含まれる可能性がある。これは、同時転写さ…

(metagenomeのbinned.faから)鉄関連の遺伝子を探す FeGenie

鉄は地球上のほぼすべての生命にとっての微量栄養素である。鉄は、鉄酸化および鉄還元微生物による電子供与体および電子受容体として使用でき、光合成および呼吸を含むさまざまな生物学的プロセスで使用される。鉄は地球の地殻で4番目に豊富な金属だが、鉄は…

KEGGのパスウェイアノテーション結果を視覚化する KEGG-Decoder

2020 2/25 わかりにくい説明を修正 2023 6/29 追記 好気性非酸素発生型光合成生物(AAnP)は海洋環境で一般的であり、光従属栄養活動に関連している。現在までに、炭素固定の可能性を持っているAAnPは、表層海洋では確認されていない。 Tara Oceansメタゲノ…

(メタゲノムの)アセンブリグラフから環状plasmid配列を出力する SCAPP

2021 6/27 論文引用 メタゲノムシーケンスは、多くの新しい細菌ゲノムシーケンスの識別とアセンブリをもたらした。 これらのバクテリアはしばしばプラスミドを含んでおり、それはあまり研究も理解もされていない。 これらのプラスミドの研究を支援するために…

HMMを使ったKEGG IDsアノテーションwebサービス KofamKOALA

KofamKOALAは、事前に計算された適応スコアしきい値を持つプロファイル隠れマルコフモデル(KOfam)のデータベースに対する相同性検索により、KEGGオーソログ(KO)をタンパク質配列に割り当てるWebサーバである。 KofamKOALAは、既存のKO assignmentツール…

(断片化した)バクテリアゲノムアセンブリを比較して遺伝子の有無を調べる GenAPI

2020 7/29 論文追記 2021 10/18 パラメータ追記 細菌クローン間の遺伝子レパートリーの違いを見つけることは、病原性、抗生物質耐性、および代謝能力などの表現型の違いの遺伝的根拠を理解するために重要である。また、遺伝子の有無に関する情報を含む系統解…

パンゲノム解析を行う roary

2020 3/19 4/6 スクリプト修正、3/19 4/10 サンプル数が多い時のオプション追記、4/13 追記、5/11 リンク修正、5/25 わかりにくい文章を修正、roaryのランコマンド修正、インストール手順追記、5/27 コメント追加、6/7 ML法のコマンド追加,、proka並列ラン例…

オルソログのPhylogenetic profiles分布を視覚化する PhyloProfile

Phylogenetic profilesは、種間の遺伝子の有無パターンを捕捉する(Pellegrini et al、1999)。特定の種にオルソログが存在することは、対応する機能も表されていることの証拠となることがよくある(Lee et al、2007)。さらに、2つの遺伝子がそのPhylogenet…

HaMStR-OneSeq

ESTシーケンスは、タンパク質コード配列を迅速に収集するための多目的なアプローチである。それらは、ゲノムデータからの遺伝子予測の依然としてエラーを起こしやすい手順をバイパスして、生物の遺伝子レパートリーへの直接アクセスを提供する。したがって、…

バクテリアゲノムの進化をシミュレートする SimBac

バクテリア全ゲノムシーケンシングは急速に普及しており、高解像度の遺伝情報を迅速かつ費用対効果の高い方法で提供することにより、multilocus sequence typing(MLST)に取って代わっている(Didelot et al、2012; Wilson、2012)。遺伝学的データを使用し…

バクテリア(パン/メタ)ゲノムのグラフを構築する ptolemy

比較ゲノム研究における長年の制限は、リファレンスゲノムへの依存である。これにより、生物集団全体で特定できる遺伝的多様性のスペクトルを妨げる。これは、ゲノムアーキテクチャが大幅に異なる可能性のある微生物の世界で特に当てはまる。したがって、リ…

パンゲノム解析を行う PEPPA

2020 5/24 インストール手順修正、ヘルプ更新 細菌ゲノムは、広範な相同組換え、水平遺伝子導入、遺伝子損失、遺伝子重複などの複雑な進化の歴史によって形作られている。細菌ゲノムの定義されたセット内のすべての遺伝子で構成されるパンゲノムは、系統学的…

オルガネラゲノムなどの小さなゲノム配列を比較し、相同/非相同な遺伝子を視覚化するwebサービス geneCo

比較ゲノミクスは、主に生物間の共通の特徴の非常に詳細な視覚化の作成に焦点を当てている。比較ゲノミクスの主な原則は、基本的な生物学的類似性または遺伝子レベルでの生物間のDNAシーケンスから生じるゲノム機能の違いを比較することである。ゲノム機能に…

NCBIからゲノムをダウンロードしたり、 差分だけ更新する機能を持つ genome_updater

2020 4/25 help追記、タイトル変更 genome_updaterはNCBIゲノム(refseq / genbank)をダウンロードおよび更新するBashスクリプトである。データの更新、詳細ログの保持、ファイル整合性チェック(MD5)、そして並列[2]ダウンロードをサポートする。 インス…

最新のデータベースを使ってメタゲノムのリードのtaxonomic assignmentを行う ganon

リファレンスおよびtaxonomyに基づくショートリードの分類は、メタゲノムの基本的なタスクである。 シーケンス後に行うことができる環境サンプルからの各リードの起源の定義は、通常は量の推定、プロファイリング、およびアセンブリ前の最初のステップである…

2アセンブリ間の配列の有無を調べる scanPAV

遺伝的変異の完全なカタログについては、SNP /indelおよびCNVとともに遺伝的多様性および多様性のソースとして、Presence-Absence Variations(PAV)を含めることが重要である。このノートでは、一対のゲノム比較のための新しいアルゴリズムであるscanPAVを…

パスウェイデータベース PathBank

2020 2/11 誤字修正 2022 2/3 追記 パスウェイマップは、分子生物学のロードマップである。ロードマップが村、町、都市間のつながりを示すように、パスウェイマップは遺伝子、タンパク質、代謝産物間のつながりを示す。よく描かれたパスウェイマップは、複雑…

体細胞変異を検出する NeuSomatic

体細胞変異はガンの発生、進行、および治療における重要なサインである。体細胞変異の正確な検出は、腫瘍とノーマルの交差汚染、腫瘍の異質性、シークエンシングアーティファクト、およびカバレッジのために困難である。一般に、前述の問題で発生する誤検出…

Genome properties (GP)

現代のDNAシーケンシング技術は、単離した生物のみならず、生物のコレクション(メタゲノミクス)のDNA配列を決定する能力に革命をもたらした。一握りの特徴づけられた配列から新規ゲノムにコードされた遺伝子への自動アノテーションは、特に原核生物ゲノムで…

機能アノテーション付けを行うwebサービス eggNOG-Mapper

2020 9/1 説明追記 2021 8/6 リンク追加 2023/08/10 気づいた事追記 重複イベントではなく種分化に由来するオーソロガス遺伝子の同定(Fitch 1970)は、新規遺伝子の機能的特性化に深い意味を持つ長年にわたる進化の問題である。 「オルソログ推測」では、同…

エラーの多いロングリードのエラー修正とアセンブリを行う NECAT

2020 2/7 パラメータエラー修正、2/8 わかりにくい表現を修正、3/12 わかりにくい説明を修正 2021 1/5 論文引用、9/8 関連研究のリンク追記 2023/04/12 コマンド微修正(.pl削除) ナノポアのロングリードはde novoゲノムアセンブリで有利だが、ゲノム研究への…

KEGGの遺伝子アノテーション結果を要約する GAEV

2020 10/20 追記 非モデルアセンブリのコンピュータ アノテーション付き遺伝子の生物学的機能と、これらの遺伝子の産物によって形成される分子パスウェイの説明は、種のさまざまな固有の生物学的属性(生理学、生活史、行動など)の遺伝的基盤を特定するため…

KEGGのパスウェイアノテーションwebサービス KAAS

2020 2/6 タイトル修正 近年、完全(complete)なゲノムとドラフトゲノムの数は急速に増加しており、これらのゲノムの遺伝子の機能的特性と生物学的役割の特定を自動化することがますます重要になっている。 KEGGデータベースでは、Smith–Watermanスコアを使…

SPAdesの出力をフィルタリングする CVLFilter

イルミナのシーケンシングは酵母ゲノミクスに革命をもたらし、現在、市販のドラフトゲノムシーケンシングの価格は200ドル未満になった。人気のあるSPAdesアセンブラにより、あらゆる酵母種のde novoゲノムアセンブリを簡単に生成できる。ただし、ゲノムアセ…

カバレッジトラックを視覚化する SparK

2020 3/1 コマンド修正 2024/04/17 help更新 Integrative Genomics Viewer(IGV)やUCSCゲノムブラウザなど、NGSデータの表示に利用できる洗練されたリソースが存在するが、領域のエクスポートとpublication用の図の組み立ては依然として困難である。特に、…

HMMを使用してメタゲノムの遺伝子を見つけるwebサービス MetaHMM

大規模な臨床および環境のメタゲノムデータセットの高速で手頃なシーケンスにより、医療およびバイオテクノロジーのアプリケーションにおける新しい視野が開かれている。今日、地球上の微生物の約1%しか記述できていないと考えられており、メタゲノム解析は…

CAARS

大規模なRNAシーケンス(RNA-Seq)は、ゲノムシーケンスの実用的な代替手段として、特に比較分析のために非モデル種でよく使用される(Ozsolak and Milos、2011; Todd et al、2016; Wang et al 、2009)。しかし、トランスクリプトームアッセイのショートリ…

Trinotateを使ってde novo transcriptome のアセンブリ配列にアノテーションをつける

2020 9/16 pythonのバージョンを指定して導入, configファイルについて追記 2020 9/16 コメント追加, signalPとTMHMM、rnammerの初期設定追加 2020 9/27 わかりにくい表現を修正 Trinotarteは、Trinityののde novoトランスクリプトームアセンブリを機能的に…