macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

docker

メタゲノムの生合成遺伝子クラスター予測と多様性評価を行う BiG-MEx

微生物は、特殊な代謝経路の酵素をコードする物理的にクラスタ化された遺伝子である生合成遺伝子クラスター(BGC)を発現することにより、膨大な種類の天然物を生産している。これらの天然物は、工業的・医学的利用価値の高い幅広いケミカルクラス(アミノグ…

(ヒト、マウス、ラット)RNA seqの前処理からリードカウントまで行うスケーラブルなパイプライン SPEAQeasy

2021 1/25 わかりくい説明を修正、タイトル修正 RNAシーケンシング(RNA-seq)は、一般的で広く普及している生物学的アッセイであり、それによって生成されるデータの量は増加している。実際には、生のRNA-seqリードから発現変動遺伝子などの直接的に価値の…

ONTのロングリードアセンブリをポリッシュする PEPPER

2021 12/24 ツイート追記 P.E.P.P.P.E.R.は、オックスフォード・ナノポア・シークエンシング技術で動作するように設計されたディープ・ニューラル・ネットワーク・ベースのポリッシャーである。P.E.P.P.E.R.は、各ゲノム位置のサマリー統計からコンセンサス…

真核生物ゲノムのアノテーションを行うwebサービス MOSGA

近年のシーケンシング技術の進歩により、大規模な真核生物ゲノムであっても高品質のアセンブリを生成することは、多くの生物学者にとって日常的な作業となっている。しかし、このようなアセンブリのアノテーションは、関心のある生物の生物学的性質を解明す…

10x genomicsのシングルセルRNA-seq解析パイプライン cellranger(version4について)

2020 10/31 説明を追加 2021 2/11 docker インストールにv5.01追加 Cell Rangerは、ChromiumのシングルセルRNA-seq出力を処理して、リードのアラインメント、フィーチャ-バーコードマトリックスの生成、クラスタリングと遺伝子発現解析を行う解析パイプライ…

タンパク質をコードする遺伝子配列の組換えイベントや正の選択下にある部位を見つける PoSeiDon

2020 10/27 テストデータ結果追記 選択圧力は、遺伝子の進化に継続的に影響を与え、多くの方法で研究することができる(Vittiら、2013)。例えば正の選択、または多様化する選択は、オルソロガスな遺伝子のアラインメントにおける非同義置換(dN)と同義置換…

(TCGA)インタラクティブな遺伝子発現解析のためのWebアプリケーション Phantasus

2020 10/25 追記 Phantasusは、視覚的でインタラクティブな遺伝子発現解析のためのウェブアプリケーションである。Phantasusは、ヒートマップの可視化と解析のためのWebベースのソフトウェアMorpheusをベースにしており、OpenCPU APIを介してR環境に統合され…

真菌を中心とした真核生物ゲノムのアノテーションパイプライン funannotate

2021/11/17 dockerについて追記 2023/08/08 引用修正 Funannotateはゲノム予測、アノテーション、比較のためのソフトウェアパッケージである。元々は真菌ゲノム(真核生物の中では小さいもので30 Mb程度のゲノム)のアノテーション用に書かれていたが、より…

アノテーションパイプライン PASA

2020 10/4 コマンドの間違い修正 2020 10/5 アップデートのコマンド修正 2023/01/05, 01/12追記 アップデートのコマンド追記 ゲノム配列に対する発現配列データのスプライスアラインメントは、真核生物ゲノムにおける遺伝子の包括的なアノテーションにおいて…

Webベースのデータ分析プラットフォーム NASQAR

2020 9/6 追記 次世代シーケンシング(NGS)テクノロジーの急速な進歩により、ゲノムデータは近年大幅に成長している[ref.1、2]。一般的なアプリケーションには、de novoゲノムシーケンス;ゲノム変異、転写因子結合部位、クロマチン修飾、クロマチンアクセシ…

START App

RNAシーケンシング(RNAseq)を用いた転写プロファイリングは、シングルセルから組織全体に至るまで、様々な文脈でのグローバルな遺伝子発現パターンを定量化するための強力な手法として登場した。このプロファイリング技術によって生成された膨大な量のデー…

GATKベストプラクティスに基づいた、RNA seqのバリアントコールを行うnextflowパイプライン CalliNGS-NF

発現情報に加えて、RNAシークエンシング(RNA-seq)データは、分析対象の生物の遺伝子に存在する体細胞変異を取得するために使用することができる。CalliNGS-NFパイプラインは、RNAseqデータを処理して、スモールバリアント(SNV)、SNP、およびsmall INDELs…

ロングリードシークエンシングから環状プラスミドを同定しARGsなどのアノテーションをつける PlasmIdent

多剤耐性菌の感染は、多くの場合、治療の選択肢が限られているか、あるいは全くないままである。細菌種間での遺伝子の水平移動によるプラスミドの移動は、抗生物質耐性遺伝子(ARG)拡大の重要なモードを表している。ここでは、複数の細菌種内および細菌種間…

コピー数変化(多型)をインタラクティブなプロットで視覚化する reconCNV

コピー数変動(CNV)は、不均衡な構造リアレンジメントの重要なカテゴリーである。ハイスループットなターゲットシーケンスでCNVを検出する方法はますます洗練されてきているが、これらのデータからCNVをインタラクティブかつ動的に可視化するための専用ツー…

アノテーションパイプライン BRAKER2

2020 8/14、15、10/1、10/2 追記, タイトル修正、誤字修正 2021 2/9、9/4 追記 2022 1/.29 12/23 condaインストール修正、 追記 2023/01/04, 01/09.01/11 間違った説明を修正、Documentリンク修正、画像追加 2023/03/03 braker3.0の公開について 遺伝子予測…

TGSデータのためのQCツール LongQC

2020 7/27 追記 ショートリードシーケンス技術は、過去 10 年間の生物学のパラダイムを変えてきた。最近では、TGSが登場し、1分子からの非常に長いが比較的エラーが発生しやすいリードを提供している。FastQC (https://www.bioinformatics.babraham.ac.uk/p…

自動化されたProkaryotesのRNA seq解析パイプライン ProkSeq

2020 6/29 補足説明追加。 RNA-seq技術は、導入以来、病原性細菌の研究において異なる条件にさらされた細菌からの複数のサンプルにわたる遺伝子発現の違いを同定し、定量化するために広く利用されてきた。一部の例外を除いて、遺伝子発現を評価するための現…

メタゲノムのビニング後の解析を行う自動化されたパイプライン MetaSanity

2020 5/29 構成を修正、タイトル変更 2020 6/1 コマンド修正 2021 10/5 ツイート追記 マイクロバイオーム研究の重要性はますます一般的になっており、さまざまな生態系(例:海洋、構築、宿主関連など)を理解するために不可欠である。研究者は、微生物ゲノ…

パンゲノム解析を行う GET HOMOLOGUES

2020 5/28 追記、10/5 タイトル修正、12/24 linuxでのインストール追記 2021 1/13 誤字修正 2024/02/21 追記,2/25追記 GenBank のような公開データベースに登録されているゲノムの数が増え続けていることから、種の遺伝子レパートリーを比較するためのツール…

CRISPR/Cas9編集後のアンプリコンシークエンシングからindelのレポートを生成する CRISPR-DAV

CRISPR/Cas9システムの簡便さと精度の高さは、遺伝子編集の新時代をもたらした。CRISPRを介在させたゲノム編集を用いた目的のクローンのスクリーニングは、その多重化により次世代シークエンシング(NGS)によって可能になった。ここでは、CRISPR NGSデータ…

メタゲノムデータからウィルスゲノムをアセンブルする metaviralSPAdes

2020 5/25 タイトル修正 2020 11/11 dockerリンク追加 現在知られているウイルスのセットは着実に拡大しているが、これまでのところ、地球上のウイルスのごく一部しかシークエンシングされていない。ショットガンメタゲノムシークエンシングは、新しいウイル…

nextflowを使ったGATKのバリアントコールパイプライン

2020 5/15 snpEffのデータベース追加方法を追記, step2とlogの写真差し替え、dockerのコマンド追加、補足修正 2020 5/16 出力の写真差し替え、レポート追加 2020 10/11,10/12 インストールコマンド修正 2021 9/21 タイトル修正 ニューヨーク大 - Center for …

メタゲノムの機能プロファイリングを行う HUMAnN2

2020 4/19 流れを修正 2020 4/21 biom出力とh5pyインストール追記 2020 ステップ2のコマンド修正 微生物群集の機能プロファイルは、通常、包括的なメタゲノムやメタトランスクリプトーム配列の検索を用いて作成されるが、これらの検索は時間がかかり、偽の…

vcfをmafに変換する vcf2maf

2020 4/17 画面表示バグ修正, インストール手順修正 vcf2mafはVCFをMutation Annotation Format (MAF)に変換し、各バリアントがすべての可能な遺伝子アイソフォームのうちの1つだけにアノテーションする。VCFをMAFに変換するためには、各バリアントはそれが…

tumorサンプルのテロメアリピート数を推定する telomerehunter

2020 4/20 誤字修正 テロメアは、真核生物の染色体の末端にある核タンパク質の複合体である。ヒトでは、テロメアDNAは主にノンコーディングのt型(TTAGGG)リピートで構成されているが、c型(TCAGGG)、g型(TGAGGG)、j型(TTGGGG)リピートで構成されています。し…

単離バクテリアゲノムのアセンブリ、アノテーション、比較ゲノム解析を行う高度に自動化されたパイプライン ASA3P

2020 3/22 ツイート、関連ツールリンク追記 2020 3/25 コメント追記 2020 3/26 誤字修正 2020 5/12 インストール追記 1977年に、DNAシーケンスがフレデリックサンガーによってサイエンスコミュニティに導入された[ref.1]。それ以来、DNAシーケンスは、ジデオ…

計算リソースを効率的に使って多数のよく似たバクテリアゲノムを素早く分析する自動化されたパイプライン Bactopia

2020 3/17 パラメータ追記、コマンド修正、タイトル修正 2020 3/18 追記 2020 5/11 説明追加 2020 8/13 論文追記 2020 12/9 ツイート追加 2021 2/24アップデートされたコマンドに修正 2021 10/7 ツイート追加 イルミナのテクノロジーを使用した細菌ゲノムの…

rocker projectのrstudioコンテナを使う

2020 5/12 説明追加 2020 10/1 リンク追加 ライブラリによって要求するRのバージョンが異なり、新しいツールをテストできないことがある。そのような場合、 r-baseのバージョン管理されたdockerイメージを使うと、その場限りの仮想環境にツールをインストー…

(metagenomeのbinned.faから)鉄関連の遺伝子を探す FeGenie

鉄は地球上のほぼすべての生命にとっての微量栄養素である。鉄は、鉄酸化および鉄還元微生物による電子供与体および電子受容体として使用でき、光合成および呼吸を含むさまざまな生物学的プロセスで使用される。鉄は地球の地殻で4番目に豊富な金属だが、鉄は…

パンゲノム解析を行う roary

2020 3/19 4/6 スクリプト修正、3/19 4/10 サンプル数が多い時のオプション追記、4/13 追記、5/11 リンク修正、5/25 わかりにくい文章を修正、roaryのランコマンド修正、インストール手順追記、5/27 コメント追加、6/7 ML法のコマンド追加,、proka並列ラン例…