macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2018-06-01から1ヶ月間の記事一覧

高速かつメモリ使用量の少ないメタゲノムアセンブリツール MEGAHIT

2019 5/6 インストール方法修正、5/7 パラメータ追記、5/15 タイトル修正、5/19 リンク追加、5/17 タイトル再修正、パラメータ修正、6/3 コメント追加、7/27 condaインストール追記 2021 5/7 helpと インストール手順更新、7/21 リンク追加 2022 2/19 メモ追…

マルチマッピングを補正する MMR

ハイスループットシーケンシングデータのリファレンス配列への迅速かつ正確なマッピングの必要性に対処するために、過去数年間に多くの異なるソフトウェアツールが開発されてきており、その多くは頻繁に更新および改良されている(論文より Dobin et al、201…

構造変化のリードアライメント状況やゲノム比較結果を可視化する Ribbon

2020 8/9 論文追記 Visualizationは、現在のゲノム革命において、バリアント、発現パターン、進化による変化、および他の多くの関係を検査し、理解するために非常に重要な役割を果たす(Preprint ref.1~3)。しかし、構造変化可視化時のリードとリファレンス…

リアレンジメントなどの構造変異を可視化して分析する SplitThreader

ゲノム再構成(Genomic rearrangements)および関連するコピー数の変化は、癌遺伝子および腫瘍サプレッサーの発現を変化させ、遺伝子融合を生じさせ、遺伝子発現を誤って調節する可能性があり、癌における重要な推進因子となっている。ここでは、 ゲノム再構…

BAMを感心対象のみにフィルタリングする VariantBam

2020 4/17 インストール追記、help更新 ゲノムシーケンスのコストが減少するにつれて、大規模なシーケンスデータセットを取り扱う際のストレージおよび計算上の負担が増大する懸念がある。ヒトゲノムの全ゲノムシーケンシングを30倍のカバレッジにすると、お…

全ゲノムやExomeのカバレッジを素早く計算する mosdepth

2020 4/19 help更新, コマンド追記 2021 5/14 インストール追記, help更新 カバレッジデプスの測定は、コピー数変動(CNV)の検出などのゲノム解析にとってクリティカルで、例えばcn.mops(Klambauer et al、2012)、Indexcov(Pedersen et al、2017)などの…

CNVを検出するパイプライン iCopyDAV

ハイスループットシークエンシング技術の出現により、集団に特異的な構造変異(SV)および疾患におけるそれらの可能な役割の同定にかなりの関心が集まっている。様々な構造変化の中で、コピー数変動(CNV)は、ヒトゲノムの多様性および疾患に有意に寄与する…

cpなどのコマンドの進捗をモニターするprogress

標準では、"cp mv dd tar cat rsync grep fgrep egrep cut sort md5sum sha1sum sha224sum sha256sum sha384sum sha512sum adb gzip gunzip bzip2 bunzip2 xz unxz lzma unlzma 7z 7za zcat bzcat lzcat split gpg" に対応している。 インストール mac10.13…

メタゲノムデータをサブサンプリングして繰り返し アセンブリする Spherical

過去10年間、研究者らは、ハイスループットシーケンシングを利用して、世界中の多様な環境からの微生物群集の構造と機能を調べてきた[論文より ref.1、2、3]。これらの研究は、微生物の働きについてユニークで斬新な洞察を提供してきたが、入手可能なツール…

臨床向けアンプリコンシーケンス自動解析パイプライン Canary

臨床診断は、ヌクレオチドレベルで患者DNAを分析することができる技術によって変化している。臨床シーケンシングの精度、処理時間および再現性は、rawシーケンシングデータを有意義なバリアントに変換するバイオインフォマティクスパイプラインに大きく依存…

CGDV

次世代シークエンシング(NGS)技術の進歩により、前例のない量の異なる形式のデータが生成されている。大規模なNGSデータの解釈は複雑で困難である。可視化はNGSデータを解釈する手段の1つであり、データ分析において重要な役割を果たしている。円グラフは…

トランスクリプトームのblast比較結果を統合し、ベン図を描く VennBLAST

ハイスループットシークエンシングは広範な技術となり、進化的研究を含む様々な研究分野でアクセス可能となっている。ゲノムが利用できない生物の転写産物をシーケンスし、注釈を付ける能力は、分子進化の分野における生物学者、特に非モデル生物を含むルー…

関心のあるバクテリアゲノムのシグネチャを迅速に検出する Neptune

安価かつ迅速に大量のシーケンスを生成する能力は、生物、特にバクテリアのような比較的小さなゲノムを有する生物全体のゲノムを研究する能力を可能にした。計算生物学者は、歴史的に、少数のバクテリアゲノムを比較し、ヌクレオチド、遺伝子およびゲノムス…

ロングリードを使ってSVを検出する Picky

ゲノム構造変異の獲得(SV)は、ガンゲノムの主要な特徴であるが、ショートリードシーケンシングデータから再構成することは困難である。ここでは、カスタマイズされたパイプライン、Picky(https://github.com/TheJacksonLaboratory/Picky)を使用し、ナノ…

CircosをWeb上 で利用できる ClicO FS

2020 7/24 関連文献追記 Circos(Krzywinski et al、2009)(HP)は、ビジュアルデータを環状形式で表現するPerl言語ベースのツールである。ネイティブのCircosソフトウェアは、コマンドラインインターフェイス(CLI)を介して提供されている。ソフトウェア…