macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2020-08-01から1ヶ月間の記事一覧

START App

RNAシーケンシング(RNAseq)を用いた転写プロファイリングは、シングルセルから組織全体に至るまで、様々な文脈でのグローバルな遺伝子発現パターンを定量化するための強力な手法として登場した。このプロファイリング技術によって生成された膨大な量のデー…

REscan

リピート拡張は、神経疾患における遺伝的変異の重要なクラスである。しかしながら、従来のシークエンシング法を用いた新規なリピート拡張の同定は、ショートシークエンシングリードに対するそれらの典型的な長さ、およびリピート配列への正確でユニークなア…

シークエンシングされた単離ゲノムサンプルを分析する nullarbor

公衆衛生微生物学のラボでは、アウトブレイクが疑われる細菌は、通常、IlluminaまたはIon Torrent装置で、全ゲノムシークエンシングされる。これらのWGSサンプルは、カバレッジ、コンタミネーション、正しい種が含まれているかどうかを品質チェックする必要…

GATKベストプラクティスに基づいた、RNA seqのバリアントコールを行うnextflowパイプライン CalliNGS-NF

発現情報に加えて、RNAシークエンシング(RNA-seq)データは、分析対象の生物の遺伝子に存在する体細胞変異を取得するために使用することができる。CalliNGS-NFパイプラインは、RNAseqデータを処理して、スモールバリアント(SNV)、SNP、およびsmall INDELs…

CyVerseとIGBを接続するWebアプリケーション BioViz Connect

ゲノミクスの大規模データセットを利用するために、生物学者はデータの保存、処理、分析、アノテーション、可視化のための計算システムを必要としている。CyVerseのようなクラウドベースのサイエンスゲートウェイは、ストレージと解析ツールを提供するが、可…

ONT ダイレクトRNA seqで修飾された塩基を検出する nanocompore

RNA分子は、その構造や相互作用に影響を与える転写後修飾(PTM)を受けている。現在までに、150以上の天然に存在するPTMが同定されているが、その機能の大部分は未だ不明である。近年、少数のPTMが、ハイスループットシーケンシングを用いた実験的アプローチ…

ロングリードシークエンシングから環状プラスミドを同定しARGsなどのアノテーションをつける PlasmIdent

多剤耐性菌の感染は、多くの場合、治療の選択肢が限られているか、あるいは全くないままである。細菌種間での遺伝子の水平移動によるプラスミドの移動は、抗生物質耐性遺伝子(ARG)拡大の重要なモードを表している。ここでは、複数の細菌種内および細菌種間…

コピー数変化(多型)をインタラクティブなプロットで視覚化する reconCNV

コピー数変動(CNV)は、不均衡な構造リアレンジメントの重要なカテゴリーである。ハイスループットなターゲットシーケンスでCNVを検出する方法はますます洗練されてきているが、これらのデータからCNVをインタラクティブかつ動的に可視化するための専用ツー…

動物ミトコンドリアゲノムのアセンブリとアノテーションのパイプライン MitoZ

ハイスループットシーケンシング(HTS)技術の登場により、系統樹や生物多様性のモニタリング研究において、大規模な核酸シーケンシングが日常的に行われる時代になってきている。例えば、複雑なDNA抽出物(環境DNA(eDNA)など)を利用したメタバーコーディ…

性染色体のロングリードソート法 SRY

現在公開されているリファレンスゲノムの多くは、性染色体の配列マップがなく、アセンブルが完成していないのが現状である。近年のロングリード塩基配列解析や集団配列解析の進歩により、従来のような複雑な実験を必要とせずに性染色体のアセンブルが可能と…

バクテリアゲノムからプロファージを予測してアノテーションをつける DBSCAN-SWA

2020 8/21 追記と修正 ファージは、細菌宿主ゲノム中のバクテリオファージの細胞内形態として、通常、高い特異性を持って細菌のDNAに組み込まれ、水平遺伝子導入(HGT)に寄与している。ファージを用いて細菌を死滅させ、病原性細菌感染症や耐性細菌感…

ショートリードとロングリード両方に対応した高速なクオリティフィルタリングツール RabbitQC

2020 8/19 追記 現代のシーケンシング技術は、生物学や医学の多くの分野で革命を起こし続けている。生成されたデータセットはエラーが発生しやすいため、下流のアプリケーションでは通常、FASTQファイルを前処理するための品質管理手法が必要となる。しかし…

RNA seqのロングリードをリファレンスフリーでクラスタリングする RATTLE

2021 1/12 helpと解析例追加 2022/04/19 ツイート追加 ナノポアを用いた1分子ロングリードシークエンシングは、あらゆるサンプルからトランスクリプトームを測定する前例のない機会を提供する。しかし、現在の解析方法では、リファレンスゲノムやトランスク…

複数の系統的証拠を利用してオルソログとパラログを予測する MetaPhOrs

2020 8/17 追記と誤字修正 異なる種の遺伝子間の相同性関係を推定することは、比較ゲノム学の中心的な課題である。そのため、長年にわたって多くのリソースと方法が開発されてきた。公開されているデータベースの中には、相同な遺伝子ファミリーの系統樹が含…

注釈付きで検索可能な微生物のインベントリ The Microbe Directory

次世代シークエンシング技術の出現により、ここ10年で、ヒトのマイクロバイオームから環境(水や土壌)、都市の表面に至るまで、メタゲノムやマイクロバイオーム研究が急増している。これらの研究はすべて、発見された配列をサンプルに見られる分類学的プロ…

アノテーションパイプライン BRAKER2

2020 8/14、15、10/1、10/2 追記, タイトル修正、誤字修正 2021 2/9、9/4 追記 2022 1/.29 12/23 condaインストール修正、 追記 2023/01/04, 01/09.01/11 間違った説明を修正、Documentリンク修正、画像追加 2023/03/03 braker3.0の公開について 遺伝子予測…

複数のロングリードドラフトアセンブリを使って連続性の高いアセンブリを得る GALA

高品質のゲノムアセンブリは、遺伝学や医学研究の分野で幅広く応用されている。しかし、現在のワークフローでは、ギャップのない染色体スケールのアセンブリを実現することは非常に困難である。ここでは、preliminaryなアセンブリやキメラを含む生データから…

LongAGE

1塩基のブレークポイント分解能で構造変異(SV)の正確な位置を定義することは、アライメントのギャップが大きいために困難な問題である。これまでは、AGE(Alignment with Gap Excision)を用いることで、1塩基分解能でSVのブレークポイントを定義すること…

完全性、正確性、連続性を考量してゲノムアセンブリを評価する PDR

既存のゲノムアセンブリ評価指標は、ゲノムアセンブリの品質の特定の側面についての限られた知見しか提供しておらず、時にはお互いに意見が合わないこともある。アセンブリ間の統合的な比較をより良くするために、著者らはここで新しいゲノムアセンブリ評価…

publication readyなggplot2 プロット出力を行う ggpubr

2020 8/9 誤字修正 2020 10/5 説明追加 2021 8/9 追記 ggplot2' パッケージは R でのエレガントなデータ可視化のための優れた柔軟性を持っているが、デフォルトで生成されるプロットは、出版前にいくつかのformatingを必要とする。さらに、'ggplot'をカスタ…

(ヒトゲノム)高速かつ精度の高いロングリードのSVコーラー cuteSV

2021 5/6 インストール手順、help、コマンド更新 構造変化(SV)とは、欠失、挿入、逆位、重複、転座などのゲノムリアレンジメントで、その大きさが50 bpを超えるものを指す。ヒトゲノム上で最大のdivergencesとして、SV はヒトの疾患(遺伝性疾患やガンなど…

(microbial genomes)低分子量タンパク質のアノテーションを付ける SmORFinder

Sberroら(2019)が行った最近の研究により、ヒトマイクロバイオーム内に存在するスモールタンパク質の広大な未踏空間が明らかになった。現在のところ、これらの小さなオープンリーディングフレーム(smORF)は既存のリファレンスゲノムではアノテーションさ…

エラーの多いロングリードをアセンブリグラフにアラインする GraphAligner

ゲノムグラフは、遺伝的変異や配列の不確実性を表現することができる。ゲノムグラフに配列をアラインさせることは、エラー修正、ゲノムアセンブリ、パンゲノムグラフ内のバリアントのジェノタイピングなど、多くのアプリケーションの鍵を握っている。しかし…

フェージングの品質を評価、改善する phaseME

同じDNA分子上でどの突然変異が発生しているかを検出することは、その結果を予測するために不可欠である。これは、ゲノム変異のphasingによって達成することができる。それにもかかわらず、最先端のハプロタイプphasingは、現在のところ、再構成されたハプロ…

De Bruijnアセンブラ Minia

2020 8/5 誤字修正 de Bruijnグラフデータ構造は、次世代シークエンシング(NGS)で広く利用されている。デノボアセンブラなどの多くのプログラムは、このグラフのインメモリ表現に依存している。しかし、現在のヒトゲノムのde Bruijnグラフを表現する技術で…

Transcript-level Aware なロングリードのエラーコレクションを行う TALC

ロングリードシーケンシング技術は、複雑なRNAトランスクリプト構造を決定するために非常に重要だが、エラーが発生しやすい。同じサンプルからシーケンスされたショートリードの精度と深さを利用してロングリードを補正する「ハイブリッド補正」アルゴリズム…

 tty-tableを使ってターミナルで表を整形表示する

2020 8/8 タイトル修正 タイトルの通り 。CLI環境で表を見やすく表示する。 インストール Node.jsのパッケージマネージャnpmを使う(gemにも対応)npm install tty-table -g > tty-table -h $ tty-table -h オプション: --version バージョンを表示 [真偽] -…

De brujin アセンブラ BCALM 2

シーケンシング実験あたりのデータ量が増加するにつれて、フラグメントアセンブリはますます計算量が増加している。De Bruijn graphは、フラグメントアセンブリアルゴリズムで広く使用されているデータ構造で、リードのセットからの情報を表現するために使用…