macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

RNA seq

(RNA seq) 複数のde novoアセンブリ結果をマージし、冗長なcontigを除く DRAP

第二世代シークエンシングプラットフォームは、多種多様な種および条件の遺伝子発現を分析することを可能にする、多量の転写産物のシーケンスデータの生成を可能にした。リファレンスゲノム配列を欠く種については、現在の古典的なプロセシングパイプライン…

de novo transcriptomeのcontigクラスタリングツール Corset

2019 6/11 インストール追記 RNA-seqは、トランスクリプトームの様々な側面を研究するための強力な技術である。それは、遺伝子発見、選択的スプライシングイベントの検出、継時的発現分析、融合の検出、SNPおよび転写後エディティングなどの変異の同定を含む…

バクテリアのRNA seq定量ツール EDGE-pro

バクテリアゲノム中の遺伝子の発現を測定することは、感染の治療法の開発から合成ゲノムの作成まで、非常に幅広い用途を有する。バクテリアにおける遺伝子発現研究は、代謝経路を研究し、変異株の特性を同定し、他の点ではそれらのゲノムにおける分子過程を…

マルチマッピングを補正する MMR

ハイスループットシーケンシングデータのリファレンス配列への迅速かつ正確なマッピングの必要性に対処するために、過去数年間に多くの異なるソフトウェアツールが開発されてきており、その多くは頻繁に更新および改良されている(論文より Dobin et al、201…

トランスクリプトームのblast比較結果を統合し、ベン図を描く VennBLAST

ハイスループットシークエンシングは広範な技術となり、進化的研究を含む様々な研究分野でアクセス可能となっている。ゲノムが利用できない生物の転写産物をシーケンスし、注釈を付ける能力は、分子進化の分野における生物学者、特に非モデル生物を含むルー…

CircosをWeb上 で利用できる ClicO FS

2020 7/24 関連文献追記 Circos(Krzywinski et al、2009)(HP)は、ビジュアルデータを環状形式で表現するPerl言語ベースのツールである。ネイティブのCircosソフトウェアは、コマンドラインインターフェイス(CLI)を介して提供されている。ソフトウェア…

バクテリアゲノムを各featureとともに描画するwebツール CiVi

環状ゲノム表現は、ゲノム全体のデータを包括的に検査する優れた方法を提供する。 CGView(論文より Stothard and Wishart、2005)、GenomeVx(Conant and Wolfe、2008)、GeneWiz(Hallin et al、2009)およびDNAPlotter(Carver et al、2009)を含む環状視…

高速かつ高感度なRNA/DNAのアライナー HPG Aligner

ハイスループットシーケンサーの最新世代は、前例のないスケールでデータを生成し、関連するシーケンシングコストが連続的に減少している。特に、トランスクリプトームの包括的なプロファイルを提供するRNAシーケンシング(RNA-seq)技術(論文より ref.1)…

RNA-seqのクロスコンタミを検出する Croco

核酸試料間の汚染は、分子生物学における潜在的な問題として長く認識されてきた。ポリメラーゼ連鎖反応(PCR)による増幅や、そして最近ではハイスループット配列決定でのPCR増幅は、ソースにかかわらず、また非常に低レベルの混入した核酸でさえ、十分な範…

RNA seqのシミュレータ polyester

RNA-seq実験は遺伝子発現を研究する手段としてますます普及が進んでいる。RNA-seqデータ(Oshlack et al、2010)の発現解析のための様々な統計的手法がある。 RNA-seqの統計的方法論の開発者は、ツールが正しく機能しているかどうかをテストする必要がある。…

低複雑度領域由来のリードを除去する RepeatSoaker

次世代シークエンシング(NGS)技術は、主に、DNA / RNAサンプルからの数百万回のリードの超並列シーケンシングに基づいており、リード長は増加している[論文より ref.1,2]。 NGSのコストは急速に低下し、その結果、転写を研究するためにマイクロアレイの使…

高速なRNA seqのマッピングツール DART

近年の次世代シーケンシング(NGS)プラットフォームの出現により、大量並列cDNAシークエンシング(RNA-Seq)技術は、発現の高分解能測定および低量の転写産物の検出における高感度を提供するもう一つの強力なツールとなっている。 RNA-Seqは、事前の遺伝子…

高速なRNA seqのマッピングツール HISAT2

2019 6/18 コマンド追記、6/26 インストール追記、6/28 samtoolsコマンドエラー修正 2020 3/22 help更新、4/16 multiqcとの連携例、4/29 誤解のある表現を修正、8/28 index追記, help更新 2021 1/21、8/26 インストール追記 2024/02/16 インストール手順(py…

   RNAシーケンスデータを使いアセンブルを改善する Rascaf

近年、配列決定されたゲノムの数と多様性が非常に増加している(論文より Reddy et al、2015)。 13,000以上の真核生物が配列決定されているか、配列決定の過程にあり、数百の植物や動物を含むより多くのものが計画されている。大部分のモデル生物は、高品質…

   ペアエンドRNAシーケンスを使いアセンブルを改善する P_RNA_scaffolder

2020 7/12 追記 ゲノムシークエンシングプロジェクトでは、遺伝子の同定は機能的研究と比較分析の基本である。メイトペアライブラリーおよびロングリードは高品質のアセンブリの生成を容易にするが、すべての遺伝子の完全な構造を回復することは困難であり、…

RNA seqのクオリティコントロールツール RSeQC

2019 12/2 インストール追記 2020 12/9 誤字修正, help追加 2022 インストール手順追記 RSeQCはクオリティ、GCバイアス、PCRバイアス、ヌクレオチド組成バイアス、シーケンスのデプス、strandの特異性、カバレッジ均一性およびゲノムのfeature上のカバレッジ…

バクテリアのRNA seq自動解析パイプライン SPARTA

RNA seq実験の分析フローには多くの工程が含まれる(クオリティチェック、マッピング、定量、統計を使った発現変動遺伝子の検出)。これら RNA-seq分析ワークフローには多数のツールが発表されているが、各ステップで選択できるツールが多数あるため、適した…

RNA seqのクオリティチェックツール QoRTs

2020 12/9 condaインストール追記、help更新 RNA-Seqは特定のバイアス、エラー、アーチファクトを受けやすく、堅牢で包括的なクオリティコントロールが必要である。QoRTsは幅広いクオリティ分析マトリクスを出力する多機能ソフトウェアパッケージ。様々な角…

de novo transcriptome assemblyの適切なk-merレンジを推定する KREATION

de Bruijn graphを使ったde novoトランスクリプトームのアセンブルでは、単一のk- merより異なるk merのアセンブル結果を統合した方が感度が増す。KREATIONは関連するアセンブリの比較クラスタリングを使用して、追加のkmerアセンブリの重要性を推定するツー…

リファンレンスガイドのトランスクリプトのアセンブル TransComb

TransCombは、junction graphに基づいて開発されたゲノムガイドのアセンブルツール。ペアのショートリードとリファレンスゲノムを使い、RNA seqのシーケンスデータをアセンブルする。複数種のシミュレーションデータセットとリアルデータセットの両方でテス…

リファンレンスガイドのトランスクリプトのアセンブル strawberry

ゲノムガイドのRNAのアセンブル法は、遺伝子アノテーション情報を使わず、RNA-Seqデータから転写物の再構成を行う方法である。 Strawberryは ゲノムガイドのアセンブリと定量の2つのモジュールで構成されており、ゲノムガイドのアセンブルではbamをスプライ…

リファンレンスガイドのトランスクリプトのアセンブリツール Scallop

2020 2/5 condaインストール追記 Scallopは、リファンレンスガイドのトランスクリプトのアセンブルツール。 マルチエキソンの転写物や低発現の転写物を組み立てる際の高い精度を特徴とする。ヒトRNA-seqサンプルでは、ScallopはStringTieおよびTransCombより…

真核生物のRNAのコード領域を予測するGeneMarkS-T

GeneMarkS-T は教師なし学習でトレーニングされたRNAのタンパク質コード領域を予測ツール。原核生物向けのGeneMarkSを真核生物向けに拡張して作られた。データサイズに寄らず一定の検出率を示すため、データが莫大になるメタトランスクリプトーム解析のコー…

de novo transcriptome assembliesを評価する rnaQUAST

2020 2/3 インストール追記、実行例追記 2020 8/13 インストール追記 rnaQUASTはde novo transcriptomeのアセンブルパフォーマンスを比較するツール。リファレンスゲノムやtranscriptsのカタログにアセンブルした配列をアライメントし、様々な統計データをPD…

トランスクリプトームから主要なtrasncriptsを選抜する EvidentialGene

2019 6/19 関連論文追記 2020 2/17 依存のインストール手順更新 EvidentialGeneのtr2aacds.plは、de novo アセンブルツールの結果から生物学的に有用な最良のmRNAセットにクラスタリングするパイプライン。論文は準備中で不明な点もあるが、ポスターによると…

複数のトランスクリプトームをマージするtransfuse

transfuseは、フィルターを満たすtranscriptsをクラスタリングし、融合したtranscriptsを作るツール。複数のRNA のアセンブルツールで合成されたtranscriptsをマージし、よりハイグレードなtranscriptsを作るために用いられる。現在、論文準備中とされる。 …

超高速にRNA seqのリードカウント(定量)を行う salmon

2019 2/15 動画リンク追加 2020 4/19 インストール追記, help更新 2020 4/29 論文アブスト追記 RNA-seqリードからトランスクリプト の豊富さを定量化する軽量な手法であるSalmonを紹介する。Salmonは、新しい二相並列推論アルゴリズムと特徴量の多いバイアス…

rRNAを除く SortMeRNA

2020 2/5 condaインストール追記 2020 6/16 コマンドが大きく変更したため更新(v2.1) 2020 12/9 unmapを出力するようにコマンドを修正, 再びhelp更新(v4.2) 次世代シーケンシング(NGS)技術を生物群集から直接抽出したRNAに適用すると、コーディン…

RNA seqのクオリティチェックツール QoRTs

RNA-Seqは特定のバイアス、アーティファクトを受けやすく、 堅牢で包括的なクオリティチェックが重要になる。とくにサンプル調製、ライブラリー作成、またはシークエンシングのエラーは、 予期せぬアーティファクト、バイアスを引き起こす。適切に処理できる…

様々なバイオインフォマティクスツールの分析結果を1つに集約して分析できる MultiQC

2019 1/16 誤字修正および対応ツール情報更新、12/29 ツイート追加 2020 1/17 condaインストール追記、4/19 説明追記、5/25 ツイート追記 2023/12/20ツイート追記 今まで様々なNGSの評価ツールが発表されてきたが、それらは特定のデータを評価するものであり…