macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

workflow

Procaryotesの自動アセンブリパイプライン Mypro

Pos 最近の全ゲノムシーケンシング(WGS)技術のコストの低下は、様々な原核生物のシーケンシングの増加をもたらした。典型的なゲノミクスプロジェクトでは、データマイニングの前にシーケンシングリードを処理する必要がある(Hasman et al、2014; Rhoads e…

Varscan2 の解析の流れ

修正 不確かな情報を削除 Using VarScan 2 for Germline Variant Calling and Somatic Mutation Detection(Daniel C. Koboldt et al., 2013)より シングルヌクレオチド変異(SNV)および小さな挿入/欠失(indels)のようなバリアントの同定は、リシークエ…

メタゲノムから抗生物質耐性情報を検出する NastyBugs

病原性細菌の薬剤耐性(Antimicrobial resistance: AMR)は、世界中の公衆衛生上の脅威となっている。最も重要なのは、近年数が増えている多剤耐性(MDR)菌である(論文より ref.1)。これらの病原体の周知の例には、メチシリン耐性黄色ブドウ球菌(MRSA)…

SuperTranscripts 其の2

Githubで紹介されている、Supertransctiptsを非モデル生物のRNA seq解析に適用する場合の流れを確認する。以下のようなフローをとる。 de novoアセンブリして得たcontigにマッピングして定量し、定量結果からクラスタリングする。そのクラスタリング情報を使…

クロロプラストゲノムの自動アセンブリパイプライン Fast-Plast

Fast-Plastは、既存および新規のプログラムを活用して、葉緑体ゲノム全体を迅速にアセンブリし、検証するパイプライン。 十分なデータを持つほとんどのデータセットについて、Fast-Plastは自動で完全長の葉緑体ゲノムアセンブリを生成できる。 Fast-Plastは…

de novo transcriptomeのcontigクラスタリングツール Corset

RNA-seqは、トランスクリプトームの様々な側面を研究するための強力な技術である。それは、遺伝子発見、選択的スプライシングイベントの検出、継時的発現分析、融合の検出、SNPおよび転写後エディティングなどの変異の同定を含む広範囲の用途を有する[ref.1]…

バクテリアのRNA seq定量ツール EDGE-pro

バクテリアゲノム中の遺伝子の発現を測定することは、感染の治療法の開発から合成ゲノムの作成まで、非常に幅広い用途を有する。バクテリアにおける遺伝子発現研究は、代謝経路を研究し、変異株の特性を同定し、他の点ではそれらのゲノムにおける分子過程を…

CNVを検出するパイプライン iCopyDAV

ハイスループットシークエンシング技術の出現により、集団に特異的な構造変異(SV)および疾患におけるそれらの可能な役割の同定にかなりの関心が集まっている。様々な構造変化の中で、コピー数変動(CNV)は、ヒトゲノムの多様性および疾患に有意に寄与する…

臨床向けアンプリコンシーケンス自動解析パイプライン Canary

臨床診断は、ヌクレオチドレベルで患者DNAを分析することができる技術によって変化している。臨床シーケンシングの精度、処理時間および再現性は、rawシーケンシングデータを有意義なバリアントに変換するバイオインフォマティクスパイプラインに大きく依存…

ONTのロングリードのアセンブリとポリッシュ

2018年2月のNature CommunicationsにシロイヌナズナのゲノムをONTのロングリードを使ってアセンブリした論文( PCR-free paired-end readsでpolish)が出ている(https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5803254/)。ONTの MinION R9.4 flowcell (FL…

ヒトゲノムの統合変異検出パイプライン speedseq

8/7 ホストからジョブを投げるようにコマンド修正 8/8 realignコマンド修正 第2世代のDNA配列決定技術の技術的進歩により、全ゲノム配列決定(WGS)データを生成するために必要なコストと時間が削減され、これまでにない深さと範囲でヒトゲノムを調査するこ…

ゲノムを比較する MUMmer

追記 9/1-9/6 アライメントワークフロー MUMmer3 シーケンスアライメントパッケージ[mummer4論文より ref.1]の2004年のpublish以来、バイオインフォマティクスのランドスケープは劇的に変化した。シーケンスデータを生成するコストは急速に低下し、組み立て…

NGSデータから素早くバクテリアの分析を行う MICRA

ハイスループットシーケンシング(HTS)技術は多くの微生物学的問題に対処するための費用対効果の高い便利なアプローチとして浮上し、この分野を大きく変えている。完全なゲノム情報にアクセスすることは、微生物学における基礎研究に革命をもたらし、例えば…

バクテリアのRNA seq自動解析パイプライン SPARTA

RNA seq実験の分析フローには多くの工程が含まれる(クオリティチェック、マッピング、定量、統計を使った発現変動遺伝子の検出)。これら RNA-seq分析ワークフローには多数のツールが発表されているが、各ステップで選択できるツールが多数あるため、適した…

メタゲノムの自動解析パイプライン MyCC

MyCCは全プロセスを自動化したメタゲノム解析ツール。contigのfastaファイルを入力すると、配列の特性に従って自動で分類し、binning向けに色がついた図を描画し、さらにクラスタリングされたfastaまで出力することができる。既存のカバレッジやペアリードの…

ゲノム情報はないが、モデル生物と近縁な生物のRNA seq 解析

ゲノム情報はないが近縁種のゲノムが解読されているような生物でRNA seqを行うと決まったら、どんなワークフローで進めるべきだろうか?マイクロアレイと違い、RNA seqならde novoでも解析は不可能ではない。ゲノムがモデル生物とほぼ同じならば、深く考えな…

シロイヌナズナのRNA seq解析

植物のRNA seqを初めてされる方向けに作成した資料です。 真似すれば流れを再現できるように記載しています。流れに興味があれば同じように実行してみてください。 論文 https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3566969/ シーケンスデータ https://ww…

RNA seqのワークフロー タキシードプロトコル

2012年にnatureでtophatとcufflinksを使ったRNA-seq解析の手法が発表されている。 http://www.nature.com/nprot/journal/v7/n3/full/nprot.2012.016.html tophat、bowtie、cufflinksなどを使ったいわゆるタキシードプロトコルはRNA seqの1つのワークフロー…

small indelとSNV検出のワークフロー 準備編

この投稿はSNVとindel検出に必要なツールの準備編です。 実際の検出のワークフローは以下のエントリーを確認してください。 --準備するもの-- 解析に必要なソフト GATK BWA Picard Samtools Bedtools SnpEff R (解析の途中で読み込まれ画像ファイルなどを出…

small indelとSNV検出のワークフロー

SNVやsmall indel検出については精度の高いワークフローがすでに確立されている。例えば下記のニューヨーク大のHP https://gencore.bio.nyu.edu/variant-calling-pipeline/ には、SNVとsmall indel検出ワークフローが記載されている。流れを説明すると bam作…