macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

VCFとPEDから予測される家系、性別、祖先関係を元にサンプルの潜在的な汚染を見積もる Peddy(ヒト向け)

ヒトDNAシーケンス研究では、多くの場合、複数の研究所や個人によるDNAサンプルと関連するマニフェストの取り扱いが含まれる。 WESとWGSの両方のプロトコルには、シーケンス前の複数のDNA操作が含まれる。新しい手順や処理はそれぞれ、サンプルの混同、汚染…

contigをscaffoldingする Scaffold_builder

#今回からDNAシーケンシング => DNAシークエンシングに統一。 第二世代シークエンシングは、完全なゲノムシークエンシングのための最も費用対効果が高く、すぐに利用可能な技術である。完全なゲノム配列のアセンブリとscaffoldingはしばしば課題のままとなっ…

初めてコマンドを使う人向けの解説:その2、ツールをインストールする環境の構築 (mac対象)

2019 10/16 誤字とおかしな文章を修正 2019 10/17,10/18 同上 昨日ツイートしていた通り、次世代シーケンス関連の環境構築について書きます。 最近は様々な場所で初学者向け講習会や勉強会が開催されており、やる気さえあれば確立された解析フローを短期間で…

メタゲノムのtaxonomic assignmentと定量を行う CCMetagen

環境試料および宿主関連試料(メタゲノミクスおよびメタトランスクリプトミクス)のDNAおよびRNAのハイスループットシークエンシングは、どの生物が試料中に存在するかを評価するための強力なツールである。Taxonomy同定ソフトウェアは通常、個々のショート…

コア遺伝子有無など視覚化できるスケーラブルな原核生物間のゲノム比較ツール Chromatiblock

完全な原核生物ゲノム間の構造的変化を視覚化することは、系統の違いの遺伝的基盤を特定するために重要である。これは通常、連続したペアワイズ比較または複数の線形の結果を線形レイアウトまたは環状レイアウトで表示することで実現される。シリアルペアワ…

GAPPadder

急速に発展するハイスループットシーケンステクノロジーにより、シーケンスリードからのde novoゲノムアセンブリは、シーケンステクノロジーの主要なアプリケーションになった。これまでに、多くのゲノムアセンブリソフトウェアツールが開発されている[ref.1…

アセンブリグラフから二次代謝産物生合成遺伝子クラスターを再構築する BiosyntheticSPAdes

微生物ゲノムまたはメタゲノムをアセンブリするための多くのツールが存在するが(Simpson et al、2009、Li et al、2015、Nurk et al、2017)、それらはすべて反復ドメインを有するタンパク質をコードする長い遺伝子を含むコンティグに関して限界がある。長い…

バクテリア/アーキアの高速なアノテーションパイプライン DFAST

本著者らはパブリックシーケンスデータベースへのゲノム送信をサポートする原核生物ゲノムアノテーションパイプラインDFASTを開発した。 DFASTは元々オンラインアノテーションサーバーとして開始され、現在までに(論文執筆時点)、2016年の最初の立ち上げ以…

メタゲノムのアセンブリ配列からファージやプラスミドを予測する PPR-Meta

Mobile genetic elements(MGE)として知られるファージとプラスミドは、原核生物や真核生物の間で遺伝情報を交換するとともに、水平遺伝子伝達(HGT)の主要な参加者である[ref.1]。そのようなエレメントは、宿主と相互作用することによって微生物群集を調…

indelエラーの多いロングリードからタンデムリピートを探す Noise-cancelling repeat finder

ロングタンデムリピート(LTR)アレイはヘテロクロマチンと関連しており、ヒトゲノムで重要な役割を果たしている。たとえば、(TTAGGG)n TRはテロメアを保護し(Blackburn and Gall、1978)、(AATGG)nリピートはヒートショックレスポンスに関与し(Goenka…

ゲノムや特定の領域の配列比較結果をシンテニーブロックで視覚化する Easyfig

比較ゲノミクスには、特にシンテニー領域の挿入、欠失、および変異の特定のための、シーケンシングされたゲノムの比較が含まれる。複数のゲノムの特定の領域間のアライメントを視覚化することは、株や種の間の表現型の変化の根底にある遺伝子型の違いを識別…

変異が導入されたゲノムをシミュレートする simuG

ゲノムシーケンステクノロジーの急速な進歩に伴い、ゲノムシーケンスデータに基づいてゲノムバリアントを特徴付けるための多くのバイオインフォマティクスツールが開発されてきた。実際の生物学的サンプルから実験的に検証されたゴールドスタンダードゲノム…

メタゲノムのmappingを行う MetaMaps

メタゲノム配列の分類は、高速で正確かつ情報豊富でなければならない。新しいロングシーケンステクノロジーは、これらの要素間のバランスを改善することを約束するが、ほとんどの既存の方法はショートリード用に設計されている。 MetaMapsは、ロングリリード…

VT

シーケンシングデータからバリアントをコールする方法は、一塩基多型(SNP)を超えて、短い挿入および欠失(indels)、短いタンデムリピート(STR)、MNP、構造変異(SV)などがターゲットになってきている。これらの異なるクラスのバリアントは、通常、Vari…

ヒトのバリアントを視覚化したりフィルタリングできるwebツール VCF/Plotein

エクソームシークエンシング(ES)は、多数のヒト表現型および疾患に寄与する遺伝的変異を同定することにおいて非常に成功している (Gilissen et al., 2011; Do et al., 2012).。しかしながら、疾患を引き起こす変異および突然変異を同定する実際のプロセス…

eukaryotesの進化的に保存された遺伝子クラスターを検出する EvolClust

真核生物ゲノムの遺伝子のorderは、進化を通じてあまり保存されない傾向がある(DávilaLópezet al。、2010)。この傾向にもかかわらず、 遺伝子の特定のグループは、長い進化距離にわたってゲノム内に近接したままであり、これは、選択がそれらのゲノムの共…

共通/非共通の要素をベン図で視覚化し、抽出する jvenn

ハイスループットの生物学は、ますます複雑な実験計画で、データの数を増やしている。これらのデータの分析では、多くの場合、遺伝子名やOTU(Operational Taxonomic Unit)を含む生物学的識別子のリストが生成される。これらは異なる方法(微分分析)または…

ウィルスアノテーションパイプライン VAPiD

シーケンシング技術がより安価でより入手しやすくなるにつれて、ゲノムシーケンシングはますます普及してきている。小規模のグループでは、単独で分析できるよりも多くのシーケンスデータが生成されている。これらのデータから最大の科学的および公衆衛生的…

MetaBAT2

微生物の分離と培養に基づく微生物群集の研究は、高スループットの全ゲノムショットガンシーケンスベースのメタゲノムに徐々に置き換えられている(Van Dijk et al、2014; Tringe&Rubin、2005でレビュー)。計算メタゲノムの進歩により、ディープメタゲノム…

マッピングとバリアントコールを両方行う MapCaller

次世代シーケンシング(NGS)技術の進歩により、近い将来に精密医療のさまざまなアプリケーションをサポートできるようになってきている(Ku and Roukos、2013)。ますます多くの医学的および生物学的研究でNGS技術を採用してパーソナル間の遺伝的変異を特徴…

配列をクラスタリングする Sumaclust

次世代シーケンシングの開発により、数百万のシーケンスを妥当な時間で処理するための効率的なツールが必要になる。Sumaclustは、LECAによって開発されたプログラムで、高速かつ正確な方法でシーケンスをクラスター化することを目的としている。 このツール…

BWTによる高速なゲノム間アラインメントを行う GSAlign

パーソナルゲノミクスと比較ゲノミクスは、臨床診療とゲノム研究においてますます重要になっている2つの分野である。両方のフィールドは、配列の保存と構造の変化を発見するためにシーケンスアラインメントが必要である。ゲノム配列のアラインメントを処理す…

Human Phenotype Ontology (HPO)データベース(Exomiserについて紹介)

鑑別診断 (differential diagnostics, wiki) およびトランスレーショナルリサーチの基盤となるのは、詳細な表現型の特定である: 詳細な個々の臨床異常のコンピューター分析である(ref.1,2)。 Human Phenotype Ontology(HPO, wiki)は、計算によるdeep phe…

アセンブリ結果を評価する dnAQET

次世代シーケンス(NGS)テクノロジーの導入により、大量のゲノムシーケンスデータを生成できるようになった。これにより、個人のゲノムをシーケンシングしてde novoアセンブリすることが可能になった。約10年前、NGSテクノロジーにより、二倍体de novoゲノ…

miRNAとそのターゲット遺伝子のデータベース miRTarBase

MicroRNA(miRNA)は、18〜25ヌクレオチドの小さな非コーディングRNAであり、動物と植物の両方で転写後レベルの中心的な調節因子である。 miRNAとそのターゲットmRNAの完全またはほぼ完全な相補的結合は、mRNAの分解を促進したり、mRNAの翻訳を抑制したりし…

タンパク質相互作用を調べる BioGRID

大量の個々のタンパク質または遺伝的相互作用、およびRNA、DNA、膜、炭水化物、低分子代謝産物の相互作用から集約された生物学的相互作用ネットワークは、遺伝子と表現型の関係およびすべての細胞の機構的基盤を理解するためのフレームワークとして機能する…

prokaryotic virusのcontigをクラスタリングしTaxonomic assignmentを行う vContact2

2019 9/25 誤字修正 細菌と古細菌は、海洋と土壌の生態系での栄養とエネルギーのサイクルに役割を果たしており、人間の健康にも重要な役割を果たしている。細菌や古細菌に感染するウイルスは、殺害、代謝再プログラミング、または遺伝子導入によってこれらの…

タンパク質のホモリピートを分析するwebサーバー dAPE

Low Complexity(LC)は、タンパク質中のタンデムリピートおよびcompositionally biased regions(CBR)のようなアミノ酸組成にほとんど多様性がない領域を説明するために使用される一般用語である。ホモリピート、またはpolyX領域は、単一のアミノ酸残基の…

初めてコマンドを使う人向けの解説:その1、指定した領域から配列を抽出する

2019 9/20追記 ゲノムのダウンロード この記事では、初めてコマンドで動作するツールを使う方向けにゲノムの指定した領域から配列を抽出する方法について説明します。コンピュータはmacを想定しています。普通はpython3やanacondaを入れ、condaのコマンドを…

ONTのロングリードから抗生物質耐性遺伝子の分布を調べるwebサーバー NanoARG

薬剤耐性(AMR)は、感染症を予防および治療する能力を損ない、世界的な公衆衛生の脅威になる[ref.1]。現在、抗生物質耐性による世界中の年間死亡者数は、2050年までに1,000万人を超えると推定されている[ref.2]。これに対応して、多くの国内および国際機関…