macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

human genome

de novo transcriptome解析のクラスタリングとclosely rellatedな種の情報を用いたアノテーションを行う Grouper

シーケンシング技術の進歩により、モデル生物の範囲を超えてトランスクリプトームを効率的かつ正確に探索することが可能になった(Ekblom and Galindo、2011; Marioni et al、2008)。トランスクリプトームシークエンシングは、高品質のリファレンスゲノムを…

ヒトのガン原遺伝子/腫瘍抑制遺伝子の変異を視覚化するwebツール Mutplot

シーケンシング技術開発はガン研究に革命をもたらした。約20年に及ぶ発展後、次世代シーケンシング(NGS)は速くて手頃な価格になっている。それは精密医療を臨床の現実にした。 NSGは、臨床現場での治療法を個別化し、研究情報を広げるための包括的なビッグ…

(ヒト、マウス向け)GO term enrichment解析を行う GOnet

ゲノムワイド研究のアウトプットは、通常、共有の発現パターンを示す遺伝子(またはそれらのタンパク質産物)のリストである。例えば、これらは、疾患の有無にかかわらずドナー群において差次的に発現される遺伝子、または生物学的サンプルの特定の画分にお…

様々なデータベースを使ってヒトミトコンドリア変異のアノテーションを行う hmtnote

2019 6/11 データベース追記 HmtNoteは、VCFファイルからヒトのミトコンドリアのバリアントにアノテーションを付けるためのPythonパッケージである。バリアントは、基本、相互参照、変動性、予測のサブセットにグループ化された幅広い情報を使用してアノテー…

(ヒト向け)matched tumor normal ペアからsomaticとgermlineのCNVイベントを検出する TumorCNV

生殖細胞系コピー数変異(CNV)および体細胞コピー数改変(SCNA)は、ガンにおいて重要な役割を果たすことが示されている。次世代シーケンシング(NGS)技術の急速な発展に伴い、全ゲノムシーケンシング(WGS)は、ガン研究および臨床診療においてゲノムワイ…

(ヒト向け)超高感度なマルチサンプルバリアントコーラー Needlestack

大規模並列シーケンシング、または次世代シーケンシング(NGS)は、従来のSangerシーケンシングと比較してスループットの大幅な増加と低存在量のバリエーションを検出するこれまでにない能力により、遺伝的バリエーションの探索方法に革命をもたらした。シー…

SRAのRNA seqデータを素早く比較・分析する Digital expression explorer 2(手持ちのデータにも対応)

10年前の最初の記述以来、RNAシーケンス(RNA-seq)はトランスクリプトームにおける強力な方法となり、非常に正確な遺伝子発現の定量を可能にした[ref.1]。シークエンシングのコストが下がるにつれて、RNA seqのデータは科学文献でより一般的になりつつある…

リファレンスなしでnanopore Direct RNA seqのリードの向きを予測する ReorientExpress

ロングリードシークエンシング技術は、あらゆる種からのトランスクリプトームの体系的な調査を可能にする。ただし、機能評価には5 'から3'への方向を正しく決定する必要がある。 complementary DNA(cDNA)ライブラリーのシーケンシングは、一般に多数のリー…

ラージゲノムにもスケールする高速なドラフトゲノム配列polishingツール ntEdit

2019 5/17 論文引用、タイトル修正 この10年間で、次世代シーケンシングテクノロジはスループットを大幅に向上させた。例えば、今日では、20 Gbpの針葉樹ゲノムの50倍のカバレッジシーケンシングもIllumina HiSeq-Xマシンなら8レーンフローセル1回で達成で…

ノイズを除去しながらsmall /large cohortsのgenotypingを行う smoove

smooveは既存のソフトウェアをラップし、構造変異のコールやジェノタイピングを簡単にするため、いくつかのフィルタリングを追加している。フィルタリングにより、smooveは低レベルのノイズを示すスプリアスなアライメントシグナルを削除し、recallを向上さ…

ロングリードのself error correctionやcontigのポリッシングを行う CONSENT

2019 4/16 マッピングの画像追加 第3世代のシークエンシング技術Pacific BiosciencesとOxford Nanoporeは、2011年の創業以来広く使用されてきた。 このロングリードは、コンティグおよびハプロタイプアセンブリ(Patterson et al、2015; Kamath et al、2017…

cell free DNAサンプルのSVを検出する SViCT

精密腫瘍学における現在の課題は、患者における腫瘍の進行を追跡する能力である(例えば治療への反応)。これに対する古典的なアプローチは、異なる時点で組織生検を実施することであろう。これは高価で時間がかかるプロセスであり、そしてこれは侵襲的処置…

ロングリードを使ってMobile elements挿入を検出する rMETL

2019 2/19 流れ修正 Mobile element insertion(MEI)は、ヒトゲノムにおける構造変化(SV)の約25%に相当し、これは主にAlu、L1およびSVAファミリーなどのアクティブなmobile elementsによってもたらされる(Stewart et al、2011)。これまでショートリー…

fusion geneを検出する FuSeq

染色体再編成の一種である遺伝子融合は、発ガンにおいて重要な役割を果たすことがわかっている[ref.1、2]。それはキメラタンパク質の増加、ガンの危険性および腫瘍の表現型と密接に関連しており、それらはすべて臨床解釈の可能性を秘めている[ref.2]。融合遺…

KrakenUniq

2019 1/17 エラー修正 メタゲノミクス分類手法は、データセット内の各リードに taxonomic identityをアサインすることを試みる。メタゲノミクスデータにはしばしば何千万ものリードが含まれているため、分類は、通常、長さk(k-mers)の短いワードの正確な一…

低コスト且つ短時間で行える高分子量gDNA抽出プロトコル

2019 1/7 タイトル修正 複雑なゲノムの新規シーケンシングは、高品質のリファレンス配列を求める研究者にとっての主要な課題の1つである。 多くのde novoアセンブリはショートリードに基づいており、断片化されたゲノム配列を生成する。 リード長が10 kbを超…

インタラクティブなRNA seq解析webアプリケーション iDEP

2019 5/23 tweet追記 RNAシークエンシング(RNA-Seq)[1]は、ゲノムワイドな発現解析のための日常的な技術となった。ますます低コストで、ライブラリー構築およびシーケンシングはしばしば標準的なプロトコルに従って実施することができる。多くの研究者、特…

NCBI FTPサーバからゲノム配列をダウンロードする ncbi-genome-download

タイトルの通りの機能をもつスクリプト。 ncbi-genome-downloadに関するツイート インストール mac os10.13のminiconda2-4.0.5環境でテストした。 依存 本体 GIthub #anaconda環境ならcondaで導入できるconda install -y -c bioconda ncbi-genome-download >…

Linked readを使ってクロモソームスケールのアセンブリを行う ARKS

ARCSより 10×Genomics(10×G、Pleasanton、CA)のChromiumシークエンシングライブラリー調製プロトコルは、Illuminaシーケンシング(San Diego、CA)ベースで長いDNA断片上にショートリードとバーコード情報を提供しローカライズさせる。したがって、高スル…

テロメア長を推定する telseq

テロメアは染色体の末端を覆い、ゲノムの完全性の維持に重要な役目を担っている。ヒトでは、テロメアは5〜15kbのTTAGGGタンデムリピートの配列、およびそれらのテロメア結合タンパク質(論文より ref.1)から構成される。テロメラーゼまたは代替の経路が存在…

バリアントコール結果を可視化して、素早くバリアントフィルタリングを行うVIPER

次世代シーケンシング(NGS)の開発により、ゲノムシーケンシングは多くの研究分野、特にがん研究に関連する分野(Shen et al。、2015)に適用可能となった。異なるスケールで変化を検出するため多くのツールが開発されている。例えば、GATK(McKenna et al…

複数のSVコール結果をマージする FusorSV

欠損、重複、挿入、逆位、コピー数変化、転座などの構造変化(SV)は、ヒトの遺伝的多様性の最も重要な決定因子の1つである。 1000ゲノムプロジェクト(1000GP)などのコンソーシアムの取り組みは、典型的なゲノムが2100〜2500のSV(> 50bp)を含み、SNPの約…

ハイブリッドアセンブリのためのアライメントフリー scaffolding graph構築ツール Fast-SG

2018 10/26 タイトル修正 ゲノム全体のデノボアセンブリの主要な課題は、リピートを解決することである[論文より 1,2]。リピートは、ゲノムの複数の位置で生じるほぼ同一のゲノム配列に対応する。この課題に対処するために、主に2つのタイプのアプローチが提…

複数のSVコーラーを動かし、結果を統合する Parliament2

2018 10/26 エラー修正 2018 10/28 エラー修正 2019 3/2 追記 2019 6/11 twitter追記 2019 7/1 dockerインストールをlatestタグに修正=>エラーがあったため0.1.17に戻した 構造変異(SV)は、ゲノムの大きな(50bp+)変異である[論文より ref.1,2]。これらの…

Var2GO

Var2GOはハイスループットシーケンシングデータのさまざまな変異コールから、遺伝子アノテーションとフィルタリングをサポートする新しいWebベースのツールである。その主な目的は、非生物情報学者が直感的なWebインターフェイスを介してVariant Calling For…

バリアントをランク付ける VVP

2018 10/23 コマンドの誤り修正 バリアントの優先順位付けは、遺伝子検査、エキソームまたは全ゲノムシーケンシングの過程で同定されたバリアントが遺伝子機能を損なう可能性があるかどうかを決定するプロセスである(レビュー[論文より ref.1,2,3])。バリ…

既知変異情報を利用して精度を上げたバリアントコールを行う IVC

ゲノムのバリアント検出は、ゲノミクス、バイオインフォマティクス、生物医学研究およびその応用(1000 Genomes Project Consortium、2012,2015; Pabinger et al、2014)において非常に重要な意味を持つ。次世代シークエンシング(NGS)技術の最近の進歩によ…

ラージゲノムにも対応したアセンブリ評価ツール QUAST-LG

現代のDNAシーケンシング技術は染色体の全配列を読み取ることができない。代わりに、それらはゲノムの異なる部分からサンプリングされた多数のリードを生成する。低コストで高品質の第2世代シーケンシング(次世代シークエンシングまたはNGSとも呼ばれる)の…

ラージゲノムにも対応したdot plot解析ツール D-GENIES

ドットプロットは、2組のシーケンスを視覚的に比較するために一般的に使用される。それらは挿入、欠失、逆位またはリピートを容易に理解できる方法で提示する。可変の線の太さ、線の形または色を使用して類似点の差異を表すことができる。産生されるゲノムア…

ターゲットキャプチャシーケンシングをシミュレートする capsim

高スループットシークエンシング(HTS)は、費用対効果が高く時間効率の良いサンプルの完全な遺伝情報を得る能力を持ち、ゲノム研究に大きく革命をもたらした。多くの臨床応用において、作用可能な領域のパネルのみが調査対象である(Bellos et al、2014; Sa…