macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

chip-seq

ATAC-Seq、ChIP-Seq、WESなどのcDNA汚染の検出と除去を行う cDNA-detector

意図的または偶然に実験システムに導入された外因性cDNAは、そのシステムから得られた次世代シーケンサーライブラリーにおいて、その遺伝子に対するリードカバレッジの追加として現れることがある。適切に認識・管理されない場合、この外来シグナルによるク…

(ヒトゲノム)非コード領域のバリアントの機能を評価するウェブサーバー DeepFun

ゲノムワイド関連研究(GWAS)で同定された遺伝子変異の90%以上は、ヒトゲノムの非コード領域に存在する。ここでは、非コード領域の遺伝子変異の機能的活性を評価するための、ユーザーフレンドリーなウェブサーバー「DeepFun」(https://bioinfo.uth.edu/de…

ターゲットの転写制御因子を予測したりピークのアノテーションを行うウェブツール AnnoMiner

遺伝子発現の制御には、転写因子による正確な転写プログラムと、エピジェネティックな事象の組み合わせが必要である。近年、エピゲノムやトランスクリプトームの技術が進歩し、さまざまな遺伝子制御メカニズムが解明されてきた。しかし、転写因子とエピジェ…

GREAT

ゲノム全体のDNA結合イベントを局所的に測定することで同定されたシス制御領域の機能的意義を解析するために、Genomic Regions Enrichment of Annotations Tool (GREAT)を開発した。従来の手法では、遺伝子の近位にある結合のみを考慮していたが、GREATは遠…

エピゲノムプロファイルを用いた転写因子予測ツール BART

ある遺伝子セットを制御する機能的な転写因子の同定は、遺伝子制御研究において重要な問題である。従来の転写因子の同定方法であるDNA配列モチーフ解析では、特定の因子の機能的な結合を予測することができず、遠位のエンハンサーに結合する因子を検出するに…

ChIP-Atlas

代表的なモデル生物6種(ヒト、マウス、ラット、ミミズバエ、線虫、出芽酵母)から得られた公開されているクロマチン免疫沈降シークエンス(ChIP-seq)とDNase-seqデータ(n>70,000)を完全に統合し、ChIP-Atlas(http://chip-atlas.org)と名付けられたデー…

StoatyDive

タンパク質の生物学的機能は、その相互作用パートナーと相互作用のモードによって決まる。これらの相互作用を研究することで、オルタナティブスプライシングや転写後調節などの細胞メカニズムに関する視野が広がる。クロスリンク、またはクロマチン免疫沈降…

 シーケンスロゴを作成するpython API Logomaker

シーケンスロゴは、DNA、RNA、タンパク質の配列の生物学的特性を視覚的に説得力のある方法で説明するが、Pythonプログラミング環境内でそのようなロゴを生成してカスタマイズすることは現在のところ困難である。ここでは、公開品質のシーケンスロゴを作成す…

シーケンシングリードの前処理を行う AUSPP

ショートリードをリファレンスゲノム/配列にマッピングできるショートリードアライナーは多数あり、それらのほとんどはFASTQファイルを入力クエリファイルとして直接受け入れることができる。ただし、通常、生データは前処理する必要がある。さまざまな次世…

pyGenomeTracks

2020 8/4 論文引用追加 出版可能な品質の複数のゲノムトラックを表示するプロットの生成は深刻な課題となる。望ましい正確な数値を作成するには、かなりの労力が必要である。これは通常、手作業で、またはベクターグラフィックソフトウェアを使用して行われ…

(モデル生物 )MNase-seqやchip-seeのアラインメントを2D plotで視覚化する plot2DO

ヌクレオソーム、これは147 bpのDNAがA約1.7ターンでヒストンオクタマーに包まれる真核生物のDNAパッケージングの基本単位である(Luger、et al、1997)。標的部位へのDNA結合因子のアクセスは、これらの部位がヌクレオソームフリー領域(NFR)にある場合、…

カバレッジトラックを視覚化する SparK

2020 3/1 コマンド修正 Integrative Genomics Viewer(IGV)やUCSCゲノムブラウザなど、NGSデータの表示に利用できる洗練されたリソースが存在するが、領域のエクスポートとpublication用の図の組み立ては依然として困難である。特に、トラックの外観のカス…

bamファイルを使ってDNA/RNAシーケンスのピーク定量やTPM計算、bigwigのcoverage trackを作成する BAMscale

2020 1/14 conda追記 2020 9/23 タイトル修正 BAMscaleは、chromatin binding(ChIP-seq)およびクロマチン状態変化(ATAC-seq、END-seq)やchromatin state changes(ATAC-seq, END-seq)、RNA seqのシーケンシングデータセットを処理するワンステップツー…

genome trackを可視化する svist4get

次世代シークエンシングは、生命科学の複数のハイスループットな方法を生み出した。その多くは、既存のゲノムアセンブリへのショートリードのマッピングに基づいている。マッピングされたリードの密度および計算により得られたゲノムシグナルトラックの可視…

エンリッチされたDNAモチーフ配列を検出する DiNAMO

一連のDNA配列が与えられた場合、モチーフ発見は、偶然によって予想されるよりも配列中で有意に頻繁なover-represented(以後、過剰表現)されたモチーフを見つけることにある。これは、バイオインフォマティクスと同程度の歴史を持ち、多数のアプリケーショ…

deeptools

deeptools2のペーパーより ハイスループットシーケンスデータのデータの分析は、引き続き研究者にとって大きな課題となっている。ハイスループットシーケンシングを用いた実験の多様性が急速に高まっているため、分析パッケージの数が増加し、洞察に富んだ視…