macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

高感度なバリアントコーラー LoFreq

シーケンシング技術の最近の進歩により、細胞集団におけるheterogeneityおよびsub-populationsのより広範な研究、およびそれらの進化による「コンセンサス配列」からの移行が可能になった。このような‘population perspective’ な視点は、ウイルス性疑似種(…

review article要約 ラージゲノムのシーケンシング解析

はじめに この記事はレビュー論文の要約です。チェックリスト、または思考を整頓するガイドとして使ってください。ただし、この要約で論文を読んだことにはなりません。時間が許す限り原著論文を読むことをお勧めします。review articleは各段落が一般論で構…

高速な端末エミュレータ Alacritty

AlacrittyはRustで書かれたGPUをレンダリングに使う高速な端末エミュレータ。OpenGL(wiki)を使ってレンダリングを行う。開発はまだアルファ段階らしいが、すでに色々なプラットフォームに対応している(windowsはこれかららしい)。開発の大きな動機は、WU…

アライメントビューア Alan

Alanはターミナル(端末エミュレータ)で動くアライメントのビューア。GUIに頼らず端末内で確認作業を完結させることができる。 インストール ubuntu18.04でテストした。 --対応フォーマット-- FASTA、Clustal format alignments 本体 GIthub alan-2.1.1/ala…

メタゲノムのシミュレータ CAMISIM

16q rRNAアンプリコンとショットガンメタゲノムシーケンシングは、健康や病気に関するヒトマイクロバイオーム研究に広範に使われている[prepirntより ref.1, 2] 。私たちはその後、天然に存在する微生物群集は、生物多様性の広範な範囲をカバーしていること…

ターゲットキャプチャシーケンシングをシミュレートする capsim

高スループットシークエンシング(HTS)は、費用対効果が高く時間効率の良いサンプルの完全な遺伝情報を得る能力を持ち、ゲノム研究に大きく革命をもたらした。多くの臨床応用において、作用可能な領域のパネルのみが調査対象である(Bellos et al、2014; Sa…

YSTRなどのショートタンデムリピートを探す STRScan

マイクロサテライトまたは単純配列反復(SSR)とも呼ばれる短いタンデムリピート(STR)は、タンデム反復ユニット(1〜6 bps)を約2〜30個含む短いストレッチのDNAである。 STRは、ヒトなどの哺乳動物ゲノムを含む多くの原核生物および真核生物ゲノムに存在…

WIGファイルの圧縮と解凍を行う smallWig

NGSのシークエンシング技術の発達により、DNA / RNAのシーケンスと発現解析のコストが劇的に減少した。 RNA-seqは、様々な種および生物、ならびに異なる器官および細胞集団の全トランスクリプトーム情報を提供する、重要かつ安価な技術になった。RNA-seq実験…

32のバクテリアの1万以上の機能未知遺伝子欠損の影響をまとめた Fitness Browser

注意: タイトルには 機能未知遺伝子だけ相手にしたように書いてますが、実験はゲノム全体の遺伝子をターゲットにランダムかつ網羅的に行われています。よってmutant phenotypeの影響を調べた遺伝子数自体は1万よりずっと多くなります。実験結果をまとめたFi…

sam/bamがmalformedではないか調べるPicardのValidateSamFile

sam/bamをいじっていると、ヘッダーが無かったり重複したり、ダウンロードが不完全だったり、様々な理由でおかしくなってしまうことがある。PicardのValidateSamFileはsam/bamにエラーがないか分析するコマンド。実行するとエラーが見つかったところを教えて…

アンプリコンシーケンシングのdenoiseを行う DUDE-Seq

次世代シーケンシング(NGS)技術と呼ばれる新しい世代の高スループット、低コストのシークエンシング技術が、大規模な比較研究や進化研究などの生物医学研究を再構成している[ref.2-4]。自動サンガーシーケンシングと比較すると、NGSプラットフォームは、大…

複数のSV検出結果を統合し、精度の高いSVコールを行う MetaSV

8/19 pindel、lumpy、cnvkitコマンドミス修正 SVは、ゲノムの多様性およびゲノムの障害に寄与することに関与している(Stankiewicz and Lupski、2010)。したがって、SVの検出には相当量の作業が行われている。一般に、SVを検出するためのツールは、リードの…

コピー数変化の検出と可視化ツール CNVkit

コピー数変化は、ガンを含む多くの疾患の有用な診断指標である。ゲノム全体のコピー数解析のゴールドスタンダードは、 array comparative genomic hybridization(array CGH)である[論文より ref.1,2]。より最近では、全ゲノムシーケンシングデータからコピ…

オリジナルfastqと比較してbamのリード情報が完全に同じかどうか調べる BamHash

(ゲノム)リシーケンシングプロジェクトは、既知ゲノムを有する種の個体のシーケンシング解析であり、大量のraw シーケンシングリードを生成し、その後、これらはリファレンスゲノムにアライメントされる。シーケンシングコストが減少し、現在のシーケンシ…

バイオインフォマティクスデータの検索と分析サイト Datasets2Tools

ウェブの導入により、研究成果の伝統的な印刷出版物のソフトウェアベースの拡張が可能になった。a)研究論文をより簡単にコピー及び配布できるよりソフトウエアベースでpublishできる。 b)研究によって収集されたデータは、再利用および統合的で遡った(ret…

高速なgermlineとsomaticのSV検出ツール Manta

ゲノムシーケンシングおよびゲノムエンリッチメントシーケンシングは、臨床での遺伝性および体細胞突然変異発見のためにますます使用されてきているが、このシナリオにおける構造変異(SV)およびindelsの迅速な発見のためのツールは限られている。著者らは…

circulating cell free DNAから超高感度な変異検出を行う SiNVICT

精密腫瘍学(precision oncology)の最も有望な分野の1つは、患者に合わせたカスタムターゲット療法の開発である。このような療法の開発および効率的な適用を成功させるには、患者の腫瘍DNAの治療誘発性変化の効率的かつ安価な同定手段とモニタリング方法を…

バリアントをランク付けする Variant Ranker

変異を特定することは、病気の病因を理解する上で重要である。ハイスループットな次世代ゲノム技術の進歩により、ゲノムシーケンシング、エクソンシークエンシング、RNA-SeqおよびChIP-Seqは、複雑なメンデル症の感受性遺伝子座を同定するための標準となって…

SVの正確なGenotypingを行う SV2

構造変化(SV)は、50bpよりも大きい染色体の構造の変化として定義される。 SVはヒトの遺伝子変異の主要な寄与因子であり、様々なヒト疾患にも関与している(Conrad、et al、2010; Sudmant、et al、2015)。特に、de novo構造変異(子孫固有で親にはない)は…

解析内容などから適したインフォマティクスツールを探せる Bio-TDS

バイオインフォマティクスと計算生物学は、バイオサイエンスとバイオメディカル研究において重要な役割を果たす。研究者が実験プロジェクトを設計する際には、データから新しい知識発見に至る最も関連性の高いバイオインフォマティクスツールキットを見つけ…

シーケンスクオリティを絵文字で表す fastqe

そのままのツールです。ツイッターで教えてもらいました。 インストール mac os 10.13のpython3.4でテストした(pyton2環境でも多分動きます)。 依存 pyemojify BioPython NumPy pipで必要なライブラリを入れておく。 pip install pyemojify numpy Biopytho…

中間サイズのindelを検出する IMSindel

挿入および欠失(indel)は、フレームシフトの導入による遺伝子機能の根本的な変更を介してたくさんのヒト疾患に関与している。しかし、次世代シークエンシングデータからのこれらのindelを正確に検出する事は現在でもチャレンジングである。これは、DNAシー…

CSVやTSVのファイルを整形表示するtableviewコマンド

tableviewはOKAMURA YasunobuさんがGithubに公開されている、自動でcsv区切りを認識し、人間が見やすいよう整形表示してくれるコマンド。 インストール GIthub リリースから各プラットフォームに対応したバイナリをダウンロードする。ここではmac版をダウン…

既知の二次代謝産物生合成遺伝子クラスターを検出する antiSMASH

二次代謝産物または特殊代謝産物とも呼ばれる天然の産物(Natural products)は、多くの薬の基礎であり、農業および栄養学の応用にとって重要な分子でもある。さらに、分子生物学および細胞生物学の多くの側面を研究する化学プローブとして科学研究に重要な…

メタゲノムを分類する MetaProb

Metagenomicsは、環境から直接得られたゲノム配列の研究である。微生物群集の分類学的多様性を特徴づけることは、メタゲノム研究の第一の目的の一つであり、過去10年間でますます普及している分野となっている(Mande et al、2012)。例えば、ヒトにおける微…

メタゲノムを分類する metacache

メタゲノム研究の例として、ヒト腸のシーケンシング解析(Korpela et al、2016)、ヒトの皮膚(Bzhalava et al、2014)、水生生態系(Bork et al、2015)、食物(Ripp et al、2014 )、土壌(Fierer et al、2012)および空中の微生物(Barberánet al、2015)…

サンガーシーケンシングデータの自動分類とアセンブリを行う AutoSeqMan

DNAシーケンシング技術は、自動サンガーシーケンシング(Sanger et al、1977)から次世代シーケンシング(NGS; Shendure&Ji(2008)およびアセンブリまで革新的な進化を遂げている。NGSは高い処理能力(Schuster、2008)のために支配されているが、高コスト…

DNA編集ソフト3 FasParser2

FasParser1 abstract シーケンスデータを操作するために、「FasParser」と呼ばれるコンピュータソフトウェアパッケージを開発した。これはパーソナルコンピュータで様々な分析を行うことができるソフトウエアで、その機能には、カウント、2配列間の違いを調…

web上でマルチプルアライメントを実行し分子系統樹を出力する MAFFT online service

Multiple sequence alignment (MSA)は、biological sequencesの比較分析において重要なステップである。著者らは、MAFFT [論文より ref.1、2]を使用してウェブ上のMSAを計算するためのオンラインサービスを提供する。 MAFFTには、何千ものシーケンスからな…

メタゲノムのシミュレーター InSilicoSeq

ますます多くのバイオインフォマティクスツールがリリースされており、特定の実験に最適なツールや最適なツールを知ることは困難になっている。ゲノミクスとメタゲノミクスのデータのシミュレーションは、実験の計画と新しい方法の開発の両方において重要な…