macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2018-07-01から1ヶ月間の記事一覧

バイオインフォマティクスデータの検索と分析サイト Datasets2Tools

ウェブの導入により、研究成果の伝統的な印刷出版物のソフトウェアベースの拡張が可能になった。a)研究論文をより簡単にコピー及び配布できるよりソフトウエアベースでpublishできる。 b)研究によって収集されたデータは、再利用および統合的で遡った(ret…

高速なgermlineとsomaticのSV検出ツール Manta

ゲノムシーケンシングおよびゲノムエンリッチメントシーケンシングは、臨床での遺伝性および体細胞突然変異発見のためにますます使用されてきているが、このシナリオにおける構造変異(SV)およびindelsの迅速な発見のためのツールは限られている。著者らは…

circulating cell free DNAから超高感度な変異検出を行う SiNVICT

精密腫瘍学(precision oncology)の最も有望な分野の1つは、患者に合わせたカスタムターゲット療法の開発である。このような療法の開発および効率的な適用を成功させるには、患者の腫瘍DNAの治療誘発性変化の効率的かつ安価な同定手段とモニタリング方法を…

バリアントをランク付けする Variant Ranker

変異を特定することは、病気の病因を理解する上で重要である。ハイスループットな次世代ゲノム技術の進歩により、ゲノムシーケンシング、エクソンシークエンシング、RNA-SeqおよびChIP-Seqは、複雑なメンデル症の感受性遺伝子座を同定するための標準となって…

SVの正確なGenotypingを行う SV2

構造変化(SV)は、50bpよりも大きい染色体の構造の変化として定義される。 SVはヒトの遺伝子変異の主要な寄与因子であり、様々なヒト疾患にも関与している(Conrad、et al、2010; Sudmant、et al、2015)。特に、de novo構造変異(子孫固有で親にはない)は…

解析内容などから適したインフォマティクスツールを探せる Bio-TDS

バイオインフォマティクスと計算生物学は、バイオサイエンスとバイオメディカル研究において重要な役割を果たす。研究者が実験プロジェクトを設計する際には、データから新しい知識発見に至る最も関連性の高いバイオインフォマティクスツールキットを見つけ…

シーケンスクオリティを絵文字で表す fastqe

そのままのツールです。ツイッターで教えてもらいました。 インストール mac os 10.13のpython3.4でテストした(pyton2環境でも多分動きます)。 依存 pyemojify BioPython NumPy pipで必要なライブラリを入れておく。 pip install pyemojify numpy Biopytho…

ミドルサイズのindelを検出する IMSindel

挿入および欠失(indel)は、フレームシフトの導入による遺伝子機能の根本的な変更を介してたくさんのヒト疾患に関与している。しかし、次世代シークエンシングデータからのこれらのindelを正確に検出する事は現在でもチャレンジングである。これは、DNAシー…

CSVやTSVのファイルを整形表示するtableviewコマンド

tableviewはOKAMURA YasunobuさんがGithubに公開されている、自動でcsv区切りを認識し、人間が見やすいよう整形表示してくれるコマンド。 インストール GIthub リリースから各プラットフォームに対応したバイナリをダウンロードする。ここではmac版をダウン…

既知の二次代謝産物生合成遺伝子クラスターを検出する antiSMASH

2019 6/17 インストール追記 2020 5/15 help追加 2020 7/9 ローカルでの実行例記載 2021 5/13 v6について追記 二次代謝産物または特殊代謝産物とも呼ばれる天然の産物(Natural products)は、多くの薬の基礎であり、農業および栄養学の応用にとって重要な分…

メタゲノムアセンブリを分類する MetaProb

Metagenomicsは、環境から直接得られたゲノム配列の研究である。微生物群集の分類学的多様性を特徴づけることは、メタゲノム研究の第一の目的の一つであり、過去10年間でますます普及している分野となっている(Mande et al、2012)。例えば、ヒトにおける微…

小メモリで高速にtaxonomy assignmentを行う metacache

メタゲノム研究の例として、ヒト腸のシーケンシング解析(Korpela et al、2016)、ヒトの皮膚(Bzhalava et al、2014)、水生生態系(Bork et al、2015)、食物(Ripp et al、2014 )、土壌(Fierer et al、2012)および空中の微生物(Barberánet al、2015)…

サンガーシーケンシングデータの自動分類とアセンブリを行う AutoSeqMan

DNAシーケンシング技術は、自動サンガーシーケンシング(Sanger et al、1977)から次世代シーケンシング(NGS; Shendure&Ji(2008)およびアセンブリまで革新的な進化を遂げている。NGSは高い処理能力(Schuster、2008)のために支配されているが、高コスト…

DNA解析ソフト3 FasParser2

2019 1/17 タイトル修正 FasParser1 abstract シーケンスデータを操作するために、「FasParser」と呼ばれるコンピュータソフトウェアパッケージを開発した。これはパーソナルコンピュータで様々な分析を行うことができるソフトウエアで、その機能には、カウ…

web上でマルチプルアライメントを実行し分子系統樹を出力する MAFFT online service

2019 10/30 引用追加 Multiple sequence alignment (MSA)は、biological sequencesの比較分析において重要なステップである。著者らは、MAFFT [論文より ref.1、2]を使用してウェブ上のMSAを計算するためのオンラインサービスを提供する。 MAFFTには、何千…

メタゲノムのシミュレーター InSilicoSeq

2019 5/13 コメントおよびパラメータ追記 2020 1/4 conda インストール追記 ますます多くのバイオインフォマティクスツールがリリースされており、特定の実験に最適なツールや最適なツールを知ることは困難になっている。ゲノミクスとメタゲノミクスのデータ…

メタゲノムから抗生物質耐性情報を検出する NastyBugs

病原性細菌の薬剤耐性(Antimicrobial resistance: AMR)は、世界中の公衆衛生上の脅威となっている。最も重要なのは、近年数が増えている多剤耐性(MDR)菌である(論文より ref.1)。これらの病原体の周知の例には、メチシリン耐性黄色ブドウ球菌(MRSA)…

遺伝子クラスターを検出する ClusterScan

一般に ゲノムクラスターは同じゲノム位置に存在し、同じ経路に関与したり(Barona-Gómez et al、2004; Yu et al、2000)、同じ機能を持っていたり(Hourcade et al、1992)、共発現したり(Sémonand Duret、2006)、結合または細胞局在化(Jamieson et al、…

データに適した視覚化フォーマットにナビゲートし、その描画コードを教えてくれる From Data to Viz

2020 3/3 タイトル修正 From Data to Vizは、決定木(wiki)を使ってデータの可視化に適したフォーマットを教えてくれるwebサイト。 From data to Viz | Find the graphic you need 下記の決定木を使い、自分の所有しているデータタイプに適したフォーマット…

SuperTranscripts 其の2

Githubで紹介されている、Supertransctiptsを非モデル生物のRNA seq解析に適用する場合の流れを確認する。以下のようなフローをとる。 de novoアセンブリして得たcontigにマッピングして定量し、定量結果からクラスタリングする。そのクラスタリング情報を使…

Quasi-Mappingによって高速にRNA seqの定量を行う Kallisto

2020 4/30 help更新、condaによるインストール追記 2021 2/3 タイトル修正 典型的なRNA-seqの転写産物レベル処理ワークフローの最初の2つのステップは、トランスクリプトーム配列またはリファレンスゲノムへのアラインメントおよび転写産物存在量の推定であ…

k-merを使い 進化距離や相同性を高速計算する Kmer-db

Preprintより 何千もの異なる生物のシーケンシング解析の過程で大量のデータが生成された(100K Pathogen Genome Project(Weimer el al、2017、NCBI Pathogen Detection(https://www.ncbi.nlm.nih.gov/ pathogens) )、これは迅速な分析方法を要求する。 …

Fermi-lite

Fermi-liteはHeng Liさん(wiki)がGithubで公開されているスタンドアロンのCライブラリ。イルミナのショートリードを100bpから1,000万bpの領域でアセンブリするコマンドラインツールとしても機能する。Fermi-liteはオーバーラップベースのアセンブリを行う…

プライマーを自動設計したり、プライマー全アニーリング部位を確認できる FastPCR

ポリメラーゼ連鎖反応(PCR)は、分子生物学の基本であり、核酸増幅に使用される最も重要な実験技術である。(一部略) 増幅反応を引き起こすための熱サイクリングに依存しない多くの等温増幅技術も開発されている。 そのような技術の1つは、鋳型DNAをオリ…

最適なバーコード配列を選び出す BARCOSEL

ハイスループットシーケンス解析プラットフォームの能力の使用を最大限にするため、いくつかのサンプルを一緒にプールすることが一般的である。たとえば、現時点では、Illumina HiSeqX1回の実行で1つのレーンから数億回シーケンシングでき、新しいNovaSeqは1…

メタゲノムデータの平均ゲノムサイズや総カバレッジを推定する MicrobeCensus

ショットガンメタゲノミクスは、人体や環境の微生物群集の機能的構成を特徴づけるためにますます使用されてきている[論文より ref.1-4]。これらの研究の共通の目標は、遺伝子ファミリー存在量を定量化し、環境、宿主の表現型、または実験条件の間で豊富さが…

ONTのロングリードのマッピングからSVを検出する NanoSV

第二世代DNAシークエンシングは、ヒトの遺伝病の研究と診断に不可欠な技術となっている。ヒトの全エキソームシーケンシングにより、メンデル疾患(ref.1)に関与する遺伝子が同定され、ヒトの全ゲノムシーケンシングにより、遺伝子内だけでなくノンコード領…

ロングリードのマッピングからタンデムリピートを検出する tandem-genotypes

タンデムリピートは、ゲノムDNA中に複数のコピー配列が隣接して存在する領域である。これらの領域は、細胞分裂中の複製エラーのために個体間で非常に可変である。それらは、疾患および健康における表現型変動のソースでもある。タンデムリピートのコピー数改…

高速なロングリードのマッピング、エラー修正、アセンブリツール MECAT

2020 2/7 タイトル修正 MECATは、1分子シークエンシング(SMRT)リードの超高速マッピング、エラー訂正、およびデノボアセンブリを行うツール。State of the artのアライナとエラー訂正ツールよりもはるかに効率的な、新しいアライメントとエラー訂正アルゴ…

融合遺伝子とキメラ転写産物を検出する ChimPipe

2020 5/11 リンク追加 2021 12/5 誤字修正 キメラtranscriptsは、ゲノム中の異なる2つ以上の遺伝子に由来する配列を有する転写産物であり[論文より ref.1]、ゲノムまたは転写レベルでいくつかの異なる生物学的メカニズムによって説明することができる。ガン…