macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2019-03-01から1ヶ月間の記事一覧

ロングリードのself error correctionやcontigのポリッシングを行う CONSENT

2019 4/16 マッピングの画像追加、7/22 インストール、help追記、エラー修正、9/8 コメント追加、11/11 Segmentation faultのリンク追記 2020 2/11 追記、2/17 追記、3/23 論文更新のツイート追記 2021 1/13 論文引用 第3世代のシークエンシング技術Pacific …

ロングリードからtamdem repeatを見つける TideHunter

TideHunterは、タンデムリピートを持つロングリードシーケンス(INC-seq、R2C2、NanoAmpli-Seq)用に設計された効率的で高感度のタンデムリピート検出およびコンセンサスコーリングツールである。Pacific Biosciences(PacBio)およびOxford Nanopore Techno…

pacbioロングリードセルフエラーコレクションを改善する FLAS

2019 7/26 タイトル修正 第3世代シーケンシーング技術は、そのはるかにリード長において第2世代よりも有利である(Eid et al、2009)。第3世代のシーケンシング技術の代表として、PacBioの一分子リアルタイム(SMRT)技術は現在、平均5〜15K bpのロングリ…

 高速なオルソログ推論ツール JustOrthologs

オルソログの同定は、多くの研究にとって長い間困難でありながら重要な、最初のステップであった。オルソログは、2つの種の最後の一般的な祖先に存在する同じ祖先遺伝子に由来する遺伝子配列であり、系統樹の再構築または遺伝子機能への洞察を支援することが…

ロングリードを使ってハプロタイプフェージングを行う HapCHAT

ヒトゲノムの二倍体の性質、すなわちハプロタイプと呼ばれるゲノムの2つのコピーを有するため、ゲノムの変異はこれら2コピーのいずれかに現れる。それぞれのゲノム変異が発生する特定のハプロタイプを知ることは、集団ゲノミクス[ref.1-2]、臨床遺伝学およ…

複数のtranscritome情報(gtf)をマージする TACO

2023/01/04 追記 ハイスループットRNAシークエンシング(RNA-Seq)により、トランスクリプトームの詳細な理解が可能になった(ref.1–3)。手動および自動システムによる high fidelityな遺伝子モデルアノテーションの試みは、主にロースループットシークエン…

ロングリード情報からハプロタイプフェージングしてdiploidの正確なバリアントコールを行う Longshot

イルミナのショートリードのような第二世代のDNAシークエンシング技術は、ヒトゲノムのリシークエンシングを日常的なものにした(ref.1)。ヒトゲノムにおける最も豊富な変異タイプであるSNVとsmall indel変異の両方は、30〜40×の全ゲノムイルミナシークエン…

アセンブリグラフのGFAを可視化する Assembly Graph Browser (AGB)

現在、ほとんどのゲノムアセンブリプロジェクトは、アセンブリのより包括的な表現を提供するアセンブリグラフよりもむしろコンティグおよびscaffoldsに焦点を合わせている。 大きなアセンブリグラフのインタラクティブな視覚化は未解決の問題であり続けてい…

2005-2017年の各大学のバイオイオンフォマティクス系論文出版数と内容を視覚化した BIOLITMAP

科学および技術のさまざまな分野の科学的貢献に価値を置くことがますます重要になっている。バイオインフォマティクスの急速な発展とその本質的な学際的性質のために、さまざまな応用分野や機関の貢献がどのように発展しているかを視覚化することは特に難し…

Pacbioのpolishingツール Quiver / ArrowとバリアントコーラーPlurality

Quiverは、Pacbioがテンプレートリードを前提として、最大準尤度テンプレートシーケンスを見つける、より洗練されたアルゴリズムである。 PacBioのリードは、テンプレートシーケンスを指定してリードの準尤度をスコア付けする条件付きランダムフィールドアプ…

ロングリードを使ってハプロタイプフェージングを行う HapCol

ヒトなどの二倍体生物は、それぞれの親から1つずつ、2組の染色体を含んでいる。ハプロタイプと呼ばれる、各染色体の2つの異なるコピーを再構築することは、個体のゲノムを特徴付けるために重要である。このプロセスは、フェージングまたはハプロタイピングと…

pacbioのロングリードの構造変異検出ツール pbsv

pbsvは、PacBio一分子リアルタイムシークエンシング(SMRT)リードから二倍体ゲノムの構造変異をコールして分析するための一連のツールである。 このツールは、PacBioのSMRT Link GUIのStructural Variant Calling分析ワークフローを強化する。 pbsvは挿入、…

植物ゲノムアノテーションwebサービス MEGANTE

ハイスループットシーケンシング技術の出現により、植物ゲノムシーケンシングは加速し、そしてデータは作物改良のために利用されてきている(Bevan and Uauy 2013)。大量の植物ゲノム配列の蓄積は、比較ゲノミクスデータベースの構築(Mihara et al、2010、…

メタゲノムシーケンシングリードからCRISPRスペーサーを検出する MetaCRAST

原核生物のゲノムに見られる clustered regularly interspaced short palindromic repeat (CRISPR) arraysは、我々がより多くの生態系において重要なウイルス - 微生物相互作用をよりよく理解するのを助け得る。ウイルスは溶菌感染を介して細胞内の栄養を生…

メタゲノムbinsからHGTを検出する MetaCHIP

非培養微生物のゲノム再構築(ビニング)は、微生物群集DNA(メタゲノムDNA)の包括的なシーケンシングおよび新規の計算手法により最近になって実現可能になった[ref. 1-3]。再構成されたゲノムビンは、以前には特徴付けられていなかった微生物群の生化学…

高速なロングリードのアセンブリツール wtdbg2 (Redbean)

2019 4/15 Githubリンクの誤り修正、7/3 名前修正、12/11 論文引用追加、タイトル修正 2022/06/07 インストール手順修正 デノボシーケンスアセンブリは、比較的短いシーケンシングリードからサンプルゲノムを再構築する。リファレンスゲノムは関心のある領域…

コンタミやダメージを考慮してAncient DNAのシーケンシングリードをシミュレートする gargammel

Ancient DNA(aDNA)とも呼ばれるsubfossilsから回収されたDNAは、populationの歴史を再構築するためにますます使用されている(Leonardi et al、2016)。しかし、下流の推論に影響を与える可能性があるいくつかの要因があるため、aDNAデータの分析は依然と…

グラフィック出力が利用できない環境で頻度分布を素早く確認できる bashplotlib

bashplotlibは、端末で基本的なプロットを作成するためのpythonパッケージおよびコマンドラインツール。 GUIがない場合にデータを視覚化する簡単な方法を提供する。pythonでコーディングされており、pipを使って素早くインストールできる。 特徴(githubより…

ウィルス分類器 viruses_classifier

次世代シーケンシング(NGS)の台頭により、メタゲノムは微生物生態学におけるゴールドスタンダードとなった。その限界、主にウイルス間の普遍的なマーカー遺伝子の欠如にもかかわらず、ウイルスメタゲノミクスはウイルス発見のための主要なツールとなってい…

ナノポアのロングリードのQCツール ToulligQC

2020 7/19 追記 ToulligQCはPythonで書かれたEcole Normale Superieure の生物学研究所(IBENS)のゲノム施設によって開発されたプログラムである。このプログラムは、オックスフォードナノポアのQC分析を専門としている。 さらに、DNA-SeqとともにRNA-Seqに…

Nanoporeのbasecaller Chiron

Oxford Nanopore Technologies(ONT)によって最近マーケットに導入された、バイオエンジニアリングされたナノポアを介したDNAシーケンシングは、ゲノムのlandscapeを大きく変えた。 ONTナノポアシーケンシングデバイスであるMinIONの重要な技術革新は、DNA…

Nanoporeのオフィシャルコマンドラインbasecaller2 Guppy - CPU版について

2019 3/12 タイトル修正 2019 3/12 コマンド追記、誤ったコメント削除 2020 1/19 GPU版のリンク追記 2020 5/4 3.6ツイート追記 2021 1/8 helpのバージョン更新、リンク切れ修正 GPU版 2020 3/13 構成を微修正、タイトル変更 20200 7/15 guppy v4.0.11 I got …

Nanoporeのオフィシャルコマンドラインbasecaller1 Albacore

2019 3/11 タイトル修正 2019 3/12 コマンド追記、誤ったコメント削除 Albacore software overview(2019 3/10確認) Albacoreは、Oxford Nanoporeベースコールアルゴリズム、およびいくつかの後処理ステップを提供するデータ処理パイプラインである。 Windo…

illuminaのショートリードシミュレータ Sandy(RNA seqにも対応)

Sandyは、与えられたfastaファイルからシングルエンド/ペアエンドのリードを生成するシンプルなバイオインフォマティックツールである。多くの次世代シーケンシング分析は、実際には正確には満足されていない仮説モデルおよび原理に依存している。ポジティブ…

Nanoporeのロングリードのアセンブリを中心としたツールキット Pomoxis

Pomoxisは、ナノポアシーケンスに合わせて調整された基本的なバイオインフォマティクスツールのセット。ドラフトアセンブリの生成分析に関するツールが含まれている。 これらのツールの多くは、Oxford Nanopore Technologiesの研究データ分析グループによっ…

高速かつ精度の高いオロソログ検索を行う SonicParanoid

3/8 誤字修正、ツイッターリンク追記 3/10 誤字修正 最近のDNAシーケンシング技術の進歩により、completeシーケンシングされたゲノムの数は急速に増加している。複数のゲノムにコードされているオルソログ遺伝子を正確に推論することが、これらのデータセッ…

高速かつ高効率にシーケンスデータを圧縮 / 解凍する NAF

2019 3/9 twitterコメント追記 Preprintより DNA配列データベースは、シーケンシング技術の継続的な進歩により、指数関数的に成長している。通常、データ圧縮は保存スペースを節約するためにすべての保存DNAシーケンシングデータに使用される。1993年に最初…

サンプルのコンタミネーションを見積もる Mash Screen

2019 11/5 論文追加 シーケンシング技術がスループットを高めそしてコストを下げ続けるにつれて、シーケンシングされたゲノムのデータベース(例えばNCBI RefSeq [ref.1])は指数関数的成長を続け、それらに対する検索をさらに複雑にしている[ref.2、3]。さ…

ナノポアのrawロングリードからプラスミドを探索する tiptoft

2019 12/13 タイトル修正 急速にコストが下がる中、Pacific Biosciences(PacBio)およびOxford Nanopore Technologies(ONT)のロングリードDNAシークエンシング技術がアウトブレイク調査に使用され始めている(Faria et al、2017; J. Quick et al、2005 20…

Nanoporeのシーケンシングリードをマッピングして分析できるwebサーバー nanopipe

近年、技術が絶えず改良され科学者や開業医を含む広範囲の顧客にとって利用しやすいためにDNAシーケンシングブームが起きている。メタゲノミクスから植物生理学、医学まで、多くの分野の研究者が、彼らの研究にシーケンシング実験を実施してきた。 Oxford Na…