macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2019-11-01から1ヶ月間の記事一覧

CheckMのplotコマンド

2021 4/2 追記 2021 8/30 checkm tetra 追記 checkmのゲノムアセンブリ評価コマンドについて以前紹介した。 ここでは、タイトルの通りCheckMのplotコマンドについて簡単に紹介する。このコマンドはbinningして得た一連のbinned.fastaのディレクトリに対して…

PHYLUCE

保存された領域、または超保存 (ultraconserved) された領域(以下、保存された遺伝子座 (conserved loci) )のエンリッチメントは、非モデル生物(Faircloth et al、2012、2013、2015)の複数の時間スケールでの普遍的なphylogenomic analysesを可能にする…

ロングリードのマッピングから逆位を検出する npInv

DNAのセグメントの向きが、染色体の残りの部分と比較してその先祖から反転している逆位多型(Inversion polymorphisms)は、ショウジョウバエの異なる系統のハイブリッドにおける染色体間の組換えの抑制因子として、スターテバントによって1917年に最初に発…

SolidBin

微生物群集は多数の微生物のmixtureからなる。メタゲノミクス研究では、遺伝物質は微生物群集から直接抽出され、ハイスループットシークエンシング技術を使用してシークエンスされ、異なるリード長の大量のシークエンスリードが得られる。 通常、メタゲノム…

(ヒトゲノム向け)ニューラルネットワークを使用したロングリードのSVコーラー NanoVar

構造変異は、多くのヒト疾患の発症に関与しており、ヒト集団の遺伝的変異の大部分を占めている(ref.3,4)。 50 b5を超えるゲノム変化として定義される構造変異(SV)は、遺伝子調節異常または新規遺伝子融合を引き起こす可能性のある遺伝子病変を形成するこ…

メタゲノムアセンブラの注意点

2019 11/25 誤字修正 メタゲノムのde novoアセンブラについて少し誤解している人がいたので、注意喚起を兼ねて簡単にまとめておく。 メタゲノムのデータセットは特定の環境の生物の混ぜ物のシーケンシングリードに由来しているため、よく似ているがわずかに…

GFF3のツールキット GFF3toolkit

i5k Workspace @ NAL (HP) でサポートされているGFF3toolkit(https://github.com/NAL-i5K/GFF3toolkit)は、節足動物ゲノムプロジェクトとその研究コミュニティからのGFF3形式の遺伝子アノテーションを処理するためのツールスイートを提供する。 遺伝子アノ…

GenBankから配列やアノテーションを取り出すWebサービス FeatureExtract

イントロン/エクソン構造、プロモーター領域の内容、上流域および下流域における他の遺伝子の位置など、DNA配列の特徴のアノテーションに簡単にアクセスできることは、多くの生物学的問題に取り組むことが非常に有益である。たとえば、遺伝子内のイントロン…

UCSC、NCBI、Ensemblからゲノムをダウンロードする genomepy

2021 10/9 コマンドの修正(バージョンアップ) タイトルの通りのツール。簡単に紹介します。 インストール 依存 tabix genePredToBed genePredToGtf bedToGenePred gtfToGenePred gff3ToGenePred conda install -c bioconda -y ucsc-genepredtobedconda ins…

ノンスペシャリストのための堅牢なphylogenetic analysis webサービス Phylogeny.fr

系統解析は、生物学の多くの研究分野の中心であり、通常、相同な配列の同定、それらのマルチプルアライメント、系統樹再構築、および推定されたツリーのグラフィカルな表現を伴う。 Phylogeny.frプラットフォームは、これらのタスクを自動的に実行するプログ…

ラージデータにも対応したマルチプルシーケンスアラインメントツール Kalign 3

マルチプルシーケンスアラインメント(MSA)は、生物学的シーケンス解析の重要なタスクのままである。 MSAプログラムは、Consistency-based のメソッドとprogressive なメソッドに分けることができる。後者は、ペアワイズシーケンス距離を推定し、ガイドツリ…

gene featureを視覚化するwebサービス GSDS 2.0

遺伝子のエクソンやイントロンの組成や位置などの遺伝子の特徴を視覚化することにより、生物学者がアノテーションを統合し視覚的なプレゼンテーションを提供できるようになり、publication用の高品質な図の作成も支援される。したがって、FancyGene(Rambald…

biological sequences専用のイラストレーター IBS

簡潔で、繊細で正確な画像は、説明だけよりも大きな利点がある。さまざまな機能要素を備えた生物学的シーケンスのグラフィカルな表現は、分子生物学的機能の調査の過程で得られた科学的発見の効率的な導入と解釈のための基本である。現在、生物学者は主にMic…

microbialの遺伝子コンテキストを視覚化するwebサービス MGcV

保存された遺伝子コンテキストは、多くのタイプの比較ゲノム解析で使用される。遺伝子機能のリードを提供し、調節配列の発見を導くだけでなく、代謝ネットワークの再構築を支援するために使用さされる。 Microbial Genomic context Viewer(MGcV)は、バクテ…

GATKのgenotyping結果を反映したゲノム配列を出力する VCF2Genome

このメソッドはEAGERの機能の1つで、VCFファイルのバリアントを組み込んだFastAファイルを生成するために使用できる。 バクテリアのデータに特に有用である。この機能により、ユーザーは、ジェノタイピングの最低品質、カバレッジ、およびSNP対立遺伝子頻度…

publication品質の近傍遺伝子描画webサービス Gene Graphics

遺伝子近傍の検査は比較ゲノミクスの不可欠な部分だが、遺伝子クラスターのpublication品質のグラフィックスを作成するツールはない。 Gene Graphicsは、このようなビジュアルを作成するための簡単なWebアプリケーションである。サポートされている入力には…

マルチプルシーケンスアラインメント結果を閲覧したりフィルタリングする MView

MViewは、シーケンスデータベース検索またはマルチアライメントの結果を抽出および再フォーマットし、オプションでWebページレイアウト用のHTMLマークアップを追加するコマンドラインユーティリティである。 一般的な形式に変換するためのフィルターとしても…

MAF(Multiple Alignment Format)を様々な条件でフィルタリングする MafFilter

進化的比較ゲノム解析および集団ゲノム解析は、2つ以上のゲノム間の相同なヌクレオチド位置を記録するゲノム配列のアラインメントに基づいている。遺伝子アラインメントは3種類の文字のedit(ミスマッチ、挿入および欠失)のみを用いて記載されているが、ゲ…

全ゲノムシーケンスしたバクテリア/アーキアのゲノム配列のblastサービス BLAST-XYPlot Viewer

現在、数千の完全にシーケンシングされた細菌および古細菌のゲノムが公開リポジトリで利用可能であり、この数は急速に増加している。この情報は、徹底的な比較ゲノム研究の達成を可能にする。配列類似性を検索するために最も広く使用されているツールの1つは…

haplotype-awareなVCFのアノテーションを行う BCFtools/csq

シーケンシングされたエクソームおよび全ゲノムサンプルの数が急速に増加しており、最も関心のあるバリアントの膨大な量のデータを迅速に選別できることが重要になっている。このプロセスの重要なステップは、シーケンスバリアントを取得し、機能効果のアノ…

VCFのアノテーションを行う Snpdat(非モデル生物にも対応)

一塩基多型(SNP)は、脊椎動物と無脊椎動物で見られる最も一般的なgenetic variantである[ref.1]。 SNPは、関連研究[ref.2]、遺伝子マッピング[ref.3]、および集団遺伝学[4]で好まれている分子マーカーとして定期的に利用されている。技術の改善とコストの…

(ヒトとマウス向け)VCFのアノテーションを行う Jannovar

全ゲノムシーケンス(WES)は、ヒトゲノムのタンパク質コーディングエクソンのターゲットシーケンスであり、新しいメンデル遺伝病遺伝子を特定するための強力で費用対効果の高い方法であり、診断環境でもますます使用されている[Bamshad et al 、2011; Robin…

ゲノム上でクラスターを形成する遺伝子群を探すwebサービス Cluster Locator

遺伝子は真核生物のゲノムに沿ってランダムには配置されていないことが十分に確立されている(Feuerborn and Cook、2015; Hurst et al、2004)。これまでに研究されたすべての真核生物で、遺伝子の位置と遺伝子発現、遺伝子機能または量的形質の間の多様な相…

pATLASflow

pATLASflowはplasmid ATLASのマッピング、 mash screen、およびアセンブリメソッドを実行するパイプライン。 plasmid ATLAS インストール GIthub #ここでは仮想環境に入れる。conda create -n pATLASflow nextflowconda activate pATLASflowconda instlall -…

Ensemblの Variant Effect Predictor (VEP)

2019 11/10 タイトル修正 2020 10/14 dockerリンク追加 ゲノムまたはエクソームシーケンシングから生じるバリアントデータの分析は、クリニックでの基礎研究からトランスレーショナルゲノミクスまで、生物学の進歩の基本である。機能を調査し、標準化された…

プラスミドの分析と視覚化のwebサービス Plasmid ATLAS

2019 11/8 pATLASflow紹介リンク追加 プラスミドは、mobile genetic elements(MGE)として分類されるchromosome外遺伝因子であり、細菌間で自己複製および転移する能力があるため、遺伝子の水平伝播において極めて重要な役割を果たしている(ref.1〜3)。プ…

植物の生合成遺伝子クラスターを予測するwebサービス plantiSMASH

バクテリア、菌類、植物は、それぞれが関与する多様な生物間相互作用において、地球全体で独自の特定の生態学的役割を持つ特殊な代謝産物の非常に多様性を生み出している。この多様な特殊な代謝は、医薬品、農業、製造業で広く使用されている天然物の豊富な…

ノンスペシャリストのための系統解析webサービス NGPhylogeny.fr

系統樹の推論と解釈は、広範囲の生物学的領域(比較ゲノミクス、機能予測、メタゲノミクス、種同定、分類学、分子疫学、集団遺伝学など)を対象とする多数の研究で必要となる。Phylogeny.fr(ref.1)はもともと、次の手順に基づいてワークフローを実装するこ…

ゲノム間のオロソログを予測してシンテシーブロックとして視覚化する Synima

オーソロガス遺伝子は、タンパク質または機能的RNA分子をコードする核酸のセクションであり、単一の祖先遺伝子から派生し、その後に種分化により分岐している[ref.1、2]。対照的に、パラロガスな遺伝子は、単一の種内の重複から生じたものである。 OrthoDB […

GenBankやEMBL/ENA flat fileをNCBI submission用に変換する GB2sequin

2022/09/06 タイトル変更 一般的なウェットラボのユーザーは、ベクターNTI Advance(Life Technologies、Invitrogen、Carlsbad、CA、USA)またはLasergene SeqBuilder(DNASTAR、Madison、WI、USA)などの市販のシーケンス可視化およびアノテーションソフト…