macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2024-05-01から1ヶ月間の記事一覧

公開されているシークエンシングデータを取得する統合ツール iSeq

ハイスループットシーケンス技術(Next Generation Sequencing; NGS)は、多様な生物学的探究に取り組む研究者によってますます活用されるようになっている。最新のシーケンシングの驚くべきスケールと効率を活用し、ゲノム解析からタンパク質-核酸相互作用…

植物ゲノムのLTRレトロトランスポゾンのアノテーションを行うパイプライン DANTEとDANTE_LTR

ロングターミナルリピート(LTR)レトロトランスポゾンは、ほとんどの植物種のゲノムにおいて、反復DNAエレメントの主要なクラスである。配列決定された植物ゲノムの数は加速度的に増加しており、植物ゲノムアセンブリ中のLTRレトロトランスポゾンの効率的な…

大規模な細菌の系統推定パイプライン OrthoPhyl

一般に公開されている細菌ゲノム配列の数は驚くほど多く(NCBIのGenBankだけでも200万アセンブル)、その数は増え続けている。このような豊富なデータから、これらの配列を進化の文脈の中で位置づける系統解析が求められている。系統的な配置は分類学的な分…

ミトコンドリアゲノムの遺伝子アノテーションを行うWebプラットフォーム DeGeCI 1.1

DeGeCIは、de Bruijn graphとして表現されるアノテーションされたミトコンドリアミトコンドリアゲノムのリファレンスデータベースを用いて、ミトコンドリア塩基配列から完全自動のde novo遺伝子予測を生成するコマンドラインツールである。入力ゲノムはこの…

計算とハイスループット遺伝学で細菌の異化経路のギャップを埋める GapMind for carbon sources

新規の異化酵素とトランスポーターを発見するために、本著者らは29のバクテリアのハイスループット遺伝子データと、異化経路のギャップを見つける自動化ツールを組み合わせた。GapMind for carbon sourcesは、細菌および古細菌ゲノムにおける62種類の化合物…

リファレンスゲノムに対するリードアラインメントからempiricalなクオリティ値を算出する bamConcordance

bamConcordanceは、PacificBiosciencesが管理しているレポジトリの1つで管理されている、リードのリファレンス配列とのマッピングの一致度からリードの経験的なクオリティ値を算出するpythonスクリプト。エラー修正ツールで修正された後のシークエンシング…

(ヒト)推定立体構造に基づいてミスセンスバリアントの機能的影響を予測する AFFIPred

構造情報はミスセンス変異の病原性予測に大きな可能性を持つが、配列データと構造データの間にはよく知られたギャップがあるため、構造に基づく病原性分類法は配列に基づく分類法に比べて限界がある。本著者らは、高精度なタンパク質構造予測手法であるAlpha…

大規模なデータセットにもスケールする多目的k-merカウンターおよび多様性推定器 MerCat2

MerCat2("Mer-Catenate2")は、オミックスデータ中のフィーチャーをロバストに解析するための、汎用性、並列性、拡張性、モジュール性を備えたソフトウェアパッケージである。MerCat2は、あらゆるプラットフォームからのHTSシークエンシングの生リード、ア…

T2Tアセンブリのテロメア配列を同定する T2T_chromosomes.shスクリプト

本スクリプト T2T_chromosomes.shは、テロメア-2-テロメアのアセンブリ配列末端のテロメアリピートを同定する。定義として、リファレンスの染色体を指定し、それの全長をカバーしているアセンブリ配列であることと、そのようなアセンブリ配列の両端にユーザ…

アミノ酸とDNAのジョイント解析による高感度で特異的なメタゲノミックリードの分類器 Metabuli

2024/05/22 追記、誤字修正、コメント追加 メタゲノムの分類学的な分類器は、DNA配列かアミノ酸(AA)配列のどちらかを解析する。しかし、Metabuli (https://metabuli.steineggerlab.com)は、DNAとAAの両方を共同で解析し、感度の高い相同性検出のためにAAの…

モデルおよび非モデル生物におけるTEエンリッチメント解析のための統合ウェブサーバー TEENA

トランスポーザブル・エレメント(TE)は、様々な真核生物のゲノムに豊富に存在する。TEは、通常、異なる転写因子(TF)が結合するシスエレメント(エンハンサーやプロモーターなど)を作り出すことで、重要な制御的役割を果たす可能性があることを示唆する…

複数のロングリードシークエンシングデータの一括した分析を行う Giraffe

第3世代シークエンシング技術は、高品質でウルトラロングリードを生成できることから人気を博している。さまざまなサンプルや複数のシーケンスプラットフォームから得られたデータセットを比較および包括的な解析に活用することは、生物学的メカニズムの解明…

原核生物のゲノム進化のシミュレータ CoreSimul

原核生物は無性の生物であるが、これらの生物は有性生物の減数分裂による組換えとは異なり相同組換えを頻繁に行う。ゲノム進化をシミュレートするために開発されたほとんどのツールは、有性生殖を想定しているか、あるいは集団にDNAフラックスが全くないこと…

変異に伴うタンパク質-タンパク質複合体の結合親和性変化を予測するためのディープアンサンブル法 DeepPPAPredMut

タンパク質-タンパク質相互作用(PPI)は多くの細胞内プロセスを支えており、変異によるその破壊は疾患の原因となる。AlphaFold2のようなタンパク質構造予測手法の進化と、広範な実験的親和性データの利用可能性に伴い、タンパク質-タンパク質複合体における…

ウェブブラウザ上で高品質な高分子構造の可視化を行う Protein Imager

分子ビューアーの長い学習曲線は、研究者が初めて構造生物学の分野にアプローチする際の妨げとなっている。ここでは、次世代のオンライン分子ビューアーとして、軽量で強力かつ使いやすいインターフェースである'The Protein Imager'を紹介する。さらに、こ…

ナノポアR10リードのリピートおよびハプロタイプを考慮したエラー修正を行う DeChat

エラーの自己修正は、ロングリードシークエンシングデータの解析において極めて重要な最初のステップである。しかし、この目的のための既存のメソッドのほとんどは、主にエラー率が5%を超えるノイズの多いシーケンスデータ用に調整されており、多くの場合、…

マルチサンプルビニングのための高速な近似カバレッジ計算法 fairy

メタゲノムのビニングは、同じゲノムに属するコンティグをクラスタリングすることであり、メタゲノムアセンブリゲノム(MAG)を復元するための重要なステップである。コンティグは、ゲノム全体で一貫したリードカバレッジパターンを利用することで連結される…

多重配列アラインメントのフォーマットを変換する msaconverter

タイトルの通りツール。簡単に紹介します。 インストール 依存 msaconverter is a tool to convert a multiple sequence alignment into different format with Biopython Github #conda( link)mamba install bioconda::msaconverter -y#pippip install msac…

KaKs_Calculator 2.0

2024/05/10 誤字修正 (2010年の論文) KaKs_Calculator 2.0と名付けた統合スタンドアローンソフトウェアパッケージのアップデート版を発表する。このパッケージには、非同義置換率と同義置換率を計算するための17の手法が組み込まれている。その中で、ガン…

HTS(NGS)の基本ツールのインストール手順

2024/05/10 BamTools追加 UbuntuにHTSの基本的なツールをインストールする手順をまとめました。pythonでラップされているようなツールはanacondaに頼るのが早いので除外し、純粋にコンパイル言語で書かれたよく使われているツールを対象としました。 docker…

タンパク質タンパク質、タンパク質ペプチド、タンパク質核酸相互作用の検索と解析、モデリングのためのウェブサーバ PPI3D

構造解析されたタンパク質と他のタンパク質、ペプチド、核酸との相互作用は、分子メカニズムを理解するための鍵となる。PPI3Dウェブサーバーは、前処理されクラスタ化された構造データを照会し、結果を解析し、タンパク質相互作用について相同性ベースの推論…

系統的忠実性が高い高度に保存された20個のシングルコピー遺伝子を使い、細菌ゲノムから自動で系統再構成を行う VBCG

系統学的解析は、細菌の多様性と進化を研究する上で切っても切り離せないものとなっており、多くの異なる細菌のコア遺伝子が照合され、系統樹の再構築に用いられてきた。しかし、これらの遺伝子は、すべての細菌ゲノムにおけるその存在と単一コピー率に基づ…

膣内細菌叢の16S rRNA遺伝子の分類学的分類を配列ごとに迅速かつ正確に行う SpeciateIT

大量の16S rRNA遺伝子配列を分類学的に分類するには、OTUへのクラスタリングやノイズ除去法が主流である。本著者らは、個々のアンプリコン配列を迅速かつ正確に分類する新しい分類学的分類ツールspeciateITを開発した(https://github.com/Ravel-Laboratory/…

DNA配列中のk-merを2次元空間に視覚化する KMAP

DNA配列中のパターンを同定し図示することは、様々な生物学的データ解析において極めて重要な作業である。この作業では、DNA配列の基本的な構成要素であるkmmerの集合によってパターンが表現されることが多い。これらのパターンを視覚的に明らかにするために…

高速かつ様々なプロファイルに対応可能な、次世代シークエンシングデータの次世代のシミュレーター NGSNGS

シークエンシングの世代が変わるにつれてDNAシークエンサーの性能が急速に向上し、生成されるデータ量も増加した。この進化は、新しいバイオインフォマティクスの手法にもつながっており、モデルの精度やゲノム解析パイプラインの頑健性を検証する際に、in s…

アノテーションされたトランスポーザブル・エレメント(TE)のキュレーションを支援する TEtrimmer

レポジトリより トランスポーザブル・エレメント(TE)の発見とアノテーションのために多くのツールが開発されている。しかし、高品質なTEコンセンサスライブラリーの構築には、依然としてTEを手作業でキュレーションする必要があり、それには時間がかかり、…

可変長タンデム反復配列のアノテーション(多型コール)を行う vamos

ヒトゲノムのおよそ3%は可変反復配列(VNTR)で構成されている。これらの遺伝子座は多型性が高いが、アラインメントのブレイクポイントに基づいてバリアントを定義しマージする現在のアプローチでは、その多様性を完全に捉えることはできない。ここではvamo…