macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2020

IQ-TREE 2

2020年の論文 IQ-TREE(http://www.iqtree.org)は、最尤法を用いた系統推論を行うための、ユーザーフレンドリーで広く利用されているソフトウェアパッケージである。2014年にバージョン1をリリースして以来、本著者らはIQ-TREEを継続的に拡張し、ゲノムデー…

原核生物のゲノム進化のシミュレータ CoreSimul

原核生物は無性の生物であるが、これらの生物は有性生物の減数分裂による組換えとは異なり相同組換えを頻繁に行う。ゲノム進化をシミュレートするために開発されたほとんどのツールは、有性生殖を想定しているか、あるいは集団にDNAフラックスが全くないこと…

ウェブブラウザ上で高品質な高分子構造の可視化を行う Protein Imager

分子ビューアーの長い学習曲線は、研究者が初めて構造生物学の分野にアプローチする際の妨げとなっている。ここでは、次世代のオンライン分子ビューアーとして、軽量で強力かつ使いやすいインターフェースである'The Protein Imager'を紹介する。さらに、こ…

大規模アラインメントの系統推定を高速化した VeryFastTree

コマンドの誤り修正(very抜け) FastTree-2は、大規模系統樹を推定するための最も成功したツールの1つである。FastTree-2の設計の核心はスピードであるが、FastTree-2の実装には、その性能とスケーラビリティを害する重要な問題がまだある。これらの限界に…

パンゲノムに基づくゲノムアイランド予測およびその多様性探索のための手法 panRGP

原核生物ゲノムの可変性の主な原因は、遺伝子の水平移動(HGT)である。ゲノム可塑性領域(RGP)は、非常に可変性の高いゲノム領域に位置する遺伝子のクラスターである。その多くは、HGTによって生じたもので、ゲノムアイランド(GI)に相当する。これらの領…

機能的な重複遺伝子を予測する OLGenie

タンパク質をコードする遺伝子では、部位ごとの非同義置換と同義置換の比(dN/dS)を用いて検出することが可能である。しかし、2つの遺伝子が異なるフレームで同じ塩基部位に重なる場合、一方の遺伝子の同義性変化が他方では非同義性変化となり、dN/dSが乱さ…

ProtHint

著者らは、真核生物ゲノムにおける遺伝子予測のための高速かつ高精度なアルゴリズムの作成に向けて、いくつかのステップを踏んできた。まず、ab initio gene findingを効率的に行うための自動化手法、GeneMark-ESを導入し、教師無しでパラメータを繰り返し学…

Nanopolishのcall-methylationおよびeventalignモジュールを最適化して再実装した f5c

ナノポアシーケンスにより、ポイントオブケア診断や現場でのジェノタイピングなど、携帯可能なリアルタイムシーケンスアプリケーションが可能になる。このような成果を得るためには、生のナノポアシグナルデータを解析するための効率的なバイオインフォマテ…

メタゲノムの株レベルプロファイリングを行う PStrain

2022/09/07, 9/8 追記 微生物群は、人間の病気や生理活動に不可欠な役割を担っている。ゲノム配列の株レベルの違いにより、微生物の機能が異なることがある。ショットガン・メタゲノムシーケンスを用いると、微生物群集の菌株を実用的にプロファイリングする…

フラボノイド生合成候補を探索する KIPEs

フラボノイドの生合成は、植物における特殊な代謝と転写制御のモデル系としてよく知られている。フラボノイドは、紫外線防御や花粉媒介者の誘引など多くの生物学的機能を持つだけでなく、バイオテクノロジーの可能性も秘めている。ここでは、フラボノイド生…

分類学的情報の注釈付き系統樹を生成する TaxOnTree

系統解析は、遺伝子/タンパク質/種の進化を解析し、説明するために広く用いられている手法であり、DNA/ゲノムの配列が決定されている種の増加に伴い、その恩恵を受けている。数百の生物種の塩基配列から系統樹を作成することは、日常的な作業と考えること…

ディープラーニングを用いたタンパク質の翻訳後修飾部位予測と可視化のためのウェブサーバ MusiteDeep

MusiteDeepは、タンパク質の翻訳後修飾(PTM)部位の予測および可視化のためのディープラーニングフレームワークを提供するオンラインリソースである。この予測ツールは、タンパク質の配列のみを入力とし、複雑な特徴を必要としないため、多数のタンパク質に…

タンパク質やヌクレオチド配列からレジストームを予測する RGI

2022/06/04 追記 2023/10/17 追記 2019年春、CARDのRGIソフトウェアバージョン5がリリースされた。これは、CARDの統合情報を使用して、CARDのウェブサイトまたはコマンドラインツールとして、ゲノムおよびメタゲノムデータのレジストムを予測するものである…

腫瘍全ゲノムの体細胞変異エンリッチメント解析のための柔軟なツールセット MutEnricher

腫瘍の全エキソームから体細胞変異を解析することで、新規のガンドライバー遺伝子の発見が加速されている。しかし、ゲノムの約98%はノンコーディングであり、その中には変異によって正常な細胞機能が損なわれる可能性のある調節エレメントも含まれている。一…

オミックスデータを探索するためのウェブベースアプリケーション ShinyOmics

オミックスプロファイリングは、生物の行動や環境中の反応を捉えるなど、大規模な生物学的データセットを得るための、ますます顕著なアプローチのcollectionである。このような大規模なデータセットを、プログラミングの経験なしに手作業で解析し、解釈する…

メタゲノムとRNA seqにも対応したONTのロングリードのシミュレータ Trans-NanoSim

第3世代の1分子RNAシーケンサーは、第2世代のシーケンサーと比較して、ロングリードを生成することによりアイソフォームレベルの転写物の特性解析が容易になるという、これまでにない利点を備えている。特に、Oxford Nanopore Technologyのシーケンシングプ…

メタゲノムアセンブリやVirSorterで同定されたウイルスコンティグのフルアノテーションを行う DRAM

生物学的エンジンが触媒する特定の反応を解読することは、スケーラブルで代謝的に分解されたアノテーションソフトウェアがないために困難である。ここでは、微生物ベースの膨大なゲノム情報を微生物形質のカタログに変換するためのフレームワークである DRAM…

ヒトおよびモデル生物のタンパク質相互作用データベース Integrated interactions database

バイオアッセイの改良により、新しいタンパク質間相互作用(PPI)の同定率が大幅に向上し、検出されたヒトPPIの数は、初期のヒト・インタラクトームの推定サイズを大幅に上回っている。これらの新しいPPIは、疾患メカニズムのより完全な見解を提供しているが…

RNA-Seqデータの包括的かつ効率的な解析のためのウェブアプリケーション OneStopRNAseq

過去10年間で、大量のRNAシーケンス(RNA-seq)データが公開リポジトリに寄託され、さらに前例のない速度で生産されている。しかし、汎用性が高く、RNA-seqデータセットの包括的な解析を合理的に行うことができる、ポイント&クリックのインターフェースを持…

S. cerevisiaeの変異を同定するための自動化されたパイプライン MutantHuntWGS

MutantHuntWGSは、Saccharomyces cerevisiaeの全ゲノムシーケンスデータを解析するためのユーザーフレンドリーなパイプラインである。オープンソースのプログラムを使用している。(1) ペアエンドおよびシングルエンドリードのシークエンスアラインメント、(2…

ゲノムアセンブリと遺伝地図を統合するツール Chromonomer

新しいリファレンスゲノムの配列決定とコンピュータによるアセンブリのペースは加速している。しかし、DNAシーケンシング技術やアセンブルソフトウェアツールは進化し続けているが、反復配列などのゲノムの生物学的特徴や、シーケンシングライブラリの調製に…

転写産物の正確な翻訳と評価を行う TranSuite

タンパク質の翻訳プログラムでは、転写産物の中で最も長いオープンリーディングフレーム(ORF)が選択されることが多いため、データベースには不正確なORFや誤ってアノテーションされたORFが多数存在する。早期終止コドン(PTC)を含む非生産的な転写産物の…

リボソームプロファイリング解析のための統合プラットフォーム RiboToolkit

リボソームプロファイリング(Ribo-seq)は,コドン占有率のプロファイリング,活発に翻訳されているオープンリーディングフレーム(ORF)の同定から,様々な生理学的・実験的条件下での翻訳効率の定量化まで,RNAの翻訳をグローバルにモニタリングする強力…

miRNA-seqデータの比較的品質管理のためのウェブサーバ miRNA-seq

miRNA-seq は様々な分野で幅広く使用されているが、その品質管理は PhredScore ベースのフィルターに限定されることが多くなっている。microRNAの収量、推定分解産物(rRNA断片など)の割合、アダプターダイマーの割合など、品質に関連する他の重要な側面は…

(ヒトとマウス) RNA-seqデータの探索と可視化のためのブラウザベースのツール BEAVR

分子生物学研究や臨床現場におけるRNA-sequencing(RNA-seq)の利用は、過去10年間で大幅に増加している。しかし、広く普及しているにもかかわらず、RNA-seqデータを解析・探索するためのシンプルでインタラクティブなツールが不足している。既存のツールの…

ゲノムアセンブリの品質、完全性、フェーズ評価を行う Merqury

最近のロングリードアセンブリは、利用可能なリファレンスゲノムの品質と完全性を上回ることが多く、その検証は困難を極めている。ここでは、効率的なk-merセット操作に基づいてリファレンスフリーにアセンブリを評価する新しいツール、Merquryを紹介する。M…

大規模な微生物の比較ゲノミクスのためのモジュラー式のツール PanACoTA

2021 9/8 修正 2021 9/9 誤字修正 2021 9/10 prokkaのバージョンによるエラー修正 (依存するライブラリの関係でpython3.7の環境に導入するように修正した), --prodigalのオプション消去 2021 10/15 docker imageのコマンド追記 2021 10/18 annotate追記 2021…

パンゲノム解析によってアノテーション情報の改善を試みる panaroo

Preprintより 原核生物のゲノム進化は、親から子への遺伝物質の垂直伝達と生物間の水平遺伝子伝達の両方によって引き起こされる(ref.1)。細菌の大規模なシーケンシング研究から、種内ゲノム含有量に大規模な違いが生じることが確認されている(ref.2)。こ…

メタゲノムアセンブリの品質評価を行う DeepMAsED

アセンブリーの品質を評価する手法の多くは、リファレンスゲノム(アセンブリを比較するためにキュレートされたゲノムのセット)を必要とする。そのような手法として、コンティグを1つ以上のリファレンスゲノムにマッピングして、逆位、リアレンジメント、種…

高忠実度のHi-Cデータをシミュレートする FreeHi-C

ハイスループットのクロマチンコンフォメーション(Hi-C)データをシミュレーションできることは、Hi-Cデータ解析手法のベンチマークに不可欠である。この論文では、FreeHi-Cと名付けられたノンパラメトリックな手法を用いて、相互作用するゲノム断片から得…