macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

Preprint

HTSデータを扱う様々なツールをGUIインターフェースで統合した TBtools

ハイスループットシーケンス(HTS)データからの情報マイニング用にさまざまなソフトウェアまたはパイプラインが開発されているが、それらのほとんどは、ほとんどの生物学者が馴染みのないプログラミングおよびコマンドライン環境に依存している。 ユーザー…

ロングリードアセンブリのコンティグからクロモソームへの改善を自動で行う ILRA

近年のロングリードシークエンシング技術の進歩は、大規模なコンソーシアムが地球上のすべての真核生物の配列を決定することを可能にするだけでなく、多くの研究室が関心のある種のゲノム配列を決定することも可能にしている。しかし、コンティグの数は染色…

minimap2を高速化した mm2-fast

2022/06/14 ツイート追加 ロングリードシーケンシングは、ゲノミクスやトランスクリプトミクスの分野で日常的に使用されている。ロングリードやドラフトゲノムアセンブリを参照配列にマッピングすることは、これらのアプリケーションにおいて最も時間のかか…

原核生物のゲノムアノテーションを比較する ORForise

モデル生物の過去のゲノムアノテーションに基づいて行われてきたオープンリーディングフレーム(ORF)予測ツールの偏りは、新規ゲノムやメタゲノムの理解に影響を与えている。これは、予測が既存の知識に偏ることになるため、新しいゲノム情報の発見を妨げる…

NanoporeシークエンシングデータからディファレンシャルRNAの修飾を同定する xPore

RNAの発現の違いは、細胞の分子的アイデンティティ、ヒトの疾患に関与するパスウェイ、臨床表現型に関連する患者間のRNAレベルのばらつきなどについての洞察を提供する。m6AのようなRNA修飾は、RNAの分子機能に寄与することがわかっている。しかし、RNAの修…

De Novo Variantsを正確に発見するためのマッピング不要のフレームワーク Kevlar

遺伝性変異は複雑な遺伝性疾患における主要な寄与因子であると推測されている。多くの遺伝性疾患の遺伝率は比較的高いと推定されている。例えば、自閉症スペクトラム障害(ASD)の遺伝率は0.6を超え、統合失調症の遺伝率は0.5を超える。この遺伝性のごく一部…

Minimizer-spaceの de Bruijn graphsを構築し、超高速・低メモリアセンブリを行う rust-mdbg

2021 9/17 論文引用 2023/08/03 更新(metaMDBGとしてまちがって更新していた分を移動) DNAシーケンサーのデータは、リードが長くなり、シーケンスエラー率がますます低くなる傾向にある。ここでは、このようなリードをゲノムにアセンブルする問題に注目し…

アンサンブルブートストラップにより、系統樹の信頼性をより正確に推定する MUSCLE v5

系統樹の信頼性は、多くの場合、Felsensteinブートストラップ法を用いてマルチプルシーケンスアラインメント(MSA)から推定される。しかし、この方法では、MSAの系統的な誤差を考慮していないため、推定される系統樹に大きな偏りが生じる可能性がある。ここ…

ロングリードを用いてショートリードアセンブリのギャップをクローズする自動化されたパイプライン DENTIST

ロングシーケンスリードは、断片化されたショートリードベースのゲノムアセンブリのコンティグ性と完全性を高めるために、理想的には高い精度でアセンブリギャップを閉じることができる。これまでにもいくつかのギャップ解消法が開発されてきたが、これらの…

(prototype)gzipで圧縮された大きなファイルを並列解凍する pugz

gzip プログラムで作成したファイルを任意の場所で解凍することは、 DEFLATE 圧縮アルゴリズム(wiki)の性質上、原理的に不可能である。そのため、既存のプログラムでは、並列性を利用してgzipで圧縮された大きなファイルを高速に解凍することができない。…

リファレンスフリーで(メタ)ゲノムアセンブリのミスアセンブリの同定・修正を行う metaMIC

メタゲノムアセンブリの品質を評価することは、信頼性の高いメタゲノムアセンブリゲノムを構築し、下流の解析を行う上で重要である。ここでは、メタゲノムアセンブリのミスアセンブリを特定し、修正するための機械学習ベースのツールであmetaMIC (https://g…

ゲノムスケールの代謝モデルをメタゲノムから直接再構築する metaGEM

2021 7/2, 7/5, 7/6 追記 2021 10/7 論文引用 2021 10/15 ツイート追記 複雑な微生物群集のメタゲノムアセンブルゲノム(MAG)の再構築により、種間・種内の遺伝的多様性が明らかになってきた。しかし、代謝モデリングの取り組みは、ゲノムスケールの代謝モ…

MIRAを使って環状MAGを構築する Jorg

メタゲノミクスは、培養されていない微生物や複雑な微生物群集から得られる遺伝情報の研究を促進する。しかし、ほとんどのサンプルは生物の複雑性や株の多様性が高いため、メタゲノミクスデータから完全な微生物ゲノム(ミスアセンブリのない環状)をアセン…

フィルタリングされた、包括的なヒト腸内prokaryotesゲノムコレクション HumGut

ヒト腸内細菌叢研究の大きな課題は、検証可能な完全なヒト腸内ゲノムコレクションが一般に公開されていないことである。本著者らは、健康なヒト腸の原核生物ゲノムの包括的なコレクションであるHumgutを作成し、世界的なヒト腸内細菌叢研究の参考とすること…

De novo遺伝子予測やメタゲノムの機能アノテーションなどに対応したeggNOG-Mapper v2

遺伝子の自動機能アノテーションは、ほとんどのゲノムおよびメタゲノムワークフローにおいて基本的なステップであるにもかかわらず、大規模なスケールでは依然として困難である。本研究では、事前に計算されたorthology assignmentsに基づいて機能アノテーシ…

構造バリアントコーリングのため改善されたロングリードマッピングを行う Vulcan

2021 6/4タイトル修正 ロングリードシーケンシングは、ヒトゲノム全体の構造変異の調査をかつてないほど可能にした。このような状況下でロングリードシーケンシングの可能性を最大限に生かすために、主に速度と精度のどちらかに焦点を当てた新しいマッピング…

包括的なde novoトランスクリプトームアセンブリのパイプライン TransPi

2021 6/4 更新 RNA-Seqデータの利用とde novoトランスクリプトームアセンブリの生成は、生態学と進化学の研究において重要な役割を果たしてきた。これは、ゲノム情報が利用できない非モデル生物に顕著に当てはまる。しかしながら、遺伝子発現の差異の研究、D…

シングルセルも含めてメタゲノムアセンブリの主要代謝系と炭素・窒素・硫黄関連の機能的アノテーションを行う METABOLIC

2024/03/23 論文引用、出力について説明 マイクロバイオーム科学の進歩は、メタゲノミクスやシングルセルゲノミクスを用いて混合微生物群集から再構築されたゲノムから、微生物の生態を研究・推論できるようになったことが大きな要因となっている。このよう…

ゲノムスケールのデータを集めた公開リポジトリ Genome Warehouse

Genome Warehouse (GWH) は、幅広い種のゲノムアセンブリデータを収蔵する公開リポジトリであり、ゲノムデータの提出、保存、公開、共有のための一連のウェブサービスを提供している。China National Center for Bioinformation (CNCB, https://bigd.big.ac.…

ターゲットの転写制御因子を予測したりピークのアノテーションを行うウェブツール AnnoMiner

遺伝子発現の制御には、転写因子による正確な転写プログラムと、エピジェネティックな事象の組み合わせが必要である。近年、エピゲノムやトランスクリプトームの技術が進歩し、さまざまな遺伝子制御メカニズムが解明されてきた。しかし、転写因子とエピジェ…

ショートリードを忠実にマッピングする mmp

マッピングとは、あるDNAリードの元の位置を参照配列(通常はゲノム)の中から探し出すプロセスである。ショートリードマッパーは、ハイスループットシーケンシングを伴うほとんどのアプリケーションで使用されるソフトウェアツールである。そのため、ニーズ…

真菌群集を解析するユーザーフレンドリーなwebサーバー DAnIEL

ヒトの体内や体の中には、あらゆる生物界を代表する何兆もの微生物が生息しており、宿主の発生や生理に重要な役割を果たしている。この10年間で、細菌の配列を解析するためのオンラインツールやサーバーが十数種類開発され、パブリックドメインでアクセスで…

de-novo assembled transcriptomeのORF予測を行う Borf

RNA-Seq解析やトランスクリプトームのアノテーションにおいて、de-novoでアセンブルされたトランスクリプトームのORF予測は重要なステップである。しかし、現在のアプローチでは、ストランド特異性や不完全に組み立てられた転写産物などの要因を適切に考慮し…

スモールオープンリーディングフレーム(smORF)を予測する ORFLine

2021 4/21 追記 100コドン以下(300ヌクレオチド以下)の小さなオープンリーディングフレーム(smORF)のアノテーションは、ゲノム上にそのような配列が多数存在するため、困難を極める。しかし、近年の次世代シーケンスおよびリボソームプロファイリングの…

リファレンスベースのNANOpore FASTQの圧縮器 RENANO

ナノポア・シーケンシング技術は、短時間で大量のゲノムデータを生成できることもあり、急速に普及している(72時間以内に最大8.5TBのデータを生成)。送信や保存のコストを削減するためには、この種のデータに対する効率的な圧縮方法が必要である。ショート…

メタゲノムのアセンブリを行う hifiasm-meta

2021 10/19 プレプリント引用 2023/07/06 追記 現在のメタゲノムアセンブラは、ショートシーケンスリードやノイズの多いロングリード用に開発されたもので、正確なロングリードには最適化されていない。ここでは、最近のデータの高い精度を利用した新しいメ…

遺伝子融合イベントのアノテーションと視覚化を行う AGFusion

遺伝子融合(wiki)は、構造的染色体再編成の結果であり、関与する遺伝子にさまざまな機能的変化を引き起こす可能性がある。多くの場合、遺伝子融合によりキメラタンパク質が生成され、それによりタンパク質ドメインが組み合わされて新規機能が生成される。遺…

腸内嫌気性細菌の代謝遺伝子クラスターを調べる gutSMASH

2021 5/26 論文引用 腸内細菌叢は何百もの小分子を産生し、その多くは宿主の生理機能を調節している。二次代謝産物の生合成遺伝子を同定する試みがなされているが、腸内細菌叢の化学的プロダクトは主に一次代謝産物で構成されている。本研究では、腸内細菌の…

ハイパフォーマンスなビニングツール BASALT

2021 3/8 追記 メタゲノムビニングは、微生物の詳細な特性評価を可能にする。本研究では、メタゲノムビニングの分解能と効率を向上させるために、BASALT(Binning Across a Series of AssembLies Toolkit)と呼ばれる新しいビニングツールキットを開発した。…

MetaPop

微生物とそのウイルスは、海や土壌からヒトやバイオリアクターに至るまで、地球の生態系を動かす隠れたエンジンである。現在では、遺伝子マーカーによるアプローチは、ゲノム解析による個体群間(マクロダイバーシティ)および個体群内(マイクロダイバーシ…