database
ヒト遺伝子のバリアントレパートリーの多くは、一塩基多型(SNV)とsmall indelで構成されているが、構造多型(SV)は依然として私たちの変異DNAの主要な部分を占めている。SVの検出は、各カテゴリーのSVを検出するために異なる技術(アレイCGH、SNPアレイ、…
公開リポジトリで利用可能な生物学的シーケンスデータの量は急速に増加しており、生物医学にとって重要な資源を形成している。しかし、これらのデータを効率的かつ正確に全文検索可能にすることは依然として課題である。本研究では、大規模なシーケンスセッ…
微生物群集のメタゲノム解析は、メタゲノムアセンブリゲノム(MAG)の再構築により、種間および種内の遺伝的多様性が非常に高いレベルで存在することを明らかにした。MAGデータベース(MAGdb)は、臨床、環境、動物のカテゴリーにまたがる74の代表的な研究論…
2025/09/09 タイトル修正 生命の多様性の広がりは計り知れないが、公開されている核酸配列データは地球規模での遺伝的多様性の分散と進化を垣間見せる。しかし配列データの急速な増加と蓄積は、効率的な解析能力を凌駕している。自由に利用可能なシーケンス…
メタオミクスデータは、微生物の多様性と機能に関する情報が公共のレポジトリで指数関数的に蓄積されているが、派生した情報はデータの種類、研究、または採集された微生物環境に応じて孤立した状態で管理されている。ここでは、生息地、地理、系統関係を超…
分子データベースは実験生物学者にとっても計算生物学者にとっても不可欠なリソースである。高品質なゲノムアセンブリの急速な増加により、脊椎動物の多様なグループにわたる系統特異的適応に関連する二次的な遺伝子消失事象について記述した出版物が急増し…
進化研究においては、生命のあらゆる領域にわたるゲノム情報の広範な調査が必要である。GenBankを通じて多数のゲノムが利用可能であるにもかかわらず、ゲノム情報の効果的な可視化や比較は、そのサイズなど多くの理由から困難である。ゲノムファイルを解析す…
生命のタイムツリー・プロジェクトの成果である「TimeTree of Life」リソースの第5版(TToL5)を発表する。このプロジェクトは、公開されているモレキュラータイムツリーを統合し、進化に関する知識を誰でも簡単に利用できるようにすることを目的としている…
2025/110/5 追記 細菌は多くの分野において、数え切れないほどの理由から魅力的な研究対象であり、全ゲノムシーケンス(WGS)は微生物学的理解を深めるための最も重要な方法論となっている。一方、費用対効果の高いシーケンシングプラットフォームへのアクセ…
生物種間の表現型の違いはタンパク質コード配列と遺伝子発現の変化によって大きく左右される。ここでは、7種8器官のトランスクリプトームを解析することにより、被子植物のタンパク質コード遺伝子の発現パターンが急速に進化していることを示す。4,500万年以…
タンパク質毒素は生物学における重要な分子兵器であり、隣接する細胞を攻撃するために使用される。細菌はタンパク質毒素を使って、原核細胞や真核細胞を死滅させたり、成長を阻害したりする。毒素は、様々な生息環境におけるマイクロバイオームの形成、ファ…
ウイルスは豊富で多様性に富み、先祖伝来の生物学的実体である。その多様性は、遭遇する様々なタンパク質ファミリーの数においても、各タンパク質ファミリーの配列の不均一性においても高い。近年、ウイルスゲノムの塩基配列が解読されつつあり、このような…
UNIfied database of TransMembrane Proteins (UniTmp)は、膜貫通タンパク質の構造情報を、タンパク質セグメントの局在、タンパク質のトポロジーから膜包埋3次元構造まで、様々なレベルで網羅的に収集した、自由にアクセス可能なリソースである。何万もの新…
Plant Expression Omnibus (PEO)は、100以上の植物種、約60,000の手作業でアノテーションされたRNA-seqサンプル、400万以上の遺伝子の遺伝子発現に関する知見を生物学者に提供するウェブアプリケーションである。このツールにより、ユーザーは異なる器官にわ…
ヒトゲノムには約2万個のタンパク質がコードされているが、その多くはまだ解明されていない。科学研究は、よく研究されているタンパク質に焦点を当てがちであることは明らかであり、未解明の遺伝子が不当に軽視されているという懸念につながっている。この問…
Orthology Benchmark Service (https://orthology.benchmarkservice.org)は、Quest for Orthologsコンソーシアムによってサポート・維持されている、orthology inference 評価のゴールドスタンダードである。これは、標準的なデータセットと共通の手順で、既…
プラスミドには、病原因子や抗生物質耐性機構をコードする遺伝子が含まれていることが知られている。メタゲノミクスデータ処理におけるその関連性は着実に高まっている。しかし、メタゲノム実験の普及と規模の拡大に伴い、報告されるプラスミドの数も急速に…
TRGdbデータベースは、バクテリアの分類学的制限遺伝子(TRG)に特化したリソースである。最新の細菌分類学に基づき、異なる属や種に特異的な遺伝子を包括的に収集している。ユーザーインターフェースは、ブラウズや検索、配列の類似性探索を容易にする。また…
MediaDive (https://mediadive.dsmz.de) は、専門家が監修した包括的な培養培地データベースで、あらゆる生命領域の4万以上の微生物株について、3200以上の標準培養培地のレシピ、手順、分子組成が収録されている。MediaDiveは、研究・診断ラボでの日常的な…
Bio-protocol Exchangeは、Bio-protocolジャーナルの姉妹プラットフォームサイト。研究者がプロトコルを議論したり、実験手順を共有する場として公開されている。実験プロトコルだけのプレプリントサーバーとしても機能している。 from bioprotocolbyte :A n…
ゲノム、トランスクリプトーム、その他の微生物オミックスデータの解釈は、十分にアノテーションされたゲノムの利用可能性に大きく依存している。公開されている微生物ゲノムの数が指数関数的に増加し続ける中、品質管理と一貫したアノテーションの必要性が…
窒素(N)サイクルは、地球生態系における重要な生物地球化学的経路の集合体であり、生態学や環境学の分野で広く注目されている。現在、ショットガンメタゲノムシーケンスは、窒素サイクルプロセスを担う遺伝子ファミリーの探索に広く応用されていまる。しか…
公開データベースには惑星規模の核酸配列コレクションが含まれているが、このコーパスの効率的な検索方法がないため、体系的な探索が阻害されている。このデータベースは(本稿執筆時点で)20ペタベースを超え、指数関数的に増加している (ref.1)。そこで、…
ハイスループットRNA-sequencing(RNA-seq)は、その低コストと高いカバレッジにより、ここ10年で最も人気のある遺伝子発現プロファイリング技術になった。その結果、植物界からのRNA-seqライブラリの数は近年飛躍的に増加している。トウモロコシ、イネ、ダ…
2021 11/8 タイトル修正 細胞の生命活動は、生体分子間の複雑な機能的相互作用によって成り立っている。その中でも、タンパク質-タンパク質間の相互作用は、その多様性、特異性、適応性から特に重要である。STRINGデータベースは、物理的相互作用と機能的相…
miRNAは、遺伝子の発現を抑制する短いノンコーディング分子であり、生物にとって重要な役割を果たしている。miRNA関連の研究のために、何十もの計算手法が開発されているが、それらはさまざまな面で大きく異なっている。比較が難しい手法が数多く存在するた…
シアノバクテリアは、広く普及している重要な細菌門であり、地球上の炭素・窒素固定のかなりの部分を担っている。しかし、シアノバクテリアの16S rRNA遺伝子配列の信頼性の高い正確な自動分類は、相反する体系的なフレームワーク、一貫性のない分類学的な定…
HPより DASH(Database of Aligned Structural Homologs)は、PDBに登録されている既知の構造的に相同なタンパク質のドメインと鎖の構造アライメントを集めたデータベースである。 その処理方法は、(a) CD-HITを用いてPDBから配列固有のタンパク質を99%の配列…
必須遺伝子とは、生物が特定の条件下で生存するために必要な遺伝子のことである。バクテリアの最小遺伝子セットの研究では、生命を維持するための基本的な細胞プロセスが解明されている。この5年間、CRISPR/Cas9をさまざまな種類のヒト細胞に適用することに…
MMseqs2には非常に多くの機能があります。今回はmmseqs databasesコマンドを試します。mmseqs databasesを使うと、UniProtやGTDB、NCBI nr/ntなどからMMseqs2のデータベースとしてビルド済みのデータベースをダウンロードして、MMseqs2によるホモロジーサー…