macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2022-09-01から1ヶ月間の記事一覧

タンパク質配列をゲノム配列に対してintron (gap) awareで高速にアラインメントする Miniprot

#2024/03/08 v0.13リリースについて追記(停止コドンの取り扱いのバグ修正) Githubより Miniprotは、タンパク質配列をゲノムに対してアフィンギャップ・ペナルティ、スプライシング、フレームシフ トでアライメントする。Miniprotは、他の既知の種の遺伝子…

Nanopolishのcall-methylationおよびeventalignモジュールを最適化して再実装した f5c

ナノポアシーケンスにより、ポイントオブケア診断や現場でのジェノタイピングなど、携帯可能なリアルタイムシーケンスアプリケーションが可能になる。このような成果を得るためには、生のナノポアシグナルデータを解析するための効率的なバイオインフォマテ…

系統マーカー遺伝子に分類群を割り当てる AmphoraNetと結果を視覚化するAmphoraVizu

メタゲノム解析はここ数年、目覚しい発展を遂げた。今日、遺伝子配列決定の専門家だけでなく、他の専門分野の多くの研究室が、臨床サンプルや環境サンプルから得られたDNA配列を解析する必要がある。メタゲノム解析データの系統解析は、生物学者やバイオイン…

真菌のITSやコアタンパク質コード遺伝子を使った系統解析を自動で実行する UFCG pipeline

UFCG pipelineを使うと、真菌のITSやコアタンパク質を使った系統解析を自動で実行できます。簡単にですが、使い方を確認しておきます。 UFCG is a database&pipeline for fungi phylogenomics. Our db contains 61 marker genes, 20 widely used & 41 novel …

ショートリードからの株レベルメタゲノムアセンブリを行う StrainXpress

次世代シーケンサーを用いたメタゲノム解析により、長時間の培養を必要とせず、特徴的な生息環境にある微生物を同定することが可能になった。重要なことは、薬剤耐性、病原性、環境との相互作用など、臨床に関連する現象が種内で既に変化している可能性があ…

NCBI SRA Run Selectorを使う

2022/11/26 追記 SRA Run Selectorは、SRAに保存されている大規模なランのセットを取り出し、どのランを解析に使用するかを絞り込み、結果をメタデータとしてダウンロードすることができる。 NCBI-Hackathons/SRA Run Selector Tutorial https://github.com/…

Demultiplexingを行う fgbioのDemuxFastqsコマンド

fgbioはディープシーケンシングデータを扱うためのコマンドラインツールキット。リードレベルのデータ(FASTQ、SAM、BAMなど)やバリアントレベルのデータ(VCF、BCFなど)を操作する。特に次のようなものを提供することに重点を置いている(Githubより)。 …

原核生物ゲノムのアセンブリ結果およびアノテーションを改善するためのWebプラットフォーム ReNoteWeb

DNA塩基配列の解読にかかる費用と時間が短縮されたことにより、NCBI(National Center for Biotechnology Information)のような公開データベースへの生物情報の寄託が大幅に増加した。1回の実行で大量のデータが生成されるため、この新しい特徴を持つデータ…

全自動のトランスポーザブル・エレメントのアノテーションと解析のパイプライン Earl Grey

2024/04/06 論文追記 トランスポーザブル・エレメント(TE)は、ほぼ全ての真核生物ゲノムに存在し、様々な進化過程に関与している。TEに関する研究は非常に盛んだが、そのアノテーションと特性解析は、特に非専門家にとって依然として困難である。(i)断片的…

BUSCO遺伝子を使った系統解析のsnakemakeワークフロー

2022/09/13 追記、誤字修正 2024/01/16 タイトル修正、わかりにくい説明を修正 Current Protocols in BioinformaticsにBUSCOの使い方に関する論文が出ています。(引用1)。その論文のパートの1つ;”Support Protocol 3: BUILDING PHYLOGENOMIC TREES”では…

(ヒト)バリアントの機能的アノテーションリソース FAVOR

大規模な全ゲノムシークエンシング(WGS)研究とバイオバンクにより、多数のコーディングおよびノンコーディングバリアントが急速に生成されている。これらは、ヒト疾患の遺伝的基盤を明らかにするための前例のないリソースを提供する。バリアント機能アノテ…

バリアントコーリングを自動化する柔軟でスケーラブルなパイプライン grenepipe

本著者らは、個体や集団のハイスループットな生シーケンスデータから遺伝子型バリアントコールまでのデータ処理を効率化するオールインワンSnakemakeワークフローであるgrenepipeを開発した。このパイプラインは、一般的なソフトウェアツールを単一の設定フ…

海洋環境ゲノムをマイニングするためのオンラインサービス The Ocean Gene Atlas v2.0

Tara Oceansの海洋メタゲノムやメタトランスクリプトームのような大規模データリソースを用いて遺伝子の生物地理に関する仮説を検証するには、多大なハードウェアリソースとプログラミングスキルが必要になる。今回リリースされた「Ocean Gene Atlas」(OGA2…

メタゲノムの株レベルプロファイリングを行う PStrain

2022/09/07, 9/8 追記 微生物群は、人間の病気や生理活動に不可欠な役割を担っている。ゲノム配列の株レベルの違いにより、微生物の機能が異なることがある。ショットガン・メタゲノムシーケンスを用いると、微生物群集の菌株を実用的にプロファイリングする…

GenBank Flat File FormatとJSON間の変換を行う GBSON

HPの解説より GenBank Flat File Format (.gb または .gbk) は、核酸やタンパク質の配列とそのアノテーションを保存できるファイルフォーマットとして広く利用されている。NIHの遺伝子配列データベース「GenBank」(https://www.ncbi.nlm.nih.gov/genbank/)…

塩基をハッシング(ハッシュ化)する ntHash

ハッシングは、配列アラインメント、ゲノムおよびトランスクリプトームアセンブリ、 k -mer計数および誤り訂正を含む、多くのバイオインフォマティクスアプリケーションにおける索引付け、照会および迅速類似性検索に広く使用されている。 したがって、ハッ…