2022-01-01から1年間の記事一覧
著者らは、真核生物ゲノムにおける遺伝子予測のための高速かつ高精度なアルゴリズムの作成に向けて、いくつかのステップを踏んできた。まず、ab initio gene findingを効率的に行うための自動化手法、GeneMark-ESを導入し、教師無しでパラメータを繰り返し学…
2023/01/01 誤字修正 タンパク質をコードする遺伝子の予測は、新たにシークエンシングされアセンブルされたゲノムのアノテーションにおいて重要なステップである。AUGUSTUSは真核生物の遺伝子予測のための最も正確なツールの一つである。ここでは、AUGUSTUS…
レポジトリより telomere-kmer-searchは、テロメアが与えられたゲノムライブラリの中で最も豊富なダイレクトタンデムリピート配列であると仮定してテロメアリピートを予測する。出力は、頻度順に並べたダイレクトタンデムリピートユニット配列のリストである…
2023/01/05 追記 2023 01/13 パラメータの解釈間違いを修正 Exonerateはペアワイズ配列比較のためのツール。DNAとcDNA(EST)、DNAとタンパク質間のアライメントを行うことができる。アライメントモデルに基づき、ギャップありアライメント、ギャップなしアラ…
系統樹の推定は生物学の基礎となるものである。しかし、最新の系統樹解析では、複雑なパイプラインを実行する必要があり、多大な計算コストと人件費がかかる上、シーケンスのカバレッジ、アセンブリ、アノテーションの質にも制約がある。このような課題を克…
共分散に基づく共選択的圧力下での多型の発見やエピスタシスは、近年、集団ゲノム科学において非常に注目されている。染色体上の対立遺伝子の集団レベルでの共分散を統計的にモデル化し、多型のペア間の依存性をモデルフリーで検定することで、細菌集団にお…
メタゲノム解析の進歩により、環境から直接微生物群集を研究することが可能になった。メタゲノム解析は、微生物群集の種を特定するための重要なステップである。次世代シーケンサーのリードは、ショートリードの情報が限られているため、通常コンティグにア…
2022/12/27,28 追記 ハイブリッドシーケンステクノロジーの進歩により、ハイブリッドシーケンス・トランスクリプトミクスを用いてしばしばアノテーションされるゲノムアセンブリがますます拡大し、ゲノムの特性解析が向上し、さまざまな生物における新規遺伝…
MGnifyプラットフォーム(https://www.ebi.ac.uk/metagenomics)は、微生物由来の核酸配列のアセンブリ、解析、保存を容易にする。このプラットフォームでは、メタバーコード、メタトランススクリプトーム、メタゲノムなど、様々な環境由来のデータセットを…
ゲノムワイド関連研究(GWAS)は、ヒトの医学やゲノミクスにおいて不可欠なものとなっているが、細菌を対象とした研究はほとんど行われていない。本発表では、パンゲノムの構成要素について、観察された表現形質との関連を、集団の階層性を考慮しながら、進…
https://microbeatlas.org/index.html?action=aboutより メタゲノム配列が決定された大規模なサンプル群を集約的に解析することで、未知あるいは研究が不十分な微生物分類群が存在する典型的な存在量や環境に関する情報を蓄積できる。これにより、未知の微生…
Kraken 2は、k-merの完全一致を利用したシークエンシングリードの分類学的プロファイリングツールで、メタゲノムやメタアンプリコンの分類や汚染のチエックなどに幅広く使用されている。データベースは自分で作成することもできるが(custom databaseの項を…
近年、ハイスループットなシーケンシングが進んでいるが、微生物集団のメタゲノム解析は依然として困難な状況にある。特に、メタゲノムで構築されたゲノム(MAG)は、種間反復、カバレッジの不均一、菌株数の変動などにより、しばしば断片化されている。MAG…
ゲノム、トランスクリプトーム、その他の微生物オミックスデータの解釈は、十分にアノテーションされたゲノムの利用可能性に大きく依存している。公開されている微生物ゲノムの数が指数関数的に増加し続ける中、品質管理と一貫したアノテーションの必要性が…
メタゲノムシーケンスは、微生物コミュニティのゲノム配列と構成に関する洞察を提供することができるが、メタトランスクリプトーム解析は、微生物コミュニティの機能的活性を研究するために有用であると考えられる。RNA-Seqデータは、コミュニティ内の活性な…
スケッチベースの距離推定に基づく、高速でメモリ効率の良いゲノムクラスターツールRabbitTClustを紹介する。本手法は、次元削減技術とストリーミング、最新のマルチコアプラットフォーム上での並列化を組み合わせることで、大規模データセットの効率的な処…
クロマチンの発現、タンパク質-DNA/RNA相互作用、アクセス性、構造などが条件や細胞種によってどのように異なるかを同時に可視化することにより、オルタナティブスプライシングの制御機構や機能的影響について理解を深めることができる。しかし、既存のSashi…
2023/04/13 ツイート追加 brenameはWindows、Mac OS X、Linuxをサポートする正規表現に対応したファイルのリネームツール。再帰的に複数の階層のファイルとディレクトリ(フォルダ)を同時にリネームしたり、一連のファイルを整数の通し番号にリネームするこ…
複数のメタゲノムサンプルからde novoで株を同定するSTrain Resolution ON assembly Graphs (STRONG)を紹介する。STRONGはメタゲノムアセンブリゲノム(MAG)に対してコアアセンブリとビニングを行い、バリアント簡略化の前にコアアセンブリグラフを保存する。…
シーケンシングデータからRNA修飾を検出するためのハイスループットな抗体不要の方法がいくつか開発されている。ここでは、IlluminaまたはNanoporeプラットフォームをベースとするRNA修飾検出アッセイのための多用途ソフトウェアソリューションおよび包括的…
EMBOSSのunionコマンドを使うと、複数の配列を読み込み、それらを連結して1つの配列として書き出すことができます。 EMBOSS union https://emboss.sourceforge.net/apps/cvs/emboss/apps/union.html multi fastaファイルを指定する。 union -filter mulit-se…
2022/12/05, 06 HP更新 Genozip は、広く利用されている FASTQ、BAM、VCF ファイル形式を含む、幅広いゲノムデータの圧縮を行う。ここでは、BAMおよびCRAMファイルの圧縮に焦点を当てた、Genozip技術の最新の進歩を紹介する。様々な種類の研究(全ゲノムシー…
ODGI のextract コマンドは、パンゲノムグラフから目的の遺伝子座を抽出し、パンゲノムグラフのサブグラフを作成する。チュートリアルでは、このextract コマンドを使い、6人+chm13細胞株の7つのハプロイドヒトゲノムアセンブリから得られた13のコンティグ…
ODGI のdepthコマンドは、グラフのデプスをプリントする。チュートリアル(link)では、このdepthコマンドを使い、44人の個人からのハプロイドフェージングされた第8番染色体の88個の配列のパンゲノムバリエーショングラフから個体間で共通してデプスが減少…
GraPPLEは、Graphia (Pubmed) によるパンゲノムグラフの可視化支援スクリプトです。細菌のパンゲノムグラフの活用法について学ぶためには、最近出たこちらの論文(link)がとても参考になりました。 Githubより GraPPLEのスクリプトは、バクテリアのパンゲノ…
Githubより pggb は入力配列から pangenome variation graph を作成する。pangenome variation graph は一般的な多重配列アライメントの一種で、ある生物種または生物群におけるゲノム要素の完全な集合をモデル化したものです。パンゲノムは、配列グラフの一…
Pangenomeグラフは、ゲノムコレクションの相互アラインメントを完全に表現するものである。このモデルは、構造的に複雑な領域を含む集団の全ゲノム多様性を研究する機会を提供する。しかしながら、パンゲノムグラフを用いた数百ギガスケールのゲノムの解析は…
シーケンサーの性能向上により、かつてないほど大量のゲノムデータが生成されるようになった。このようなデータの処理では、例えば、多数のサンプルにわたって小さなゲノム領域を解析する場合、しばしばI/Oボトルネックが発生する。しかし、最も大きなI/O負…
レポジトリより OGA(Organelle Genome Assembler)は、遠縁の生物種、あるいはオルガネラ遺伝子をリファレンスとして、オルガネラゲノムをアセンブルする。オルガネラゲノム(プラストーム)を組み立てるために、以下の4つのステップを実施する。(1)生のショ…
オミックスデータは大量に生産され、通常、高度な可視化解析が必要とされる。これらの解析にはプログラミングのスキルが必要な場合が多く、実験生物学者にとっては難しい。したがって、より使いやすいツールが早急に求められている。 本発表では、オミックス…