macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

Preprint

Heterogeneityを考慮してシーケンスロゴを生成する MetaLogo

シーケンスロゴは、短い配列の保存性やバリエーションを視覚的に表示するために使用される。これにより、DNAやタンパク質の配列の固定パターンや保存されたモチーフを示すことができる。しかし、一般的なシーケンスロゴジェネレーターの多くは、入力されたす…

ゲノムアセンブリを修正したりscaffoldingするためのツールコレクション RagTag

作物のゲノム解析を進めるためには、高品質な個別ゲノムアセンブリによる効率的な遺伝子システムが必要である。ここでは、アセンブリーのscaffoldingやパッチを自動化するツールセットであるRagTagを紹介し、広く使われているトマトの遺伝子型M82と、機能的…

転写産物の正確な翻訳と評価を行う TranSuite

タンパク質の翻訳プログラムでは、転写産物の中で最も長いオープンリーディングフレーム(ORF)が選択されることが多いため、データベースには不正確なORFや誤ってアノテーションされたORFが多数存在する。早期終止コドン(PTC)を含む非生産的な転写産物の…

遺伝子構造に基づいてメタゲノム中の真核生物と原核生物のコンティグを区別する Whokaryote

2022/05/04 追記 メタゲノミクスは、微生物群集に含まれるすべての生物の機能的可能性を研究するための著名な技術となっている。しかし、ほとんどの研究では、真核微生物を無視して、微生物群集に含まれるバクテリアに焦点を当てている。実際、多くのメタゲ…

Nanopore RNAseqのためのフルスタックで軽量なウェブサーバ Duesselpore

トランスクリプトームのゲノムワイドな解析は、既知のすべての生物種の生理学の基礎となる分子メカニズムに関する広範な洞察を提供し、まだ隠されているものを発見することを可能にする。近年、オックスフォード・ナノポア・テクノロジー(ONT)は、次世代シ…

(海洋)メタゲノムを原核生物、真核生物、ウイルスに分類する DeepMicrobeFinder

配列の分類は、メタゲノムの複雑さを軽減し、メタゲノムサンプルの構成を基本的に理解するために有効である。しかし、ほとんどの自然環境におけるメタゲノムは、原核生物、真核生物、そしてその両方のウイルスを含む複数の配列ソースから得られているため、2…

オックスフォードナノポアのハプロイドアセンブリを2倍体アセンブリに変換する hapdup

ロングリードシーケンシングは、現在マッピングが困難な領域に到達し、隣接するバリエーションを日常的にリンクさせてリードベースのフェージングを可能にすることで、バリアント検出に変革をもたらす可能性がある。第3世代のナノポアシーケンスデータは、長…

ショートリードマッピングの高速化 strobealign

2022/04/15 インストール手順更新 ショートリードのゲノムへのアラインメントは、多くのバイオインフォマティクス解析で用いられる基本的な計算ステップである。そのため、このような計算をできるだけ高速に行うことが望まれている。多くのアラインメントア…

バリアントフィルタリングとポリッシングを行う Merfin

ノイズの多いロングリードから正確なジェノタイピングを行い、コンセンサスの質を向上させるために、リードマッピングやバリアントコーリングの手法が広く用いられている。バリアントコールの精度は、リードの品質、リードマッピングアルゴリズムとバリアン…

タンデムリピートとその周辺のリードアラインメントをハプロタイプに分解して可視化する REViewer

2021 10/27、20/28追記 ショートタンデムリピート拡張は、家族性筋萎縮性側索硬化症やハンチントン病をはじめとする多くの神経遺伝性疾患の原因となっている。最近では、全ゲノムやエクソームのシーケンスデータからリピートの拡大を同定する方法が複数開発…

原核生物ゲノム中の偽遺伝子候補を検出する Pseudofinder

2022/07/09 論文引用 原核生物のゲノムは一般的に遺伝子密度が高く、偽遺伝子(機能していない、あるいは不活性化された遺伝子の残骸)は比較的少ない。しかし、近年の生態系の変化や、共生生物や病原体が経験したような極端な個体数の減少など、特定の状況…

アンサンブル学習による病原性配列の正確で高感度な機能スクリーニングを行う SeqScreen

2022/06/23 論文引用 2023/04/3 関連論文へのリンク 現代の卓上DNA合成技術と新興病原体への関心の高まりにより、懸念される病原体に対するオリゴヌクレオチドのスクリーニングの重要性が高まっている。しかし、オリゴヌクレオチドの正確で高感度な特性評価…

コンポジション、カバレッジ、アセンブリグラフによるメタゲノムビニングを行う MetaCoAG

2021 10/8 追記 メタゲノムビニングにより、様々な種の様々な遺伝物質を研究し、特性を明らかにし、微生物群集についての洞察を得ることができるようになった。既存のビニングツールはメタゲノミクスのde novoアセンブリをビニングするが、アセンブリグラフ…

リファレンスゲノム情報を半教師あり深層学習で取り込むことで、より優れたビニングを実現する SemiBin

2022/02/09 ツイート追記 2022/02/27 追記 2022/03/01 help更新 メタゲノムビニングとは、メタゲノムアセンブルゲノム(MAG)を構築する際に、同一ゲノムに由来すると予測される配列を自動的にグループ化するステップである。最も広く利用されているビニング…

16S rRNA塩基配列データから超可変領域を抽出する HyperEx

16SリボソームRNA遺伝子は、生物学において最も研究されている遺伝子の一つである。この16SリボソームRNAの重要性は、細菌や古細菌の系統学や分類学上の解明に広く応用されていることによる。実際、16SリボソームRNAは、ほとんどすべてのバクテリアや古細菌…

機械学習の手法でエミュレートされたBWA-MEM: BWA-MEME

次世代シーケンサーの普及やシーケンサーのスループットの向上に伴い、効率的なショートリードのアライメントが求められているが、その中でもシーディングは主要な性能ボトルネックの一つとなっている。Seeding phaseのキーとなるチャレンジは、リファレンス…

ロングリードを使ったSNVとSVのフェーシングを行う LongPhase

ロングリード・フェーシングは、二倍体ゲノムの再構築、バリアント・コーリングの改善、メタゲノミクスにおける微生物株の解決などに用いられてきた。しかし、既存の手法では、大きな構造変化(Structural Variation: SV)によって位相差ブロックが破壊され…

(Prokaryotes)ドラフトゲノムのポリッシングを行う Polypolish

2021 10/21 論文引用 Githubより Polypolishはショートリードによるゲノムアセンブリを研磨するツールです。このカテゴリーの他のツールとは異なり、Polypolishは各リードが(単一の最適な位置ではなく)すべての可能な位置にアラインメントされたSAMファイ…

大規模な微生物の比較ゲノミクスのためのモジュラー式のツール PanACoTA

2021 9/8 修正 2021 9/9 誤字修正 2021 9/10 prokkaのバージョンによるエラー修正 (依存するライブラリの関係でpython3.7の環境に導入するように修正した), --prodigalのオプション消去 2021 10/15 docker imageのコマンド追記 2021 10/18 annotate追記 2021…

パンゲノム解析によってアノテーション情報の改善を試みる panaroo

Preprintより 原核生物のゲノム進化は、親から子への遺伝物質の垂直伝達と生物間の水平遺伝子伝達の両方によって引き起こされる(ref.1)。細菌の大規模なシーケンシング研究から、種内ゲノム含有量に大規模な違いが生じることが確認されている(ref.2)。こ…

大量のタンデムリピート構造を含むゲノムをインタラクティブに可視化する StainedGlass

2022/01/13 論文引用 ドットプロット解析は、配列の同一性や方向性の違いのような複雑なリピートの基礎構造を明らかにするためによく用いられる。ロングリードシーケンス技術の進歩により、最近ではますます連続したリファレンスゲノムのアセンブリやヒトの…

病原性細菌の比較トランスクリプトームおよび共発現データベース bacteria.guru

細菌は単細胞の原核生物であり、相互作用から寄生まで様々な共生関係を築くことができる。細菌の病原性に対抗するためには、遺伝子の機能と制御に関する理解を深めることが必要であり、それが新しい抗菌薬の開発につながる。 Gene expressionは遺伝子の機能…

(ヒトゲノム)超高速なk-mer問い合わせwebサービス KmerKeys

2022/05/21 論文引用 K-merは、ゲノム配列解析に使用される短いDNA配列である。K-merを使ったアプリケーションには、ゲノムアセンブリやアラインメントがある。しかし、バイオインフォマティクスの分野でk-merを広く利用するには、ゲノム配列データの巨大化…

原核生物のトランスポゾンデータベースとトランスポゾン解析のためのウェブポータル TnCentral

原核生物のトランスポゾンエレメント(TE)のウェブリソースであるTnCentral(https://tncentral.proteininformationresource.org/)の構造と組織について説明する。TnCentralには、Tn3、Tn7、Tn402、Tn554ファミリーのトランスポゾン、複合トランスポゾン、…

メタゲノムコンティグの分類を行うユーザーフレンドリーなツール SprayNPray

培養した微生物のisolatesや真核生物の個体のショットガンシーケンス(全ゲノムシーケンス)や微生物群集のショットガンシーケンス(メタゲノミクス)は、生物学において一般的になってきている。シークエンスされたサンプルには、複数の生物種が含まれてい…

バイサルファイト処理されたリードのマッピングを行う bwa-meth

バイサルフィット処理された配列をアライメントする新しいツールbwa-mesを紹介し、既存のアライナーと比較する。結果、クオリティトリミングを行わなくても、高速で正確なアライメントが可能であり。下流のツールですぐに使用できることを示す。ターゲットシ…

HTSデータを扱う様々なツールをGUIインターフェースで統合した TBtools

ハイスループットシーケンス(HTS)データからの情報マイニング用にさまざまなソフトウェアまたはパイプラインが開発されているが、それらのほとんどは、ほとんどの生物学者が馴染みのないプログラミングおよびコマンドライン環境に依存している。 ユーザー…

ロングリードアセンブリのコンティグからクロモソームへの改善を自動で行う ILRA

近年のロングリードシークエンシング技術の進歩は、大規模なコンソーシアムが地球上のすべての真核生物の配列を決定することを可能にするだけでなく、多くの研究室が関心のある種のゲノム配列を決定することも可能にしている。しかし、コンティグの数は染色…

minimap2を高速化した mm2-fast

2022/06/14 ツイート追加 ロングリードシーケンシングは、ゲノミクスやトランスクリプトミクスの分野で日常的に使用されている。ロングリードやドラフトゲノムアセンブリを参照配列にマッピングすることは、これらのアプリケーションにおいて最も時間のかか…

原核生物のゲノムアノテーションを比較する ORForise

モデル生物の過去のゲノムアノテーションに基づいて行われてきたオープンリーディングフレーム(ORF)予測ツールの偏りは、新規ゲノムやメタゲノムの理解に影響を与えている。これは、予測が既存の知識に偏ることになるため、新しいゲノム情報の発見を妨げる…