macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2020-05-01から1ヶ月間の記事一覧

lsのモダンな代替コマンド exa

2020 6/1 誤字修正, 文章修正 lsが45年以上続いている今、exaは1970年代とは異なる仮定の下で開発することができる。コンピュータはもはやボトルネックではない。1970年代にUnixを開発していた開発者はテレタイプを使ってUnixとやりとりしていただろう。キー…

従来型のMLSTタイピングを行う mlst

2020 6/4 コマンド修正 mlstは、ゲノム配列を入力として伝統的な7つの遺伝子座に対するタイピングを行う。PubMLSTのタイピングスキームに従う。 インストール 依存 Perl >= 5.26 NCBI BLAST+ blastn >= 2.9.0 You probably have blastn already installed a…

特定の領域由来のロングリードを高速選抜する selectION

SelectION: Identification of predefined genomic regions in large nanopore DNA London Calling 2017 インストール ubuntu18.04LTSでテストした。 ビルド依存 requires gcc > 5 and the following libraries: boost filesystem boost program_options boo…

メタゲノムのビニング後の解析を行う自動化されたパイプライン MetaSanity

2020 5/29 構成を修正、タイトル変更 2020 6/1 コマンド修正 2021 10/5 ツイート追記 マイクロバイオーム研究の重要性はますます一般的になっており、さまざまな生態系(例:海洋、構築、宿主関連など)を理解するために不可欠である。研究者は、微生物ゲノ…

パンゲノム解析を行う GET HOMOLOGUES

2020 5/28 追記、10/5 タイトル修正、12/24 linuxでのインストール追記 2021 1/13 誤字修正 2024/02/21 追記,2/25追記 GenBank のような公開データベースに登録されているゲノムの数が増え続けていることから、種の遺伝子レパートリーを比較するためのツール…

VCFのSVコールをロングリードでジェノタイピングする SVJedi

2024/05/06 誤字修正 構造変異(SV)の研究は急速に拡大している。その結果、第三世代シークエンシング技術のおかげで、特にヒトゲノムにおいて発見されたSVの数が増加している。同時に、臨床診断のようないくつかのアプリケーションでは、新たにシーケンシ…

ロングリードのマルチプルシーケンスアラインメントを行う abPOA (POAのSIMD実装拡張)

マルチプルシーケンスアラインメント(MSA)問題を解決するために、Leeら(2002)によって最初に導入されたのがPartial order alignment(POA)である。POAでは、MSAをdirected acyclic graph(DAG)(有向無閉路グラフ)として表現し、動的計画法(wiki)(…

CRISPR/Cas9編集後のアンプリコンシークエンシングからindelのレポートを生成する CRISPR-DAV

CRISPR/Cas9システムの簡便さと精度の高さは、遺伝子編集の新時代をもたらした。CRISPRを介在させたゲノム編集を用いた目的のクローンのスクリーニングは、その多重化により次世代シークエンシング(NGS)によって可能になった。ここでは、CRISPR NGSデータ…

メタゲノムデータからウィルスゲノムをアセンブルする metaviralSPAdes

2020 5/25 タイトル修正 2020 11/11 dockerリンク追加 現在知られているウイルスのセットは着実に拡大しているが、これまでのところ、地球上のウイルスのごく一部しかシークエンシングされていない。ショットガンメタゲノムシークエンシングは、新しいウイル…

k-merカウンタ DSK

DNA/RNAシーケンシングのリード中のすべてのk-mer(長さkの部分文字列)をカウントすることは、多くのバイオインフォマティクスアプリケーションの前段階である。しかし、最新のk-merカウント方法では、大きなデータ構造がメモリ内に存在する必要がある。こ…

ゲノムのリアレンジメントを検出して視覚化する smashpp

2020 5/22 追記 ゲノムのリアレンジメントの研究は、染色体の進化や遺伝的疾患、ガンなどの研究に重要な役割を果たしており、その研究は非常に重要である。本研究では、2つのDNA配列間の小規模・大規模なゲノムリアレンジメントを検出し、可視化するためのア…

ゲノムの中の関心がある遺伝子を視覚化する Gcluster

2020 5/27 コメント追加 2020 5/28 -mオプション追記 遺伝子、遺伝子クラスター、およびその近傍のゲノムコンテクストを比較することは、遺伝子の機能や微生物の進化の基盤を決定する上で非常に重要である。現在のところ、多数のゲノムのゲノムコンテクスト…

効率的なVCFの圧縮器と関連ツールを提供する genozip

大規模なゲノムプロジェクトはますます一般的になりつつあり、その結果、数千もの個々のゲノムデータセットからなるVCF(Variant Call Format; (Danecek et al., 2011))ファイルが作成される。圧縮された形式であっても、このようなファイルは非常に大きく(…

アセンブリグラフからメタゲノムのビニングを行う GraphBin

メタゲノミクスの分野では、微生物群集の構造、多様性、生態についての貴重な知見が得られている。メタゲノム解析の重要なステップの1つは、長いコンティグにリードをアセンブリし、メタゲノムサンプル中に存在する異なる種に属するコンティグのグループにビ…

Iontorrentのエラーコレクションを行う IonHammer

IonTorrentのリードエラー修正アルゴリズムを用いて、幅広いデータセットのシーケンシングエラーを大幅に削減することができる。IonHammerはC++で実装されており、SPAdesゲノムアセンブラパッケージの一部として自由に利用できる。 インストール mac os 10.1…

メタゲノムシーケンスデータから菌体の株レベルプロファイリングを行う Snipe

2022/09/06 追記 食中毒は、開発途上国と開発途上国の両方において、世界の食品の安全性と公衆衛生を脅かす顕著な脅威となっている。毎年、病原体に汚染された食品は、米国で約4,800万人の人に病気を引き起こし、12万8,000人が入院し、3,000人が死亡している…

nextflowを使ったGATKのバリアントコールパイプライン

2020 5/15 snpEffのデータベース追加方法を追記, step2とlogの写真差し替え、dockerのコマンド追加、補足修正 2020 5/16 出力の写真差し替え、レポート追加 2020 10/11,10/12 インストールコマンド修正 2021 9/21 タイトル修正 ニューヨーク大 - Center for …

全ゲノムプロットをインタラクティブに作成するShinyアプケーション shinyChromosome

2020 5/14 フィーチャー => 観測値に変更 全ゲノムの非環状プロットは、全染色体に沿って配列されたゲノムデータを自然に表現したものである。現在のところ、非環状の全ゲノム図を作成するために設計された専用のグラフィカル・ユーザー・インターフェース(…

illumina、BGIのシーケンシングリードの前処理を行う Ktrim

次世代シーケンシング(NGS)データは、品質の悪いサイクルやアダプター汚染に悩まされることが多いため、下流での解析の前に前処理を行う必要がある。最新のシーケンサーのスループットとリードの長さはますます増大しており、前処理のステップは、現在のツ…

ショートリードアセンブリからplasmid配列を同定する Platon

プラスミドはchromosomeから独立して複製する染色体外遺伝要素であり、細菌の環境適応において重要な役割を果たしている。プラスミドは、潜在的な移動性または接合能力により、抗菌薬耐性遺伝子や病原性因子の重要な遺伝的乗り物であり、臨床的にも大きな意…

ゲノムのマッピング可能性を調べる GenMap

ゲノムの各位置のk-merの一意性(uniqueness)を計算することは、最大e個のミスマッチを許容しながら計算することが困難である。しかし、CRISPR実験のためのガイドRNAの設計など、多くの生物学的応用には不可欠である。より正式には、一意性または(k, e)マッ…

 シーケンスロゴを作成するpython API Logomaker

シーケンスロゴは、DNA、RNA、タンパク質の配列の生物学的特性を視覚的に説得力のある方法で説明するが、Pythonプログラミング環境内でそのようなロゴを生成してカスタマイズすることは現在のところ困難である。ここでは、公開品質のシーケンスロゴを作成す…

メタゲノムアセンブリのウイルスゲノム品質を評価する CheckV

2020 5/9 誤字修正 2020 12/22 論文追加 ここ数年の間に、メタゲノミクスにより何百万もの新しいウイルス配列のアセンブルが可能になり、地球上のウイルスの多様性に関する知識が大幅に拡大した。しかし、これらの配列は小さな断片から完全なゲノムまで様々…

グラフィカルなリソース監視ツール Netdata

2020 5/8 説明追加 Netdata は、システムやアプリケーションのパフォーマンスをリアルタイムで監視する監視エージェントである。Netdata を使うと、非常にインタラクティブな Web ダッシュボードを使用して、実行中のシステム (Web サーバ、データベース、ア…

Jupiter notebookの使い方其の4 まとめ

2020 5/11 誤字修正 2020 10/9 リンク追加 2020 11/8 論文リンク追加 3回にわたってjupyter notebookの簡単な使い方を説明してきました。 これまでの説明でjupyter notebookはどうやって使うのか、ある程度は伝えられたかと思います。ここで改めてJupiter no…

Jupiter notebookの使い方其の3(数式とマジックコマンドについて)

更新中 第3回の今回は、数式の表示とマジックコマンドについてです(第2回)。Jupyter Notebookに含まれるMarkdownパーサーはJSのMathJaxライブラリ(wiki)に対応しており、LaTex( ラテック、ラテフ)で書いた数式をノートブック上にレンダリングして表示…

Jupiter notebookの使い方其の2(Markdown記法について)

2020 5/4 誤字修正 2020 5/5 リンク追加, 構成変更 Jupiter notebookの使い方を解説する記事の第2弾です(第一回はこちら)。今回はJupiter notebookがサポートしているMarkdown記法について説明します。Markdownはプレーンテキストの文書からマークアップ…

初めてコマンドを使う人向けの解説:その3、Jupiter notebookの使い方 - 其の1

2020 5/2文章修正 2020 5/3 誤字修正 2020 5/4タイトル修正 2020 5/5 文章修正 2020 5/7 導入部分の文章と構成を変更 初心者向け解説記事第3弾の今回は、急速に普及が進んでいるjupyter notebookの導入と基礎的な使い方について説明します。Jupiter noteboo…

インタラクティブな主成分分析webサービスによってRNA seqデータを分析する PCAGO

過去10年の間に、全トランスクリプトームのシークエンス(RNA-Seq)は、多様な分子機構を理解し、様々な生物学的問題に取り組むための強力な技術として浮上してきた。RNA-Seq実験の初期段階では、異なる遺伝子発現レベルに基づいた生物学的サンプルの初期特…