macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

consensus caller

ロングリードアンプリコンのソートとコンセンサス配列の構築のためのツール amplicon_sorter

オックスフォード・ナノポア・テクノロジーズ(ONT)は、携帯可能で低コストなシーケンスの可能性から、生態学研究において人気を集めている第3世代のシーケンサー技術である。この技術はロングリードのシーケンスを得意とするが、アンプリコンのシーケンス…

バリアントフィルタリングとポリッシングを行う Merfin

ノイズの多いロングリードから正確なジェノタイピングを行い、コンセンサスの質を向上させるために、リードマッピングやバリアントコーリングの手法が広く用いられている。バリアントコールの精度は、リードの品質、リードマッピングアルゴリズムとバリアン…

(メタゲノム)BAMのカバレッジ、polymorphic サイト率、リファレンスフリーのコンセンサス配列を計算する CMSeq

CMSeqは、SegataLabで公開されている、リファレンスのカバレッジ、polymorphic サイト率、BAMからのコンセンサス配列計算のための.bamファイルへのインターフェースを提供するコマンド群。 インストール 依存 Requires: samtools (> 1.x) numpy pysam pandas…

ONTのロングリードからコンセンサス配列を作成するlamassemble

多くの遺伝的/ゲノム障害は、ゲノムのリアレンジメントによって引き起こされる。標準的な方法では、多くの場合、これらの変異を部分的にしか特徴づけることができない(例えば、コピー数変化やブレークポイント)。リアレンジメントの病原性を知るためには…

ロングリードのマルチプルシーケンスアラインメントを行う abPOA (POAのSIMD実装拡張)

マルチプルシーケンスアラインメント(MSA)問題を解決するために、Leeら(2002)によって最初に導入されたのがPartial order alignment(POA)である。POAでは、MSAをdirected acyclic graph(DAG)(有向無閉路グラフ)として表現し、動的計画法(wiki)(…

haplotype-awareなVCFのアノテーションを行う BCFtools/csq

シーケンシングされたエクソームおよび全ゲノムサンプルの数が急速に増加しており、最も関心のあるバリアントの膨大な量のデータを迅速に選別できることが重要になっている。このプロセスの重要なステップは、シーケンスバリアントを取得し、機能効果のアノ…

マッピングからコンセンサス配列を出力するbcftoolsのconsensusコマンド

2019 8/5 bcftools help追加 2019 8/30追記 2019 11/11追記 2020 3/20 bowtiee2コマンド修正 2021 5/24 dockerhubのイメージへのリンク追加 変異株のリファレンスをゲノムに当て、その個体についてコンセンサス配列を作成したいことがある。 これはbcftools…

マルチプルアラインメント結果からコンセンサス配列を出力するEMBOSSのconsコマンド

2020 9/25 help修正 タイトルの通りのコマンド。 HP EMBOSS: cons インストール macos10.12の miniconda3-4.3.21環境でテストした。 condaやbrewで導入できる。 #bioconda (link) conda install -c bioconda -y emboss #homebrew brew install emboss > cons…

Virusの ultra deep NGSのbamからコンセンサス配列を出力する ConsensusFixer

2019 5/14リンク追加 2019 5/30 インストール追記 ConsensusFixerはjavaコマンドラインアプリケーション。virusのウルトラディープNGSのアライメント(インフレーム挿入とあいまいなヌクレオチドを含む)からコンセンサスシーケンスを計算、出力する。Europe…

Pacbioのpolishingツール Quiver / ArrowとバリアントコーラーPlurality

Quiverは、Pacbioがテンプレートリードを前提として、最大準尤度テンプレートシーケンスを見つける、より洗練されたアルゴリズムである。 PacBioのリードは、テンプレートシーケンスを指定してリードの準尤度をスコア付けする条件付きランダムフィールドアプ…