macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

Bioinformatics

GFAのインタラクティブな可視化ツール GfaViz

The graphical fragment assembly (GFA) フォーマットは、シーケンスグラフを表現するための新しい標準フォーマットである。GFA 1は主にアセンブリグラフを対象としていたが、新しい GFA 2 フォーマットはいくつかの機能を導入しており、scaffoldingグラフ、…

インタラクティブなオンラインの系統樹ツール Interactive Tree Of Life (iTOL) v4

2020 7/2 誤字修正 系統樹は、生物学やその他の科学分野において重要なツールであり、様々なデータタイプのコンテキスト化としても機能している。このことは、このような系統樹を作成するためのツールが頻繁に使われていることからもわかる(MEGA, (ref.2))。…

GO enrichmet解析結果を視覚化する GOplot

オミクスデータの機能分析に利用できる方法が多すぎるにもかかわらず、結果の包括的なまだ詳細な理解を得ることは困難なままになっている。これは主に、この種の情報を視覚化するための公開ツールが不足しているためである。ここでは、グラフィック表示を強…

rRNA配列を探索し、分類、ツリー表示するSILVAのACTサービス

2020 6/19 説明追加 相同配列の解析では、マルチプルシーケンスアラインメント(MSA)の計算がボトルネックになっている。特にリボソームRNA(rRNA)のようなマーカー遺伝子の場合、数百万の配列がすでに公開されており、個々の研究で数十万の新しい配列を簡…

cloudSPAdes

2020 6/6コマンド修正 ロングリードシーケンシング技術(Pacific BiosciencesおよびOxford Nanoporesによって開発された)は、ショートリードシーケンシング技術と比較して改良されたアセンブリをもたらした。しかしながら、それらの応用、特にメタゲノミク…

メタゲノムのビニング後の解析を行う自動化されたパイプライン MetaSanity

2020 5/29 構成を修正、タイトル変更 2020 6/1 コマンド修正 マイクロバイオーム研究の重要性はますます一般的になっており、さまざまな生態系(例:海洋、構築、宿主関連など)を理解するために不可欠である。研究者は、微生物ゲノムの分析のため、高度に再…

VCFのSVコールをロングリードでジェノタイピングする SVJedi

構造変異(SV)の研究は急速に拡大している。その結果、第三世代シークエンシング技術のおかげで、特にヒトゲノムにおいて発見されたSVの数が増加している。同時に、臨床診断のようないくつかのアプリケーションでは、新たにシーケンシングされた個体を、よ…

CRISPR/Cas9編集後のアンプリコンシークエンシングからindelのレポートを生成する CRISPR-DAV

CRISPR/Cas9システムの簡便さと精度の高さは、遺伝子編集の新時代をもたらした。CRISPRを介在させたゲノム編集を用いた目的のクローンのスクリーニングは、その多重化により次世代シークエンシング(NGS)によって可能になった。ここでは、CRISPR NGSデータ…

メタゲノムデータからウィルスゲノムをアセンブルする metaviralSPAdes

2020 5/25 タイトル修正 現在知られているウイルスのセットは着実に拡大しているが、これまでのところ、地球上のウイルスのごく一部しかシークエンシングされていない。ショットガンメタゲノムシークエンシングは、新しいウイルスを明らかにする機会を提供す…

k-merカウンタ DSK

DNA/RNAシーケンシングのリード中のすべてのk-mer(長さkの部分文字列)をカウントすることは、多くのバイオインフォマティクスアプリケーションの前段階である。しかし、最新のk-merカウント方法では、大きなデータ構造がメモリ内に存在する必要がある。こ…

ゲノムの中の関心がある遺伝子を視覚化する Gcluster

2020 5/27 コメント追加 2020 5/28 -mオプション追記 遺伝子、遺伝子クラスター、およびその近傍のゲノムコンテクストを比較することは、遺伝子の機能や微生物の進化の基盤を決定する上で非常に重要である。現在のところ、多数のゲノムのゲノムコンテクスト…

効率的なVCFの圧縮器と関連ツールを提供する genozip

大規模なゲノムプロジェクトはますます一般的になりつつあり、その結果、数千もの個々のゲノムデータセットからなるVCF(Variant Call Format; (Danecek et al., 2011))ファイルが作成される。圧縮された形式であっても、このようなファイルは非常に大きく(…

アセンブリグラフからメタゲノムのビニングを行う GraphBin

メタゲノミクスの分野では、微生物群集の構造、多様性、生態についての貴重な知見が得られている。メタゲノム解析の重要なステップの1つは、長いコンティグにリードをアセンブリし、メタゲノムサンプル中に存在する異なる種に属するコンティグのグループにビ…

illumina、BGIのシーケンシングリードの前処理を行う Ktrim

次世代シーケンシング(NGS)データは、品質の悪いサイクルやアダプター汚染に悩まされることが多いため、下流での解析の前に前処理を行う必要がある。最新のシーケンサーのスループットとリードの長さはますます増大しており、前処理のステップは、現在のツ…

ゲノムのマッピング可能性を調べる GenMap

ゲノムの各位置のk-merの一意性(uniqueness)を計算することは、最大e個のミスマッチを許容しながら計算することが困難である。しかし、CRISPR実験のためのガイドRNAの設計など、多くの生物学的応用には不可欠である。より正式には、一意性または(k, e)マッ…

 シーケンスロゴを作成するpython API Logomaker

シーケンスロゴは、DNA、RNA、タンパク質の配列の生物学的特性を視覚的に説得力のある方法で説明するが、Pythonプログラミング環境内でそのようなロゴを生成してカスタマイズすることは現在のところ困難である。ここでは、公開品質のシーケンスロゴを作成す…

(ヒトゲノム)インタラクティブな遺伝子の変異プロットを出力する G3viz

ロリポップダイアグラム は、ガンゲノミクスにおける遺伝子変異のトランスレーショナル効果を可視化し、探索するために広く用いられているグラフィカルな表現の一つである。しかし、使いやすい機能を備えたロリポップダイアグラムツールはまだ不足している。…

ビニングツール MetaBMF

メタゲノミクスは、ヒトの消化管などの生態系における微生物ゲノムを研究する。次世代シーケンシング技術を用いてシーケンスされた、異なる微生物種間の新規微生物種の同定およびそれらの分布変動の定量化は、ほとんどのメタゲノム研究の成功への鍵を握って…

ShinyCNV(立ち上げだけ紹介)

体細胞コピー数変化(CNV)は、ガンの開始、進行および再発において重要である(Caren et al、2010;Mullighan et al、2007;Mullighan et al、2009;Weir et al、2007)。ガンゲノム研究において、高密度一塩基多型(SNP)アレイは、従来の細胞遺伝学的カリ…

シーケンシング技術と解析フローチャートを学ぶためのナリッジベース SequencEnG

次世代シークエンシング(NGS)技術は、ゲノムおよびエピゲノムプロファイルを生成するための強力な方法を提供することで、生物医学研究に革命をもたらしている。この急速な進歩により、学生や研究者にとって、利用可能な数多くの方法を熟知しておくことが喫…

ショートタンデムリピートと隣接する変異をgenotypingする ExpansionHunter

ショートタンデムリピート(STR)はヒトゲノム全体に遍在している。STRの生物学に関する我々の理解はまだ完全には程遠いが、新たな証拠は、STRが基本的な細胞プロセスにおいて重要な役割を果たしていることを示唆している(Gymrek et al、2016; Hannan、2018)…

全工程が自動化された高速なRNA seq解析webサービス RaNA-Seq(60以上のモデル生物に対応)

2020 4/10 タイトル修正、説明と図追加 RaNA-Seqは、RNA-Seqデータを迅速に解析・可視化するためのクラウドプラットフォームである。FASTQファイルの定量、品質管理指標の計算、発現変動遺伝子の解析の実行、機能解析による結果の説明を可能にすることで、数…

SRAなどのシーケンシングデータを一括ダウンロードする grabseqs

2020 4/1 タイトル修正、誤字修正 ハイスループットシーケンシングは、生物学的な疑問を解決するための強力な技術である。Grabseqsは、Sequence Read Archive(SRA)、Metagenomics Rapid Annotation through Subsystems Technology(MG-RAST)サーバー、iMi…

ラップトップでも軽快に動作するゲノム比較ツール bindash

ゲノム(メタゲノムを含む)の数は加速的に増加している。 近い将来、数百万のゲノム間のペアワイズ距離を推定する必要があるかもしれない。 クラウドコンピューティングを使用しても、そのような推定を実行できるソフトウェアはほとんどない。マルチスレッ…

Bandageを使ってアセンブリグラフからターゲットの配列を選抜する

2020 3/12 写真差し替え、誤字修正、タイトル修正 De novoアセンブルして得たcontig配列から特定の配列を選抜するにはどうすれば良いだろうか?全ゲノムのショットガンシーケンシングを行なっていても、目的の配列はそのサブセットでしかないことは頻繁にあ…

ノイズの多いロングリードからリピートを探す Noise Cancelling Repeat Finder

間違って2回Noise Cancelling Repeat Finderのインストールについて投稿してしまいました。申し訳ありません。 タンデムDNAリピートはロングリード技術でシーケンスできるが、これらの技術の高いエラー率を考慮した計算ツールがないため、正確に解読できな…

ロングリードのアセンブリをpolishする NextPolish

ロングリードシーケンシング技術は長い連続性を持つゲノムを生成できるが、エラー率が高くなる。 そこで、長いリードでアセンブリされたゲノムの配列エラーを効率的に修正するツールであるNextPolishを開発した。 この新しいツールは、高品質のショートリー…

アセンブリ結果を評価するwebサービス gVolante

全ゲノムやトランスクリプトームなどの包括的な配列情報へのアクセスが増加するとともに、それらの品質を評価する必要性が高まっている。N50などのシーケンス長に基づくメトリックが標準になったが、これはアセンブリ品質の1つの側面のみを評価する。逆に、…

インタラクティブなヒートマップを描く heatmaply

2020 2/29 誤字修正 クラスターヒートマップは、高次元のデータを視覚化するための一般的なグラフィカルな方法である。その中で、数値のテーブルは、色付きセルのタイル状のマトリックスとしてスケーリングおよびエンコードされる。マトリックスの行と列は、…

HMMを使ったKEGG IDsアノテーションwebサービス KofamKOALA

KofamKOALAは、事前に計算された適応スコアしきい値を持つプロファイル隠れマルコフモデル(KOfam)のデータベースに対する相同性検索により、KEGGオーソログ(KO)をタンパク質配列に割り当てるWebサーバである。 KofamKOALAは、既存のKO assignmentツール…