macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

2019

ヌクレオチド配列をアセンブリグラフにアラインメントする SPAligner

ゲノムアセンブリのグラフベースの表現は、最近では遺伝子検索からハプロタイプ分離まで、さまざまなアプリケーションで利用されている。これらのアプリケーションの多くは、アセンブリグラフへの配列のアラインメントに基づいているが、このようなアライン…

GFAのインタラクティブな可視化ツール GfaViz

The graphical fragment assembly (GFA) フォーマットは、シーケンスグラフを表現するための新しい標準フォーマットである。GFA 1は主にアセンブリグラフを対象としていたが、新しい GFA 2 フォーマットはいくつかの機能を導入しており、scaffoldingグラフ、…

種名を指定するだけで自動で系統推定を実行する PhySpeTree

2020 7/6 追記 系統樹は進化関係の推論に広く用いられている。既存のソフトウェアやアルゴリズムでは、主に系統樹の推論が中心となっている。しかし、非常に大規模な配列の処理や、複数のソフトウェアを接続するためのconfigureファイルの作成など、中間的な…

インタラクティブなオンラインの系統樹ツール Interactive Tree Of Life (iTOL) v4

2020 7/2 誤字修正 系統樹は、生物学やその他の科学分野において重要なツールであり、様々なデータタイプのコンテキスト化としても機能している。このことは、このような系統樹を作成するためのツールが頻繁に使われていることからもわかる(MEGA, (ref.2))。…

高速かつメモリ使用量の少ないポリッシングツール POLCA

2020 6/29 インストール手順修正 Pacific Biosciences(PacBio)によるSingle Molecule Real Time(SMRT)シーケンスや、Oxford Nanopore Technologies(ONT)によるnanoporeシーケンスなどの第3世代シーケンスプラットフォームは、数キロベースからメガベー…

ゲノムスケッチを用いて迅速にコホートサンプルの関連性を推定する somalier

複数の空間的または縦断的生検から得られたシーケンシングデータを解釈する際には、サンプルのmix upを検出することが不可欠であるが、生殖細胞変異の研究よりも困難である。腫瘍のほとんどのゲノム研究では、遺伝的変異は腫瘍とサンプル提供者の正常組織の…

IslandCafe

細菌ゲノムの進化を推進する進化の力の一つは、horizontal gene transfer(HGT)による遺伝子群の獲得である。これらのゲノムアイランドは、抗生物質を阻止する能力、病原性または超病原性になる能力、または新規の代謝形質を獲得する能力などのような、レシ…

ウイルス性因子をゲノムから探索する VFDBデータベースのVFanalyzer

ウイルス性因子データベース(VFDB、http://www.mgc.ac.cn/VFs/)は、細菌の病原性を解読するための包括的なアーカイブとオンラインプラットフォームを研究者に提供することに専念している。ウイルス性因子(VF)の様々な組み合わせ、組織、および発現は、病…

cloudSPAdes

2020 6/6コマンド修正 ロングリードシーケンシング技術(Pacific BiosciencesおよびOxford Nanoporesによって開発された)は、ショートリードシーケンシング技術と比較して改良されたアセンブリをもたらした。しかしながら、それらの応用、特にメタゲノミク…

Iontorrentのエラーコレクションを行う IonHammer

IonTorrentのリードエラー修正アルゴリズムを用いて、幅広いデータセットのシーケンシングエラーを大幅に削減することができる。IonHammerはC++で実装されており、SPAdesゲノムアセンブラパッケージの一部として自由に利用できる。 インストール mac os 10.1…

全ゲノムプロットをインタラクティブに作成するShinyアプケーション shinyChromosome

2020 5/14 フィーチャー => 観測値に変更 全ゲノムの非環状プロットは、全染色体に沿って配列されたゲノムデータを自然に表現したものである。現在のところ、非環状の全ゲノム図を作成するために設計された専用のグラフィカル・ユーザー・インターフェース(…

DEICODE

β多様性とは、生物群集間の分類学的または系統的構成の違いを表す生態学的な概念である。β多様性法は、多くのマイクロバイオーム統計解析パイプラインの主要なコンポーネントとなっている。これらの分析により、複雑な微生物群集の概要を把握し、微生物群集…

シーケンシングリードの前処理を行う AUSPP

ショートリードをリファレンスゲノム/配列にマッピングできるショートリードアライナーは多数あり、それらのほとんどはFASTQファイルを入力クエリファイルとして直接受け入れることができる。ただし、通常、生データは前処理する必要がある。さまざまな次世…

超高速な配列検索エンジン BIGSI

2020 4/30 追記 グローバルアーカイブには、未処理の細菌およびウイルスのゲノム配列データが指数関数的に増加している。これらのデータに配列検索用語を検索する機能があれば、基礎研究はもちろん、リアルタイムのゲノム疫学やサーベイランスなどのアプリケ…

バリアントコールのVCFを可視化する VIVA

次世代シーケンシングにより、膨大な量のゲノムデータが生成される。ゲノム情報の量は、研究によって異なる。バリアント検出プロセスでは、さまざまな種類のファイル形式が生成される。シーケンス解析で一般的に使用されるファイル形式の1つは、バリアントコ…

ガン変異のCoMut plotを出力する CoMutPlotter

CoMut plotは、ガン研究のpublicationsで、ガンコホートにおける突然変異の分布を視覚的に要約したものとして広く使用されている。この要約プロットは、遺伝子変異率とサンプルの変異負担を関連する臨床的詳細とともに調べることができ、サンプル間の遺伝子…

ビニングツール MetaBMF

メタゲノミクスは、ヒトの消化管などの生態系における微生物ゲノムを研究する。次世代シーケンシング技術を用いてシーケンスされた、異なる微生物種間の新規微生物種の同定およびそれらの分布変動の定量化は、ほとんどのメタゲノム研究の成功への鍵を握って…

ShinyCNV(立ち上げだけ紹介)

体細胞コピー数変化(CNV)は、ガンの開始、進行および再発において重要である(Caren et al、2010;Mullighan et al、2007;Mullighan et al、2009;Weir et al、2007)。ガンゲノム研究において、高密度一塩基多型(SNP)アレイは、従来の細胞遺伝学的カリ…

vcfをmafに変換する vcf2maf

2020 4/17 画面表示バグ修正, インストール手順修正 vcf2mafはVCFをMutation Annotation Format (MAF)に変換し、各バリアントがすべての可能な遺伝子アイソフォームのうちの1つだけにアノテーションする。VCFをMAFに変換するためには、各バリアントはそれが…

シーケンシング技術と解析フローチャートを学ぶためのナリッジベース SequencEnG

次世代シークエンシング(NGS)技術は、ゲノムおよびエピゲノムプロファイルを生成するための強力な方法を提供することで、生物医学研究に革命をもたらしている。この急速な進歩により、学生や研究者にとって、利用可能な数多くの方法を熟知しておくことが喫…

ショートタンデムリピートと隣接する変異をgenotypingする ExpansionHunter

ショートタンデムリピート(STR)はヒトゲノム全体に遍在している。STRの生物学に関する我々の理解はまだ完全には程遠いが、新たな証拠は、STRが基本的な細胞プロセスにおいて重要な役割を果たしていることを示唆している(Gymrek et al、2016; Hannan、2018)…

植物遺伝子のファミリー分類とエンリッチメント解析を行うwebサービス GenFam

ハイスループットシーケンシング(HTS)技術を用いたゲノムスケールの研究では、様々な実験条件で発現が異なる遺伝子のリストが作成されている。これらの遺伝子リストは、下流の機能的遺伝学的解析を導くために、生物学的に関連する遺伝子と関連する機能を絞…

tumorサンプルのテロメアリピート数を推定する telomerehunter

2020 4/20 誤字修正 テロメアは、真核生物の染色体の末端にある核タンパク質の複合体である。ヒトでは、テロメアDNAは主にノンコーディングのt型(TTAGGG)リピートで構成されているが、c型(TCAGGG)、g型(TGAGGG)、j型(TTGGGG)リピートで構成されています。し…

オルガネラゲノムをターゲットアセンブリする NOVOPlasty

次世代シークエンシング(NGS)技術の進化により、様々なアセンブルアルゴリズムが開発されてきたが、オルガネラゲノムのアセンブルに焦点を当てたものはほとんどない。これらのゲノムは、系統研究や食品の同定に利用されており、GenBankに登録されている真…

パンゲノムグラフから微生物の多様性を調べる PPanGGOLiN

2020 4/10 引用追加、タイトル修正 機能研究、進化研究、疫学研究のために比較ゲノムを使用するには、与えられた種での発現の観点から遺伝子ファミリーを分類する方法が必要である。これらの方法は、通常、分割や最適なクラス数を推論するための多変量統計モ…

ゲノムから周期的なリピート配列を検出する SPADE

周期的に繰り返されるDNAやタンパク質要素は、ゲノムの進化、遺伝子制御、タンパク質複合体の形成、免疫を含む様々な重要な生物学的事象に関与している。特筆すべきは、現在使用されているZFNs、TALENs、CRISPRsなどのゲノム編集ツールも、すべて天然の生物…

第3世代ロングリードを使ってアセンブリのギャップを閉じる TGS-GapCloser

ゲノムシーケンシング技術の開発は、この10年間でコストの削減とムーアの法則を超えるスピードでスループットを向上させてきた[ref.1]。遺伝子配列データベースは飛躍的に充実し、細菌や真菌の小さなゲノムから真核生物の大きなゲノムへと焦点が移っている。…

ラップトップでも軽快に動作するゲノム比較ツール bindash

ゲノム(メタゲノムを含む)の数は加速的に増加している。 近い将来、数百万のゲノム間のペアワイズ距離を推定する必要があるかもしれない。 クラウドコンピューティングを使用しても、そのような推定を実行できるソフトウェアはほとんどない。マルチスレッ…

ノイズの多いロングリードからリピートを探す Noise Cancelling Repeat Finder

間違って2回Noise Cancelling Repeat Finderのインストールについて投稿してしまいました。申し訳ありません。 タンデムDNAリピートはロングリード技術でシーケンスできるが、これらの技術の高いエラー率を考慮した計算ツールがないため、正確に解読できな…

オルガネラゲノムをターゲットアセンブリする GetOrganelle

2020 3/9 コメント修正 2020 3/9 誤字修正 2020 3/24 実行例の間違い修正 2020 3/27 コマンド修正 オルガネラには、plastome およびmitogenomeとも呼ばれる、プラスチド(葉緑体および他の形態のプラスチドを含む)とミトコンドリアのゲノムが含まれている。…