2015
ハイスループット技術は、ゲノムワイドな遺伝子発現パターンの変化を読み解くための一般的なツールとなった。遺伝子発現パターンの機能解析は、生物学的知識の公開リポジトリにしばしばアクセスする必要があるため、困難な作業である。一方、多くの場合、研…
メタゲノム解析はここ数年、目覚しい発展を遂げた。今日、遺伝子配列決定の専門家だけでなく、他の専門分野の多くの研究室が、臨床サンプルや環境サンプルから得られたDNA配列を解析する必要がある。メタゲノム解析データの系統解析は、生物学者やバイオイン…
組換えは細菌において重要な進化の力であるが、ゲノムサンプルの祖先に起こった組み換えを再構築することは依然として困難である。本発表では、最尤推論を用いて細菌ゲノム中の組換えを検出し、系統樹の再構築に反映させるClonalFrameMLを紹介する。ClonalFr…
Genomicusは、真核生物の比較ゲノミクスに特化したデータベースおよびウェブサーバである。Genomicusの主な機能は、複数のゲノム間でのゲノムブロックの保存状態をグラフィカルに表現することであり、特定の遺伝子を中心とした局所的な保存状態や、核型比較…
export2graphlanは、GraPhlAn用の注釈ファイルとツリーファイルの両方を作成するための変換ソフトウェアツールである。特に、アノテーションファイルでは、どのノードが重要であるかを入力ファイルから自動的に導き出し、特定のサブツリーを強調しようとする…
最近のシーケンシング技術とアプリケーションの進歩は、次世代シーケンシング(NGS)のリードをリファレンスゲノムにアラインさせる方法(リードマッピング)の急速な成長につながっている。2015年半ばまでに、100種類近くのマッパーが利用可能になったが、…
同じパスウェイ、タンパク質複合体、または同じ環境条件で機能するタンパク質は、系統発生クレード全体で類似した配列保存パターンを示すことがある。特定のタンパク質複合体またはパスウェイをもはや必要としない種では、これらのタンパク質は、グループと…
次世代シークエンシング時代では、増え続ける生物学的配列やそのバリエーションを正確にアノテーションするための信頼性の高い、高速かつ効率的なアプローチが求められている。類似性検索に基づくアノテーションのtransferは、標準的なアプローチである。全…
全ゲノムシークエンスは、多くの生物の遺伝子コンテンツの調査を可能にし、遺伝子発現、プロテオミクス、エピジェネティクスのさらなる研究の基礎を形成している。新規ゲノムを構築した後、遺伝子のアノテーションを行うことが、生物の遺伝子内容を解析する…
オミクスデータの機能分析に利用できる方法が多すぎるにもかかわらず、結果の包括的なまだ詳細な理解を得ることは困難なままになっている。これは主に、この種の情報を視覚化するための公開ツールが不足しているためである。ここでは、グラフィック表示を強…
2020 4/30 文章修正、タイトル修正 2022/04/06 リンク修正 ハイスループット実験の出現により、研究者はしばしば多変量データに直面している。これらは、通常、行列として提示される。この種のデータは様々なソースから得られることがあり、例えば、特定の遺…
Contiguityは、de novoゲノムアセンブリの視覚化と操作のためのインタラクティブなソフトウェアである。 Contiguityは、コンティグの隣接関係に関する情報を作成して表示し、アセンブルされたコンティグとリファレンス配列との比較を同時に表示することで、…
2020 4/22 追記 2020 5/20 コード修正 ハイスループットシーケンシングとオミックス技術の進歩は、自然界に存在する微生物群集の研究に革命をもたらしている。微生物のライフスタイルを包括的に調査するためには、遺伝情報を対話的に整理して可視化し、複雑…
2020 3/12 写真差し替え、誤字修正、タイトル修正 De novoアセンブルして得たcontig配列から特定の配列を選抜するにはどうすれば良いだろうか?全ゲノムのショットガンシーケンシングを行なっていても、目的の配列はそのサブセットでしかないことは頻繁にあ…
2020 3/19 4/6 スクリプト修正、3/19 4/10 サンプル数が多い時のオプション追記、4/13 追記、5/11 リンク修正、5/25 わかりにくい文章を修正、roaryのランコマンド修正、インストール手順追記、5/27 コメント追加、6/7 ML法のコマンド追加,、proka並列ラン例…
2021 4/2 追記 2021 8/30 checkm tetra 追記 checkmのゲノムアセンブリ評価コマンドについて以前紹介した。 ここでは、タイトルの通りCheckMのplotコマンドについて簡単に紹介する。このコマンドはbinningして得た一連のbinned.fastaのディレクトリに対して…
遺伝子のエクソンやイントロンの組成や位置などの遺伝子の特徴を視覚化することにより、生物学者がアノテーションを統合し視覚的なプレゼンテーションを提供できるようになり、publication用の高品質な図の作成も支援される。したがって、FancyGene(Rambald…
簡潔で、繊細で正確な画像は、説明だけよりも大きな利点がある。さまざまな機能要素を備えた生物学的シーケンスのグラフィカルな表現は、分子生物学的機能の調査の過程で得られた科学的発見の効率的な導入と解釈のための基本である。現在、生物学者は主にMic…
2021 4/28 追記 シーケンシングデータからバリアントをコールする方法は、一塩基多型(SNP)を超えて、短い挿入および欠失(indels)、短いタンデムリピート(STR)、MNP、構造変異(SV)などがターゲットになってきている。これらの異なるクラスのバリアン…
近年、シーケンスの数が著しく増加している。これにより、データベース検索(ref.1〜4)がますます長くなり、無料のコンピューティングサービスと事前に計算されたデータベースが閉鎖に追い込まれたりまたは依存するようにクラウドソーシング(ref.5〜7)に…
UniRefデータベース (UniProt Reference Clusters) は、UniProtナレッジベースと選択されたUniParcレコード(UniParc link)からクラスター化されたシーケンスセットを提供し、複数の解像度(100%、90%、50%の同一性)でシーケンススペースを完全にカバー…
相同配列を見つけることは、機能転移によるタンパク質の機能的アノテーションを可能にし、これらの配列が共通の進化起源を有するために推論され、そして進化研究の支持としてしばしば使用される[ref.1−3]。ホモログ内では、オルソログは種分化事象から進…
注意 2019 6/24 追記 6/25 編集 すでに比較されているデータについては問題ありませんが、手持ちのmulti-fsstaをアップロードして調べる場合、シングルラインのfastaににしておかないとそれぞれのfastaの先頭行のみ使ってしまうようです。以下のperlスクリプ…
機能選択は、遺伝子の発見および機能的に検証されたアノテーションのための強力な技術を表す[ref.1、2]。この手法は、ランダムにクローニングされたゲノムDNAまたはメタゲノムDNAを、通常は短い(1〜3 kb)DNA断片として発現ベクターに組み込むことに依存し…
細菌と古細菌に感染するウイルスはこれまでにサンプリングされたあらゆるタイプのバイオームにありふれており、豊富に存在する。ウイルス - 宿主相互作用は地球化学的循環からヒトの健康まで生態系機能を変化させる(Fuhrman, 1999; Wommack & Colwell, 2000…
ゲノムのリピートのアノテーションは、利用可能なツールが数多くあり、すべてが性能や精度に関して分析されていないという理由から、挑戦的な課題である(Leret、2010)。転移因子(TE)を同定するための現在のアプローチは、ゲノムアセンブリ(Ellinghaus e…
2019 6/1 help追加、インストール追記 ロングリードシークエンシング技術はここ数年で急速に成熟し、ゲノムアセンブリへのロングリードの利点は欠かせないものになった[論文より ref.1]。最近、複数グループがエラーの多いロングリードから完全なバクテリア…
すべてのシーケンシング技術はある程度の不正確さを持っている。例えば、Illuminaプラットフォーム(Margulies et al、2005)は、 主に置換からなる1〜2%のエラー率を有し(Dohm et al、2008; Nakamura et al、2011)、PacBioプラットフォームは挿入および…
シーケンシングリードのリファレンスゲノムへのアライメントは、通常、ほとんどのゲノム解析の第一歩で歩い。しかし、全リードがリファレンスゲノムを正確に表していないため、シーケンシングリードをゲノム変異をまたいでリファレンスゲノムに戻すことは難…
2020 1/15 タイトル修正 人間の目にはデータの視覚的表現からパターンを識別する比類のない能力がある。高スループットシークエンシングからの突然変異の同定は大部分が自動化されているが、integrative genomics viewer(IGV; Robinson et al、2011)などの…