インフォマティクス解析をサポートするツール
PubTator 3.0(https://www.ncbi.nlm.nih.gov/research/pubtator3/)は、タンパク質、遺伝子バリアント、疾患、化学物質のような主要な概念の意味と関係性の検索を提供する最先端のAI技術を用いた生物医学文献リソースである。現在、約3600万件のPubMed abst…
遺伝子の機能予測は生物学の理解に不可欠である。しかし、これらの予測は、実験的に特徴付けられた遺伝子の大規模なコレクションに依存しており、そのコンパイルには労力と時間がかかるだけでなく、科学文献の量と多様性を考慮すると不可能に近い。ここでは…
ハイスループットシーケンス技術により、利用可能なシーケンスデータの量はかつてないほど爆発的に増加しており、それらは通常FASTAファイルやFASTQファイルとして保存されている。配列データを生物学的知識に変換する目的で、この種のファイルを処理・操作…
2023 5/30 タイトル修正 RNAシーケンスは、様々なRNAサブポピュレーションの発現に関する知識を得るために最も使用されるハイスループットなアプローチの1つとなっている。しかし、ライブラリー調製時やデータ解析時に発生する技術的なアーチファクトが、検…
memusgはプロセスのメモリ使用量をlinuxのタイムコマンドのように計測するツール。 timeと同様にプログラムの前に付けて使用する。 インストール Gihtub git clone https://github.com/jhclark/memusg.gitexport PATH=<path>/<to>/memusg:$PATH 実行方法 memusg sleep </to></path>…
citation geckoは、自分の研究において見逃している可能性がある文献を、引用のネットワークに可視化して発見を助けてくれるツールです。誰も引用していない論文は探せませんが、何度も引用されている自分の研究分野で影響力の強い論文を見つけることに適し…
Bio-protocol Exchangeは、Bio-protocolジャーナルの姉妹プラットフォームサイト。研究者がプロトコルを議論したり、実験手順を共有する場として公開されている。実験プロトコルだけのプレプリントサーバーとしても機能している。 from bioprotocolbyte :A n…
2023/04/13 ツイート追加 brenameはWindows、Mac OS X、Linuxをサポートする正規表現に対応したファイルのリネームツール。再帰的に複数の階層のファイルとディレクトリ(フォルダ)を同時にリネームしたり、一連のファイルを整数の通し番号にリネームするこ…
オミックス技術を臨床医学やトランスレーショナル・メディシンに取り入れる動きが加速する中、これらの手法によって生成される大規模かつ複雑なデータセットを利用するエンドユーザーには課題がある。ゲノミクスにおける特別な課題は、遺伝子の命名法が大規…
テロメア単位の完全なゲノムアセンブリは、解析の向上や新しいバリアントの発見を期待できるが、多くの重要なゲノムリソースは古いリファレンスゲノムと関連したままである。そのため、リファレンスゲノム間のゲノムフイーチャーやリードアラインメントをト…
分子生物学や細胞生物学の分野において、様々な機能要素を持つ生体配列を可視化することは、科学的成果を発表する上で基本的なことである。しかし、現在使用されているアプリケーションの限界により、生物学的な模式図の作成にはまだかなりの課題が残ってい…
近年の計算機アプローチや実験ワークフローの進歩により、ゲノムワイドな生物学的・ゲノムデータを比較的容易に、かつ一般的に取得することができるようになった。このハイスループット・データは、数百種類の植物のDNA(配列、メチル化、クロマチンアクセシ…
Githubより Grayskullはcondaのレシピを自動生成します。このプロジェクトの主な目的は、conda-forgeのための簡潔なレシピを生成することです。Grayskullプロジェクトは、最終的にconda skeletonを置き換えることを意図して作られています。現在、Grayskull…
2022/03/20 文章修正 2022/03/24アンケート結果追記 ご存じの通り、新しいmacはCPUがARMアーキテクチャに移行し、x86-64 darwin向けにコンパイルされたプログラムが実行できなくなりました(まだ販売されているintel macもありますが、選択肢は少なくなって…
レポジトリより Bioiconsは、InkscapeやAdobe Illustratorなどのベクターグラフィックソフトウェアを使った科学的なイラストのためのオープンソースアイコンライブラリで、無料で利用できます。 ベクターグラフィックソフトウェアでは、アイコンをダブルクリ…
2021 12/11 誤字修正 細胞生物学では,研究者は関連する論文を読み,記述されている実験や結果を検討することでウェットな実験を計画する。今日、研究者は実験を計画するために長い時間をかけて文献を調査している。 実験計画を加速するために、本著者らはLE…
UniqueKMERはfastaファイルのコンティグごとにユニークなk-merを生成する。ユニークなk-merは、あるコンティグにのみ存在し、他のコンティグには存在しないk-merキーで構成されている(順鎖、逆鎖の両方)。本ツールは、多数のコンティグで構成されたFASTAフ…
Helpより phyloTは、NCBI taxonomyまたはGenome Taxonomy Database(GTDb)に基づいて、系統樹を自動的に生成する。NCBI taxonomyは、様々なソースからの系統学的および分類学的知識を取り入れることを試みており、NCBIをソースとして使用しているphyloTが生…
gzip プログラムで作成したファイルを任意の場所で解凍することは、 DEFLATE 圧縮アルゴリズム(wiki)の性質上、原理的に不可能である。そのため、既存のプログラムでは、並列性を利用してgzipで圧縮された大きなファイルを高速に解凍することができない。…
オンラインツールの監視を容易にするウェブサービスとリポジトリAviatorを紹介する。Aviatorは、ユーザーフレンドリーなWebサイトと、文献調査をベースにした一般的なモジュールと、手動で精査したモジュールの2つのモジュールで構成されている。一般モジュ…
2022/04/26 追記 RプログラミングShinyパッケージを用いて開発されたWebベースのデータ解析・可視化ツールが研究者に提案されることが増えている。これらのツールは、様々な視点からデータを解析したり、インタラクティブな可視化を提供したりするのに便利で…
ゲノミクスの大規模データセットを利用するために、生物学者はデータの保存、処理、分析、アノテーション、可視化のための計算システムを必要としている。CyVerseのようなクラウドベースのサイエンスゲートウェイは、ストレージと解析ツールを提供するが、可…
2020 5/8 説明追加 Netdata は、システムやアプリケーションのパフォーマンスをリアルタイムで監視する監視エージェントである。Netdata を使うと、非常にインタラクティブな Web ダッシュボードを使用して、実行中のシステム (Web サーバ、データベース、ア…
2020 5/4 誤字修正 2020 5/5 リンク追加, 構成変更 Jupiter notebookの使い方を解説する記事の第2弾です(第一回はこちら)。今回はJupiter notebookがサポートしているMarkdown記法について説明します。Markdownはプレーンテキストの文書からマークアップ…
2020 5/2文章修正 2020 5/3 誤字修正 2020 5/4タイトル修正 2020 5/5 文章修正 2020 5/7 導入部分の文章と構成を変更 初心者向け解説記事第3弾の今回は、急速に普及が進んでいるjupyter notebookの導入と基礎的な使い方について説明します。Jupiter noteboo…
次世代シークエンシング(NGS)技術は、ゲノムおよびエピゲノムプロファイルを生成するための強力な方法を提供することで、生物医学研究に革命をもたらしている。この急速な進歩により、学生や研究者にとって、利用可能な数多くの方法を熟知しておくことが喫…
3/330 誤字修正、図を追記 2020 3/31 追記 2020 5/4 v2.0リリース追記 2020 5/12 統合TVのリンク追加 BioVinciのabout usより BioTuringは、若くてモチベーションが高いバイオインフォマティシャンで構成されたチームで、次世代のバイオインフォマティクス…
2020 3/8 コメント削除、タイトル修正 公共データベースで利用可能な微生物ゲノムの数は増え続けており、多くのin-silico分析、例えば 一塩基多型の検出、scaffolding、比較ゲノミクス、に必要なリファレンスゲノムの最適な選択がますます困難になってきてい…
生物学的実験はますます大きく、多面的なデータセットを生み出している。そのようなデータを探索して観察結果を伝達することはますます困難になっており、堅牢な科学的データ視覚化の必要性は加速している[ref.1、2、3、4]。特にWebベースのインタフェースや…
2020 1/25 タイトル修正、統合TVリンク追加 シーケンシングコストの劇的な低下により、個人や研究者グループが以前に研究されていない生物からゲノムまたはトランスクリプトーム配列を生成する多くの機会が生まれている。多くの研究の疑問には、小規模または…