macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

インフォマティクス解析をサポートするツール

SRAのRNA seqデータを素早く比較・分析する Digital expression explorer 2(手持ちのデータにも対応)

10年前の最初の記述以来、RNAシーケンス(RNA-seq)はトランスクリプトームにおける強力な方法となり、非常に正確な遺伝子発現の定量を可能にした[ref.1]。シークエンシングのコストが下がるにつれて、RNA seqのデータは科学文献でより一般的になりつつある…

教育にも利用できる、何百ものバイオインフォマティクスツールが入った包括的コンテナ環境 ORCA

2019 4/25 誤字修正 効果的なバイオインフォマティクス分析のための適切なプラットフォームを設定することは困難な場合がある。標準のソフトウェアパッケージをインストールするために必要な依存関係とバージョン要件を決定することは、分析を始める前の障壁…

SRA Toolkitのfasta-dumpを高速化した fasterq-dump

2019 4/29 複数ファイルダウンロード例 タイトルの通りのコマンド。 使い方だけ簡単に紹介します。 fasterq-dumpに関するツイート worked all day on a bash scrip to fetch & convert all European and African @1000genomes SRA files. <for i in *.sra ; do fasterq-dump $i -O ./ -t $home/Desktop/fasterqdumptempfiles -e 12 -S -p ; done > mac is smoking no</for>…

コンソールでbamのカバレッジを素早く確認できる bamcov

bamcovは、Florian Breitwieserさん(Github)が公開されている、bamのカバレッジを計算してコンソール上で表示するユーティリティ。 インストール macps10.14でテストした。 Github git clone --recurse-submodules https://github.com/fbreitwieser/bamcov…

データを可視化するwebツール PlotsOfData

2019 4/11 twitterリンク追記 近年、いくつかのグループが、データの要約ではなく実際のデータをグラフで表示することを提唱している[ref.1-4]。生データは、ヒストグラムやドットプロットなど、さまざまな方法で視覚化できる。データ解釈を補助するにはデー…

グラフィック出力が利用できない環境で頻度分布を素早く確認できる bashplotlib

bashplotlibは、端末で基本的なプロットを作成するためのpythonパッケージおよびコマンドラインツール。 GUIがない場合にデータを視覚化する簡単な方法を提供する。pythonでコーディングされており、pipを使って素早くインストールできる。 特徴(githubより…

SRA Toolkitのfastq-dumpを並列実行して高速化する parallel-fastq-dump

NCBIのfastq-dumpはリソース(ネットワーク、IO、CPU)が速くても、時には非常に遅くなることがある(Githubのprotipを参照)。 fastq-dumpにはsraファイルの特定の範囲を照会するオプション(-Nと-X)があるため、このツールparallel-fastq-dumpは作業を要…

バイオインフォマティクスのツールを再現性よく実行するためのコンテナ仮想化ツール群 BioContainers

2018 10/2 誤字修正 2018 11/4 追記 2019 6/2 リンク追加 バイオインフォマティクスは、新しいアルゴリズムの開発、複雑なパイプラインへの様々なツールの接続(Perez-Riverol et al、2014)、それらの蓄積と普及により、システム生物学の機能と振る舞いの理…

Dockerイメージをリバースエンジニアリングする Whaler

ブログで開発の動機は説明されています。 Reversing Docker Images into Dockerfiles https://samaritan.ai/blog/reversing-docker-images-into-dockerfiles/ インストール mac os10.13のgo version go1.11 darwin/amd64でビルドした。 Go言語がないなら先に…

高速な端末エミュレータ Alacritty

AlacrittyはRustで書かれたGPUをレンダリングに使う高速な端末エミュレータ。OpenGL(wiki)を使ってレンダリングを行う。開発はまだアルファ段階らしいが、すでに色々なプラットフォームに対応している(windowsはこれかららしい)。開発の大きな動機は、WU…

データに適したグラフフォーマットとその描画コードを教えてくれる From Data to Viz

From Data to Vizは、決定木(wiki)を使ってデータの可視化に適したフォーマットを教えてくれるwebサイト。 From Data to Vizに関するツイート。 From data to Viz | Find the graphic you need 下記の決定木を使い、自分の所有しているデータタイプに適し…

様々なインフォマティクスツールを簡単に実行できるサイバー環境 CyVerse

2019 1/10 追記 Cyberinfrastructureは、直訳するとサイバー空間のインフラとなる。計算科学の分野では大規模な計算化学の課題に対する解決策を提供するもの、というような意味で使われている(wiki)。CyVerseはこのCyberinfrastructureを提供する、様々な…

コマンドライン環境のゲノムブラウザ ASCIIGenome

2019 6/17 インストール追記 次世代シーケンシングデータの視覚化は、研究者が結果の質を評価し仮説を生成することを可能にするゲノミクスの基本的な部分である。したがって、ゲノムデータをブラウズするためのいくつかのプログラムは、ゲノミクスコミュニテ…