macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

download

シンプルなSRA検索webサイト SRA Explorer

DDBJ、EMBL-EBI、NCBIのSRAの 検索エンジンは情報が多く、簡単にシーケンスデータを取ってくるにはやや使いにくい。ExplorerはSRAの検索ツール。Phil Ewels さんが作成されたwebツールで、SRAのAPIを使い、高速にSRAのデータを検索する。シンプルなインター…

アライメントフリーでk-merデータベースから高速にバリアントを検出する FastGT

ゲノム変異の研究には、次世代シーケンシング(NGS)技術が広く使用されている。ヒトゲノムの変異は、通常、配列決定されたリードをマッピングし、次いでgenotypeのコールを行うことによって検出される(論文より ref.1-4)。標準的なパイプラインでは、rawシ…

NCBIからvirusゲノムをダウンロードする

Accession IDを使い、virusのゲノム配列(FASTA)をダウンロードする。 NCBIのvirus Genomesに移動する。 左下の方の"Accession list of all viral genomes"をクリックしてvirusのリストをダウンロードする。 このようなリストが入手できる。 user$ head taxid…

マルチプルシーケンスアラインメントを行うMAFFT

2019 6/13 説明及びインストール追記 2019 6/21 コマンド微修正 2019 7/3 説明修正 2019 7/15 help追記 2019 9/29 twitter追加 2019 11/4 関連追加 2019 11/13 誤字修正 2020 4/15 タイトル修正 MAFFT開発秘話。私が4回生で宮田研に加わった時、まず手動で多…

NCBIからバクテリアゲノムをダウンロードする

コンプリートなゲノムのダウンロード。 wget ftp://ftp.ncbi.nlm.nih.gov/genomes/genbank/bacteria/assembly_summary.txt awk -F '\t' '{if($12=="Complete Genome") print $20}' assembly_summary.txt > assembly_summary_complete_genomes.txtmkdir bacte…