macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

NCBIからmitochondria DNAをダウンロードする。

 

NCBIのOrganelle Genome Resourcesでは、オルガネラゲノム配列をダウンロードできます。ミトコンドリアDNAのfastaファイルをダウンロードしてみます。

 

NCBIのOrganelle Genome Resourcesにアクセスする。https://www.ncbi.nlm.nih.gov/genome/organelle/

左端のRefseq release of mitochondrial sequencesを選択する。

 

リンク先は、refseq/release/のhttps://ftp.ncbi.nlm.nih.gov/refseq/release/のmitochondrionになっている。plastidやplasmidも選べる。

https://ftp.ncbi.nlm.nih.gov/refseq/release/mitochondrion/

Refseq release of mitochondrial sequencesからはRefseq のmitochondrial DNA配列を固めたファイル(1.1と2.1)をダウンロードできる。2022年7月16日アクセス時は、1.1に合計7809配列、2.1に合計5896配列あった。

 

ちなみにgenbankのほうには無い。

https://ftp.ncbi.nlm.nih.gov/genbank/

https://ftp.ncbi.nlm.nih.gov/genomes/genbank/

GenBankゲノムとRefSeqゲノム両方を含むallにもない。

 

 

Browse by Organismからは登録されている配列を絞り込み検索できる。

あまり充実していないが、メタデータをまとめてダウンロードできるためにも使える。

 

右端のOrganellesを選択。2022年7月現在では24433個ヒットする。

 

mitochondrionはrefseq releaseより多い14,922ヒットする。chloroplast、chromatophore、cyanelle、 kinetoplast、apicoplast、plastidも選べる。

 

mitochondrionでFungiだけに限定すると1129見つかる。

さらにSubgroupで絞ることができる。

 

metaddataはダウンロードできる。

サイズ、GC含量、宿主の種名と分類、アクセッション番号などが載っている。FTPリンクはない。

 

参考

Genomes Download (FTP) FAQ

https://www.ncbi.nlm.nih.gov/genome/doc/ftpfaq/

 

関連