macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

GenBank Flat File FormatとJSON間の変換を行う GBSON

 

HPの解説より

 GenBank Flat File Format (.gb または .gbk) は、核酸やタンパク質の配列とそのアノテーションを保存できるファイルフォーマットとして広く利用されている。NIHの遺伝子配列データベース「GenBank」(https://www.ncbi.nlm.nih.gov/genbank/)と混同しないように。GeSeq などの多くのアプリケーションは、GenBank ファイルの読み書きが可能です。詳細なフォーマットの説明は、

https://www.insdc.org/submitting-standards/feature-table/

GenBank ファイル形式は基本的に人間が読めるテキストファイルであり、XMLCSV のようなメタフォ ーマットに基づくものではありません。そのため、GenBank ファイルを解析するための標準は存在しません。GenBank 固有のタブ、スペース、スラッシュの使用はエラーが起こりやすく、ほとんどのテキストエディタGenBank ファイルの構文強調表示やチェックをサポートしていない。開発者はしばしば、独自のGenBankエクスポート関数やパーサーさえも書かなければならない。
 JavaScript Object Notation (JSON) は、オープンスタンダードなファイルフォーマットで、人間が読めるテキストを使用して、属性と値のペアと配列データ型(またはその他のシリアライズ可能な値)からなるデータオブジェクトを転送します。非常に一般的なデータ形式であり、AJAXシステムにおけるXMLの代替など、多様な用途に利用されています。JSONは言語に依存しないデータ形式です。JavaScriptから派生したものですが、あらゆるプログラミング言語において、JSONパーサーが存在し、しばしば既に組み込まれています。
すでにJSONベースのアノテーションフォーマット/コンバーターは、すでにいくつか存在していますが、私たち(本著者ら)のアプローチは、検証、IDEサポート、曖昧さ回避を可能にする厳密な型定義(下記参照)を提供します。

Documentation

https://chlorobox.mpimp-golm.mpg.de/GBSON-Documentation.html

 

webサービス

https://chlorobox.mpimp-golm.mpg.de/GenBank-JSON-Converter.html#

 

GenBankJSON形式のファイルを指定する。

 

免責事項にチェックを付けてSubmitする。

結果は下のボタンからダウンロードできる。

 

引用

https://chlorobox.mpimp-golm.mpg.de/GenBank-JSON-Converter.html

 

関連


 

*しばらく家のネット回線が不調で更新が滞っていましたが、契約を変えてとりあえずは安定しました。お騒がせしました。