読者です 読者をやめる 読者になる 読者になる

Rの基本的なコマンド 忘備録

オブジェクトはgenediffという名前とする。

 

nrow(genediff) #nrowは行数をカウント

[1] 796785

 

ncol(genediff) #ncolは列数をカウント

[1] 11

 

genediff$gene_id # ”data$列名” で参照したい列を取り出す。

 

table(genediff$gene_id) #要素の数をカウントするtable

#tableコマンドは要素の数を集計して表示してくれる。例えば日本、アメリカ、2国別の集計データでアメリカが何人表に載っているか調べたいなら

table(people$国籍)

結果は

アメリカ 8

上のように出力される。 複数の要素について集計することもできる。これはとんでもなく実用的。

table(people$国籍,性別)

 日本 アメリカ

男 3 5

女 7 3

つまり行列形式で出力される。

 

1行目、1列目の情報を表示するなら

rownames(genediff) #rownamesは行名を表示

colnames(genediff) #colnamesは列名を表示 

 

 

 

変数の型

is.character(genediff) #is.characterでgenediffが文字列型ならTRUE

is.numeric(genediff) #is.numericでgenediffが数字型ならTRUE

 

length(genediff) #ベクトルの長さを調べるlength

mean(genediff) #meanが平均

このデータでは "引数は数値でも論理値でもありません。NA 値を返します" というエラーがでる。

max(genediff) #maxで最大値

min(genediff) #minで最小値

sum(genediff) #sumで合計値

median(genediff) #medianで中央値

この4つも純粋に数値だけのオブジェクトでないとエラーが出る。