オブジェクトはgenediffという名前とする。
nrow(genediff) #nrowは行数をカウント
[1] 796785
ncol(genediff) #ncolは列数をカウント
[1] 11
genediff$gene_id # ”data$列名” で参照したい列を取り出す。
table(genediff$gene_id) #要素の数をカウントするtable
#tableコマンドは要素の数を集計して表示してくれる。例えば日本、アメリカ、2国別の集計データでアメリカが何人表に載っているか調べたいなら
table(people$国籍)
結果は
アメリカ 8
上のように出力される。 複数の要素について集計することもできる。これはとんでもなく実用的。
table(people$国籍,性別)
日本 アメリカ
男 3 5
女 7 3
つまり行列形式で出力される。
1行目、1列目の情報を表示するなら
rownames(genediff) #rownamesは行名を表示
colnames(genediff) #colnamesは列名を表示
変数の型
is.character(genediff) #is.characterでgenediffが文字列型ならTRUE
is.numeric(genediff) #is.numericでgenediffが数字型ならTRUE
length(genediff) #ベクトルの長さを調べるlength
mean(genediff) #meanが平均
このデータでは "引数は数値でも論理値でもありません。NA 値を返します" というエラーがでる。
max(genediff) #maxで最大値
min(genediff) #minで最小値
sum(genediff) #sumで合計値
median(genediff) #medianで中央値
この4つも純粋に数値だけのオブジェクトでないとエラーが出る。