読者です 読者をやめる 読者になる 読者になる

駄文型

プログラミングとか英語とかの話題を中心にした至極ちゃらんぽらんな日記です。

R/RStudioに関するメモ 基本編

技術っぽいもの 統計

koheikimura.hatenablog.com

前回の続き的なやつ。検定編的なやつもやるかもしらないしやらないかもしれない。

ファイルの読み込み

  • Import Dataset → From Local File...
  • csvの一行目にタイトルを入れておくと使いやすい
  • 読み込んだらファイル名で呼び出しできる
    • データセットというらしい
    • data.csvが↓の場合、data$SecでSecの列を呼び出せる
No.,Title,Sec
1,ttttt,20
2,yyyyyyy,7
3,hhh,12

sum関数

合計値のほか、条件に一致する要素のカウントもできる。

# Titleが”ttttt”の行の個数を返す
sum(data$Title == "ttttt")

subset関数

データセットから特定の要素を切り出すことができる。

# データセットからTitleが”ttttt”に一致する行のSecの平均を求める
subt <- subset(data, Title == "ttttt")
mean(subt$Sec)

プロット関数

# 棒グラフ
barplot(c(data$Old, data$New), names = c("Old ver.", "New ver.")

# 箱ひげ図(外れ値を表示しない)
boxplot(data$Old, data$New, outlin = F)

# ヒストグラム(2つのデータを重ねて表示)
hist(data$Old, col = "0000ff50", breaks = "Scott")              # 青、不透明度50
hist(data$New, col = "ff000050", breaks = "Scott", add = T)     # 赤、不透明度50

データサイエンティスト養成読本 [ビッグデータ時代のビジネスを支えるデータ分析力が身につく! ] (Software Design plus)

データサイエンティスト養成読本 [ビッグデータ時代のビジネスを支えるデータ分析力が身につく! ] (Software Design plus)

RStudioではじめるRプログラミング入門

RStudioではじめるRプログラミング入門

あわせてどうぞ

広告を非表示にする