RStudioで正規性の確認

シャピロ-ウィルク(Shapiro-Wilk)の正規性の検定をやる流れ

まず以下のようなデータを用意する

ある音ゲーのスコア

これは音ゲーのスコアを表していてタイミングよく押せた場合はPERFECT, 早すぎたり遅すぎたりした場合はFAST, SLOWに計上される
この内ミスの割合が正規分布と見なせるか検定する

まず、CSVを右上のEnvironmentタブ => Import Datasetから読み込む

rstudio.png

データをMISSの割合をデータフレームに追加

library(dplyr)

bandori <- bandori %>%
  mutate(MISS = (FAST + SLOW) / (PERFECT + FAST + SLOW) * 100)

ヒストグラムと近似曲線を出す

hist(bandori$MISS, breaks = seq(0, 20, 1))

dens <- density(bandori$MISS)
lines(dens, lwd = 3, col = "blue")

hist.png

検定

shapiro.test(bandori$MISS)

検定統計量とp値

data:  bandori$MISS
W = 0.98162, p-value = 0.724

ここで注意なのはこの検定は帰無仮説が「正規分布している」なので
棄却出来た場合は正規分布ではないと言えるが、
今回のように棄却できない(受容域)の場合は正規分布していてもおかしくない程度なので何とも言えないです

ヒストグラム見る限り正規分布としても良さそうですが

使ったRスクリプト
https://gist.github.com/yaasita/7c431d0493c9703c91d0a013d03349af