シャピロ-ウィルク(Shapiro-Wilk)の正規性の検定をやる流れ
まず以下のようなデータを用意する
これは音ゲーのスコアを表していてタイミングよく押せた場合はPERFECT, 早すぎたり遅すぎたりした場合はFAST, SLOWに計上される
この内ミスの割合が正規分布と見なせるか検定する
まず、CSVを右上のEnvironmentタブ => Import Datasetから読み込む
データをMISSの割合をデータフレームに追加
library(dplyr)
bandori <- bandori %>%
mutate(MISS = (FAST + SLOW) / (PERFECT + FAST + SLOW) * 100)
ヒストグラムと近似曲線を出す
hist(bandori$MISS, breaks = seq(0, 20, 1))
dens <- density(bandori$MISS)
lines(dens, lwd = 3, col = "blue")
検定
shapiro.test(bandori$MISS)
検定統計量とp値
data: bandori$MISS
W = 0.98162, p-value = 0.724
ここで注意なのはこの検定は帰無仮説が「正規分布している」なので
棄却出来た場合は正規分布ではないと言えるが、
今回のように棄却できない(受容域)の場合は正規分布していてもおかしくない程度なので何とも言えないです
ヒストグラム見る限り正規分布としても良さそうですが
使ったRスクリプト
https://gist.github.com/yaasita/7c431d0493c9703c91d0a013d03349af