Uji Normalitas Data Menggunakan Shapiro, Kolmogorov, Plot Histogram, dan Plot Kurva Normal
Berikut adalah beberapa metode yang dapat digunakan untuk menguji normalitas data menggunakan R:
1. Uji Normalitas dengan Shapiro-Wilk
Uji Shapiro-Wilk digunakan untuk menguji apakah data berasal dari distribusi normal.
# Uji Normalitas Shapiro-Wilk
shapiro_test <- shapiro.test(data)
print(shapiro_test)
2. Uji Normalitas dengan Kolmogorov-Smirnov
Uji Kolmogorov-Smirnov menguji apakah distribusi sampel sesuai dengan distribusi normal.
# Uji Normalitas Kolmogorov-Smirnov
ks_test <- ks.test(data, "pnorm", mean = mean(data), sd = sd(data))
print(ks_test)
3. Plot Histogram
Plot histogram digunakan untuk memvisualisasikan distribusi data dan melihat apakah distribusi data mendekati distribusi normal.
# Plot Histogram
hist(data, main = "Histogram Data", xlab = "Nilai", ylab = "Frekuensi", col = "lightblue", border = "black")
4. Plot Kurva Normal
Plot kurva normal digunakan untuk menggambarkan distribusi data berbanding dengan kurva distribusi normal.
# Plot Histogram dan Kurva Normal
hist(data, prob = TRUE, main = "Histogram dan Kurva Normal", xlab = "Nilai", ylab = "Probabilitas", col = "lightblue", border = "black")
lines(density(data), col = "red", lwd = 2) # Kurva distribusi data
curve(dnorm(x, mean = mean(data), sd = sd(data)), add = TRUE, col = "blue", lwd = 2) # Kurva distribusi normal
Contoh Data
Misalnya, kita memiliki data hasil ulangan siswa dan kita ingin menguji apakah rata-rata data tersebut sama dengan nilai tertentu (misalnya, 75).
# Membuat data contoh
set.seed(123) # Untuk reproducibility
data <- rnorm(2500, mean = 79, sd = 4) # 2500 data normal dengan rata-rata 79, SD 4
Interpretasi Hasil
- Nilai p-value:
- Jika p-value ≤ 0.05, maka tolak H₀ dan anggap data tidak terdistribusi normal.
- Jika p-value > 0.05, gagal menolak H₀ dan data dianggap terdistribusi normal.
- Histogram dan Kurva Normal: Visualisasi ini memberi gambaran apakah data memiliki distribusi yang menyerupai distribusi normal. Jika kurva distribusi data hampir sama dengan kurva distribusi normal, maka data terdistribusi normal.
Ringkasan
- Shapiro-Wilk Test: Uji yang mengembalikan p-value untuk memeriksa apakah data berdistribusi normal.
- Kolmogorov-Smirnov Test: Uji yang membandingkan distribusi data dengan distribusi normal yang diharapkan.
- Plot Histogram dan Kurva Normal: Digunakan untuk memvisualisasikan sebaran data dan membandingkannya dengan distribusi normal.
Tidak ada komentar:
Posting Komentar