Rabu, 20 November 2024

Uji Normalitas Data Numerik Menggunakan Software R

Uji Normalitas Data di R

Uji Normalitas Data Menggunakan Shapiro, Kolmogorov, Plot Histogram, dan Plot Kurva Normal

Berikut adalah beberapa metode yang dapat digunakan untuk menguji normalitas data menggunakan R:

1. Uji Normalitas dengan Shapiro-Wilk

Uji Shapiro-Wilk digunakan untuk menguji apakah data berasal dari distribusi normal.


# Uji Normalitas Shapiro-Wilk
shapiro_test <- shapiro.test(data)
print(shapiro_test)
    

2. Uji Normalitas dengan Kolmogorov-Smirnov

Uji Kolmogorov-Smirnov menguji apakah distribusi sampel sesuai dengan distribusi normal.


# Uji Normalitas Kolmogorov-Smirnov
ks_test <- ks.test(data, "pnorm", mean = mean(data), sd = sd(data))
print(ks_test)
    

3. Plot Histogram

Plot histogram digunakan untuk memvisualisasikan distribusi data dan melihat apakah distribusi data mendekati distribusi normal.


# Plot Histogram
hist(data, main = "Histogram Data", xlab = "Nilai", ylab = "Frekuensi", col = "lightblue", border = "black")
    

4. Plot Kurva Normal

Plot kurva normal digunakan untuk menggambarkan distribusi data berbanding dengan kurva distribusi normal.


# Plot Histogram dan Kurva Normal
hist(data, prob = TRUE, main = "Histogram dan Kurva Normal", xlab = "Nilai", ylab = "Probabilitas", col = "lightblue", border = "black")
lines(density(data), col = "red", lwd = 2)  # Kurva distribusi data
curve(dnorm(x, mean = mean(data), sd = sd(data)), add = TRUE, col = "blue", lwd = 2)  # Kurva distribusi normal
    

Contoh Data

Misalnya, kita memiliki data hasil ulangan siswa dan kita ingin menguji apakah rata-rata data tersebut sama dengan nilai tertentu (misalnya, 75).


# Membuat data contoh
set.seed(123)  # Untuk reproducibility
data <- rnorm(2500, mean = 79, sd = 4)  # 2500 data normal dengan rata-rata 79, SD 4
    

Interpretasi Hasil

  1. Nilai p-value:
    • Jika p-value ≤ 0.05, maka tolak H₀ dan anggap data tidak terdistribusi normal.
    • Jika p-value > 0.05, gagal menolak H₀ dan data dianggap terdistribusi normal.
  2. Histogram dan Kurva Normal: Visualisasi ini memberi gambaran apakah data memiliki distribusi yang menyerupai distribusi normal. Jika kurva distribusi data hampir sama dengan kurva distribusi normal, maka data terdistribusi normal.

Ringkasan

  • Shapiro-Wilk Test: Uji yang mengembalikan p-value untuk memeriksa apakah data berdistribusi normal.
  • Kolmogorov-Smirnov Test: Uji yang membandingkan distribusi data dengan distribusi normal yang diharapkan.
  • Plot Histogram dan Kurva Normal: Digunakan untuk memvisualisasikan sebaran data dan membandingkannya dengan distribusi normal.

Tidak ada komentar:

Posting Komentar