Normal Dağılımın Tanımı
Normal dağılım, birçok doğal olayın dağılımını tanımlar ve çan şeklindeki eğri ile temsil edilir. Bu dağılım, ortalama (mean) ve standart sapma (standard deviation) parametrelerine bağlıdır. Normal dağılım, veri analizi ve istatistikte en yaygın kullanılan dağılımlardan biridir.
Normal Dağılımın Özellikleri
Simetrik Dağılım: Normal dağılım, ortalama etrafında simetriktir. Ortalama, medyan ve mod aynı değerdedir.
Çan Şekli: Normal dağılım eğrisi çan şeklindedir ve maksimum nokta ortalamayı gösterir.
Standart Sapma: Standart sapma, dağılımın yayılımını belirler. Standart sapma arttıkça, eğri yayılır ve alçaklaşır.
68-95-99.7 Kuralı: Normal dağılımda, verilerin %68'i ortalamadan ±1 standart sapma içinde, %95'i ±2 standart sapma içinde ve %99.7'si ±3 standart sapma içinde yer alır.
Normal Dağılımın Uygulama Alanları
Örnek: Ortalaması 0 ve standart sapması 1 olan bir normal dağılım grafiğini çizelim:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm
# Parametreler
mean = 0 # Ortalama
std_dev = 1 # Standart sapma
# Normal dağılım grafiği
x = np.linspace(-4, 4, 1000)
y = norm.pdf(x, mean, std_dev)
plt.plot(x, y)
plt.title("Normal Dağılım")
plt.xlabel("Değerler")
plt.ylabel("Olasılık Yoğunluğu")
plt.grid(True)
plt.show()
Açıklama: Bu örnekte, ortalaması 0 ve standart sapması 1 olan bir normal dağılım grafiği çizilmiştir. Bu grafikte, x ekseni değerleri ve y ekseni olasılık yoğunluğunu temsil eder.
Z-Puanı (Z-Score) ve Standart Normal Dağılım
Z-Puanı Tanımı: Z-puanı, bir veri noktasının ortalamadan kaç standart sapma uzaklıkta olduğunu gösterir. Z-puanı, verilerin standart normal dağılıma dönüştürülmesini sağlar.
Örnek: Bir öğrencinin sınav notunun z-puanını hesaplayalım. Sınav notu 85, sınıf ortalaması 70 ve standart sapma 10 olsun.
# Parametreler
X = 85 # Veri noktası
mu = 70 # Ortalama
sigma = 10 # Standart sapma
# Z-puanı hesaplama
z_puani = (X - mu) / sigma
print(f"Sınav notunun Z-puanı: {z_puani}")
Açıklama: Bu örnekte, sınav notunun z-puanı hesaplanmıştır. Z-puanı, veri noktasının ortalamadan kaç standart sapma uzaklıkta olduğunu gösterir.
Normal Dağılımın Grafiksel Gösterimi ve Yorumlanması
Normal dağılımı grafiksel olarak göstermek, olasılık dağılımının görselleştirilmesine yardımcı olur. Aşağıdaki örnekte, ortalaması 100 ve standart sapması 15 olan bir normal dağılımın grafiğini çizelim.
# Parametreler
mean = 100 # Ortalama
std_dev = 15 # Standart sapma
# Normal dağılım grafiği
x = np.linspace(55, 145, 1000)
y = norm.pdf(x, mean, std_dev)
plt.plot(x, y)
plt.title("Normal Dağılım (μ=100, σ=15)")
plt.xlabel("Değerler")
plt.ylabel("Olasılık Yoğunluğu")
plt.grid(True)
plt.show()
Açıklama: Bu grafikte, ortalaması 100 ve standart sapması 15 olan bir normal dağılım gösterilmiştir. X ekseni değerleri, Y ekseni ise olasılık yoğunluğunu temsil eder. Eğrinin tepe noktası ortalamayı gösterir ve eğri ortalama etrafında simetriktir.
Normal Dağılımın Örnek Senaryoları
Senaryo 1: Öğrenci Sınav Sonuçları Bir okulda öğrencilerin sınav sonuçları ortalaması 75 ve standart sapması 10 olarak biliniyor. 85 ve üzeri puan alan öğrencilerin yüzdesini hesaplayalım.
# Parametreler
mean = 75 # Ortalama
std_dev = 10 # Standart sapma
# 85 ve üzeri puan alan öğrencilerin yüzdesi
yuzde = 1 - norm.cdf(85, mean, std_dev)
print(f"85 ve üzeri puan alan öğrencilerin yüzdesi: {yuzde * 100}%")
Senaryo 2: Çalışan Maaş Dağılımı Bir şirkette çalışanların maaşlarının ortalaması 5000 TL ve standart sapması 800 TL olarak biliniyor. 6000 TL'den düşük maaş alan çalışanların yüzdesini hesaplayalım.
# Parametreler
mean = 5000 # Ortalama
std_dev = 800 # Standart sapma
# 6000 TL'den düşük maaş alan çalışanların yüzdesi
yuzde = norm.cdf(6000, mean, std_dev)
print(f"6000 TL'den düşük maaş alan çalışanların yüzdesi: {yuzde * 100}%")
Analojilerle Açıklama
Normal dağılımı anlamak için günlük hayattan analojiler kullanabiliriz:
Öğrenci Sınav Sonuçları: Bir sınıfta öğrencilerin sınav sonuçlarının dağılımını modellemek gibidir. Çoğu öğrenci ortalama puan alırken, çok yüksek veya çok düşük puan alan öğrenciler azdır.
Çalışan Maaş Dağılımı: Bir şirkette çalışanların maaşlarının dağılımını modellemek gibidir. Çoğu çalışan ortalama maaş alırken, çok yüksek veya çok düşük maaş alan çalışanlar azdır.
Boy Dağılımı: Bir popülasyondaki insanların boylarının dağılımını modellemek gibidir. Çoğu insan ortalama boya sahipken, çok uzun veya çok kısa insanlar azdır.
Sonuç
Normal dağılım, birçok doğal olayın dağılımını tanımlar ve çan şeklindeki eğri ile temsil edilir. Bu dağılım, ortalama ve standart sapma parametrelerine bağlıdır ve veri analizi ve istatistikte en yaygın kullanılan dağılımlardan biridir. Normal dağılım, istatistik ve veri bilimi alanlarında önemli bir rol oynar ve çeşitli uygulama alanlarında sıkça kullanılır.
Python temellerini atıp, veri analizi ve bilimi için yetkinlik kazanmak istiyorsanız, 1 aylık yoğun Python kampına hemen kayıt olabilirsiniz. ~40 saat canlı ders, ~50 adet kapsamlı proje, ~15 adet quiz ve sayısız kodlama egzersizinden oluşan, Finlandiya eğitim modellerinden esinlenilerek Helsinki'de geliştirilen interaktif ve pratik odaklı eğitim programına hemen göz atın !