top of page

Özet İstatistikler



Hands-on Mentor Kapsamlı Blog İçeriği
Hands-on Mentor Tutorials



Özet İstatistiklere Genel Bakış

Özet istatistikler, büyük veri setlerinin temel özelliklerini özetlemek ve anlamak için kullanılan istatistiksel ölçümlerdir. Bu ölçümler, veri setinin merkezi eğilimlerini, dağılımını ve genel özelliklerini gösterir. Özet istatistikler, verileri daha anlaşılır hale getirir ve veri analizinde ilk adımı oluşturur.


Temel Ölçümler

Özet istatistikler genellikle iki ana kategoride incelenir: merkezi eğilim ölçümleri ve dağılım ölçümleri.


  1. Merkezi Eğilim Ölçümleri

  • Ortalama (Mean):

  • Tanım: Verilerin toplamının, veri sayısına bölünmesiyle elde edilen değerdir.

  • Formül: xˉ=n∑xi xˉ=∑xin\bar{x} = \frac{\sum{x_i}}{n}

  • Örnek: Bir sınıftaki öğrencilerin sınav notlarının ortalaması, sınıfın genel başarısını gösterir.

  • Analoji: Bir grup arkadaşın topladığı para miktarını eşit olarak paylaştığını düşünün. Bu pay, ortalama miktarı temsil eder.

  • Medyan (Median):

  • Tanım: Sıralı bir veri setinde ortada bulunan değerdir. Veri sayısı çift ise, ortadaki iki sayının ortalaması alınır.

  • Örnek: Bir grup kişinin yıllık gelirleri medyan gelir ile temsil edilebilir.

  • Analoji: Bir sıralama yarışmasında ortada bitiren kişinin derecesi, grubun medyan performansını temsil eder.

  • Mod (Mode):

  • Tanım: Bir veri setinde en sık tekrar eden değerdir.

  • Örnek: Bir mağazada en çok satılan ürünün belirlenmesi mod ile yapılabilir.

  • Analoji: Bir okulda en popüler spor dalının en çok tercih edileni olması, mod ile ifade edilir.

  1. Dağılım Ölçümleri

  • Aralık (Range):

  • Tanım: En büyük değer ile en küçük değer arasındaki farktır.

  • Formül: R=Xmax−Xmin R=Xmax−XminR = X_{max} - X_{min}

  • Örnek: Bir şehirde en yüksek ve en düşük sıcaklıklar arasındaki fark aralık ile ifade edilir.

  • Analoji: Bir gezide gidilen en uzak ve en yakın yer arasındaki mesafe aralık olarak düşünülebilir.

  • Çeyrekler Arası Aralık (IQR - Interquartile Range):

  • Tanım: Verilerin ilk çeyreği (Q1) ile üçüncü çeyreği (Q3) arasındaki farktır.

  • Formül: IQR=Q3−Q1 IQR=Q3−Q1IQR = Q3 - Q1

  • Örnek: Bir okulun sınav notlarının çeyrekler arası aralığı, notların yayılımını gösterir.

  • Analoji: Bir kitabın ortalama zorluktaki bölümleri arasındaki fark, çeyrekler arası aralık olarak düşünülebilir.

  • Varyans (Variance):

  • Tanım: Verilerin ortalamadan ne kadar sapma gösterdiğinin bir ölçüsüdür.

  • Formül: σ2=n∑(xi−xˉ)2 σ2=∑(xi−xˉ)2n\sigma^2 = \frac{\sum{(x_i - \bar{x})^2}}{n}

  • Örnek: Bir sınıftaki öğrencilerin sınav notlarının varyansı, başarı düzeylerinin ne kadar farklılık gösterdiğini gösterir.

  • Analoji: Bir futbol takımındaki oyuncuların boylarının ne kadar farklı olduğunu ölçmek için varyans kullanılabilir.

  • Standart Sapma (Standard Deviation):

  • Tanım: Varyansın kareköküdür ve veri setinin ortalama etrafındaki yayılımını gösterir.

  • Formül: σ=σ2 σ=σ2\sigma = \sqrt{\sigma^2}

  • Örnek: Bir mağazanın günlük satışlarının standart sapması, satışların ne kadar değişken olduğunu gösterir.

  • Analoji: Bir öğrenci grubunun sınav notlarının standart sapması, öğrencilerin notlarının ne kadar farklı olduğunu gösterir.


Merkezi Eğilim Ölçümleri ve Dağılım Ölçümleri


Ortalama, Medyan ve Mod

Ortalama, medyan ve mod, bir veri setinin merkezi eğilimlerini tanımlamak için kullanılır.

  • Ortalama: Verilerin toplamının veri sayısına bölünmesiyle elde edilen değerdir. Ancak, ortalama, aykırı değerlerden etkilenir. pythonKodu kopyala import numpy as np data = [10, 15, 20, 25, 30] mean = np.mean(data) print("Ortalama:", mean) # Ortalama: 20.0

  • Medyan: Sıralı bir veri setinde ortada bulunan değerdir. Medyan, aykırı değerlere karşı daha dayanıklıdır. pythonKodu kopyala median = np.median(data) print("Medyan:", median) # Medyan: 20.0

  • Mod: En sık tekrar eden değerdir. Mod, özellikle kategorik verilerde kullanışlıdır. pythonKodu kopyala from scipy import stats mode = stats.mode(data) print("Mod:", mode.mode[0]) # Mod: 10 (veri setinde 10 en sık tekrar eden değerdir)


Dağılım Ölçümleri

Dağılım ölçümleri, veri setinin yayılımını ve değişkenliğini gösterir.

  • Aralık: En büyük değer ile en küçük değer arasındaki farktır. pythonKodu kopyala range_value = np.ptp(data) print("Aralık:", range_value) # Aralık: 20 (30 - 10)

  • Çeyrekler Arası Aralık (IQR): Verilerin ilk çeyreği (Q1) ile üçüncü çeyreği (Q3) arasındaki farktır. pythonKodu kopyala Q1 = np.percentile(data, 25) Q3 = np.percentile(data, 75) IQR = Q3 - Q1 print("Çeyrekler Arası Aralık (IQR):", IQR) # IQR: 10.0

  • Varyans: Verilerin ortalamadan ne kadar sapma gösterdiğinin bir ölçüsüdür. pythonKodu kopyala variance = np.var(data) print("Varyans:", variance) # Varyans: 50.0

  • Standart Sapma: Varyansın kareköküdür ve veri setinin ortalama etrafındaki yayılımını gösterir. pythonKodu kopyala std_dev = np.std(data) print("Standart Sapma:", std_dev) # Standart Sapma: 7.07


Örnek Uygulama: Bir Sınıftaki Öğrenci Notlarının Analizi

Bir sınıftaki öğrencilerin sınav notlarını analiz ederek merkezi eğilim ve dağılım ölçümlerini hesaplayalım.


import numpy as np

# Öğrenci notları
notlar = [56, 67, 49, 92, 70, 84, 88, 73, 54, 61]

# Merkezi Eğilim Ölçümleri
ortalama = np.mean(notlar)
medyan = np.median(notlar)
mod = stats.mode(notlar).mode[0]

# Dağılım Ölçümleri
aralik = np.ptp(notlar)
Q1 = np.percentile(notlar, 25)
Q3 = np.percentile(notlar, 75)
IQR = Q3 - Q1
varyans = np.var(notlar)
standart_sapma = np.std(notlar)

print(f"Ortalama: {ortalama}")
print(f"Medyan: {medyan}")
print(f"Mod: {mod}")
print(f"Aralık: {aralik}")
print(f"Çeyrekler Arası Aralık (IQR): {IQR}")
print(f"Varyans: {varyans}")
print(f"Standart Sapma: {standart_sapma}")


Açıklama:

  • Ortalama: Sınıftaki öğrencilerin sınav notlarının ortalamasını gösterir.

  • Medyan: Notların ortasında bulunan değeri gösterir.

  • Mod: En sık tekrar eden notu gösterir.

  • Aralık: En yüksek ve en düşük notlar arasındaki farkı gösterir.

  • Çeyrekler Arası Aralık (IQR): Orta %50'lik dilimdeki notların yayılımını gösterir.

  • Varyans ve Standart Sapma: Notların ortalamadan ne kadar sapma gösterdiğini ve yayılımını gösterir.


 

Python temellerini atıp, veri analizi ve bilimi için yetkinlik kazanmak istiyorsanız, 1 aylık yoğun Python kampına hemen kayıt olabilirsiniz. ~40 saat canlı ders, ~50 adet kapsamlı proje, ~15 adet quiz ve sayısız kodlama egzersizinden oluşan, Finlandiya eğitim modellerinden esinlenilerek Helsinki'de geliştirilen interaktif ve pratik odaklı eğitim programına hemen göz atın !




bottom of page