top of page

Üyelik Paketlerinde 25% İndirim İçin Kodun : "welcome"

Merkezi Eğilim Ölçümleri



Hands-on Mentor Kapsamlı Blog İçeriği
Hands-on Mentor Tutorials




Merkezi Eğilim Ölçümlerine Genel Bakış

Merkezi eğilim ölçümleri, bir veri setinin merkezini veya tipik değerini belirlemek için kullanılır. Bu ölçümler, veri setinin ortalama, medyan ve mod gibi temel istatistiksel özelliklerini tanımlayarak verinin genel eğilimini özetler. Merkezi eğilim ölçümleri, verilerin nasıl dağıldığını anlamamıza ve karşılaştırmamıza yardımcı olur.


Ortalama (Mean)


Tanım: Ortalama, bir veri setindeki tüm değerlerin toplamının, veri sayısına bölünmesiyle elde edilen değerdir. Ortalama, merkezi eğilim ölçümleri arasında en yaygın olarak kullanılanıdır.

Formül:xˉ=∑xin\bar{x} = \frac{\sum{x_i}}{n}xˉ=n∑xi Burada xˉ\bar{x}xˉ ortalamayı, xix_ixi veri noktalarını ve nnn veri sayısını temsil eder.


Örnek: Bir sınıftaki öğrencilerin sınav notlarını ele alalım:


import numpy as np

# Öğrenci notları
notlar = [56, 67, 49, 92, 70, 84, 88, 73, 54, 61]

# Ortalama hesaplama
ortalama = np.mean(notlar)
print("Ortalama:", ortalama)  # Ortalama: 69.4


Açıklama: Bu sınıftaki öğrencilerin sınav notlarının ortalaması 69.4'tür. Bu, sınıfın genel başarı düzeyini gösterir.


Avantajları ve Dezavantajları:

  • Avantajları: Hesaplaması kolaydır ve tüm veri noktalarını dikkate alır.

  • Dezavantajları: Aykırı değerlerden (extreme values) oldukça etkilenir. Örneğin, bir veri setinde çok yüksek veya çok düşük bir değer varsa, bu ortalamayı ciddi şekilde etkileyebilir.


Medyan (Median)


Tanım: Medyan, sıralı bir veri setinde ortada bulunan değerdir. Veri sayısı çift ise, ortadaki iki sayının ortalaması alınır. Medyan, aykırı değerlere karşı daha dayanıklıdır.


Örnek: Aynı öğrenci notları örneğini kullanarak medyanı hesaplayalım:


# Medyan hesaplama
medyan = np.median(notlar)
print("Medyan:", medyan)  # Medyan: 66.5


Açıklama: Bu sınıftaki öğrencilerin sınav notlarının medyanı 66.5'tir. Bu, öğrencilerin yarısının bu nottan daha düşük, yarısının ise daha yüksek not aldığı anlamına gelir.


Avantajları ve Dezavantajları:

  • Avantajları: Aykırı değerlere karşı dayanıklıdır ve veri setinin ortanca değerini iyi bir şekilde temsil eder.

  • Dezavantajları: Hesaplaması ortalamaya göre biraz daha karmaşıktır ve tüm veri noktalarını dikkate almaz.


Mod (Mode)


Tanım: Mod, bir veri setinde en sık tekrar eden değerdir. Mod, özellikle kategorik verilerde kullanışlıdır.


Örnek: Bir mağazada en çok satılan ürünlerin belirlenmesi için mod kullanılabilir. Aşağıdaki örnekte, öğrenci notlarının modunu hesaplayalım:


from scipy import stats

# Mod hesaplama
mod = stats.mode(notlar).mode[0]
print("Mod:", mod)  # Mod: 56 (veri setinde 56 en sık tekrar eden değerdir)


Açıklama: Bu sınıftaki öğrencilerin sınav notlarının modu 56'dır. Bu, 56 notunun en sık tekrar eden not olduğunu gösterir.


Avantajları ve Dezavantajları:

  • Avantajları: Hesaplaması kolaydır ve kategorik verilerde oldukça kullanışlıdır.

  • Dezavantajları: Veri setinde birden fazla mod olabilir veya hiç mod olmayabilir. Ayrıca, tüm veri noktalarını dikkate almaz.


Ortalama, Medyan ve Mod'un Karşılaştırılması

Ortalama, medyan ve mod, bir veri setinin merkezi eğilimlerini belirlemek için kullanılır, ancak her biri farklı özelliklere sahiptir.


Analojilerle Açıklama:

  • Ortalama: Bir grup arkadaşın topladığı para miktarını eşit olarak paylaştığını düşünün. Bu pay, ortalama miktarı temsil eder. Ancak, bir arkadaş çok fazla para getirmişse, bu ortalamayı yükseltir.

  • Medyan: Bir sıralama yarışmasında ortada bitiren kişinin derecesi, grubun medyan performansını temsil eder. Aşırı dereceler medyanı etkilemez.

  • Mod: Bir okulda en popüler spor dalının en çok tercih edileni olması, mod ile ifade edilir. Bu, en sık tekrar eden değeri temsil eder.


Örnek Senaryo: Bir okulda öğrencilerin matematik sınav sonuçlarını analiz edelim. Ortalama, medyan ve mod kullanarak sınıfın genel performansını ve dağılımını inceleyelim:


import numpy as np
from scipy import stats

# Öğrenci notları
notlar = [56, 67, 49, 92, 70, 84, 88, 73, 54, 61]

# Merkezi Eğilim Ölçümleri
ortalama = np.mean(notlar)
medyan = np.median(notlar)
mod = stats.mode(notlar).mode[0]

print(f"Ortalama: {ortalama}")  # Ortalama: 69.4
print(f"Medyan: {medyan}")  # Medyan: 66.5
print(f"Mod: {mod}")  # Mod: 56


Yorumlama:

  • Ortalama: Sınıfın genel not ortalamasını gösterir. Aykırı değerlerden etkilenir.

  • Medyan: Sınıfın ortanca notunu gösterir. Aykırı değerlere dayanıklıdır.

  • Mod: En sık tekrar eden notu gösterir. Kategorik verilerde kullanışlıdır.


Sonuç

Merkezi eğilim ölçümleri, bir veri setinin genel eğilimini anlamamıza yardımcı olan temel istatistiksel araçlardır. Ortalama, medyan ve mod, farklı veri setleri ve durumlar için uygun araçlar sunar. Her bir ölçümün avantajları ve dezavantajları vardır ve veri analizi yaparken bu özellikleri göz önünde bulundurmak önemlidir.


 

Python temellerini atıp, veri analizi ve bilimi için yetkinlik kazanmak istiyorsanız, 1 aylık yoğun Python kampına hemen kayıt olabilirsiniz. ~40 saat canlı ders, ~50 adet kapsamlı proje, ~15 adet quiz ve sayısız kodlama egzersizinden oluşan, Finlandiya eğitim modellerinden esinlenilerek Helsinki'de geliştirilen interaktif ve pratik odaklı eğitim programına hemen göz atın !




Comments


Commenting has been turned off.
bottom of page