top of page

Ortalama ve Medyan Karşılaştırması



Hands-on Mentor Kapsamlı Blog İçeriği
Hands-on Mentor Tutorials



Ortalama ve Medyanın Tanımları

Ortalama ve medyan, merkezi eğilim ölçümlerinin en yaygın kullanılan iki türüdür. İkisinin de verilerin merkezi değerini belirleme amacı vardır, ancak farklı durumlarda farklı sonuçlar verebilirler.


  • Ortalama (Mean): Tüm veri noktalarının toplamının veri sayısına bölünmesiyle elde edilen değerdir.

  • Formül: xˉ=n∑xi xˉ=∑xin\bar{x} = \frac{\sum{x_i}}{n}

  • Medyan (Median): Sıralı bir veri setinde ortada bulunan değerdir. Veri sayısı çift ise, ortadaki iki sayının ortalaması alınır.


Ortalama ve Medyanın Karşılaştırılması


Ortalama ve Medyanın Hesaplanması


Örnek 1: Basit Bir Veri Seti


import numpy as np

# Veri seti
data = [1, 2, 3, 4, 5, 6, 7, 8, 9]

# Ortalama ve medyan hesaplama
ortalama = np.mean(data)
medyan = np.median(data)

print(f"Ortalama: {ortalama}")  # Ortalama: 5.0
print(f"Medyan: {medyan}")  # Medyan: 5.0


Bu basit örnekte, hem ortalama hem de medyan 5.0'dır. Veri seti simetrik ve aykırı değerler içermediğinde, ortalama ve medyan genellikle birbirine yakındır.


Örnek 2: Aykırı Değer İçeren Bir Veri Seti

pythonKodu kopyala
# Veri seti
data_with_outlier = [1, 2, 3, 4, 5, 6, 7, 8, 100]

# Ortalama ve medyan hesaplama
ortalama_outlier = np.mean(data_with_outlier)
medyan_outlier = np.median(data_with_outlier)

print(f"Ortalama (Aykırı Değerli): {ortalama_outlier}")  # Ortalama: 15.11
print(f"Medyan (Aykırı Değerli): {medyan_outlier}")  # Medyan: 5.0


Bu örnekte, 100 gibi bir aykırı değer, ortalamayı 15.11'e yükseltirken, medyan hala 5.0 olarak kalır. Medyan, aykırı değerlere karşı daha dayanıklıdır ve veri setinin ortasında kalan gerçek merkezi değeri daha iyi temsil eder.


Ortalama ve Medyanın Uygun Kullanım Alanları


Ortalama Ne Zaman Kullanılır?

  • Veri Seti Simetrik Olduğunda: Eğer veri seti simetrik ve aykırı değerlerden arınmışsa, ortalama merkezi eğilimi iyi bir şekilde temsil eder.

  • Aritmetik İşlemler İçin Uygun: Ortalamanın toplam değeri, veri noktalarının toplanmasıyla elde edilir. Bu nedenle, toplam veya genel eğilim hakkında bilgi verir.


Örnek: Bir şirketin aylık satış rakamlarını analiz edelim. Satış rakamları genellikle simetrik bir dağılıma sahip olabilir ve ortalama, genel satış eğilimini gösterebilir.


sales = [200, 220, 230, 250, 270, 300, 310, 320, 350]
average_sales = np.mean(sales)
print(f"Ortalama Satış: {average_sales}")  # Ortalama Satış: 272.22


Medyan Ne Zaman Kullanılır?

  • Aykırı Değerler Varsa: Eğer veri setinde aykırı değerler varsa, medyan bu değerlerin etkisini azaltarak merkezi değeri daha doğru bir şekilde temsil eder.

  • Veri Dağılımı Çarpıksa: Çarpık veri dağılımlarında, medyan merkezi değeri daha iyi gösterir.


Örnek: Bir şehirdeki hane gelirlerini analiz edelim. Hane gelirleri genellikle çarpık bir dağılıma sahiptir, çünkü birkaç yüksek gelirli hane genel dağılımı etkileyebilir.


household_incomes = [30000, 35000, 40000, 45000, 50000, 55000, 60000, 65000, 700000]
median_income = np.median(household_incomes)
print(f"Medyan Gelir: {median_income}")  # Medyan Gelir: 50000


Ortalama ve Medyanın Avantajları ve Dezavantajları


Ortalama:

  • Avantajları:

  • Hesaplaması kolaydır.

  • Tüm veri noktalarını dikkate alır.

  • Simetrik veri setlerinde merkezi eğilimi iyi temsil eder.

  • Dezavantajları:

  • Aykırı değerlerden etkilenir.

  • Çarpık dağılımlarda merkezi değeri yanlış temsil edebilir.


Medyan:

  • Avantajları:

  • Aykırı değerlere karşı dayanıklıdır.

  • Çarpık dağılımlarda merkezi değeri daha doğru temsil eder.

  • Dezavantajları:

  • Hesaplaması ortalamaya göre biraz daha karmaşıktır.

  • Tüm veri noktalarını dikkate almaz.


Analojilerle Açıklama

Ortalama ve medyanı anlamak için günlük hayattan analojiler kullanabiliriz:

  • Ortalama: Bir grup arkadaşın topladığı para miktarını eşit olarak paylaştığını düşünün. Bu pay, ortalama miktarı temsil eder. Ancak, bir arkadaş çok fazla para getirmişse, bu ortalamayı ciddi şekilde etkiler.

  • Medyan: Bir sıralama yarışmasında ortada bitiren kişinin derecesi, grubun medyan performansını temsil eder. Aşırı dereceler medyanı etkilemez.


Sonuç

Ortalama ve medyan, bir veri setinin merkezi eğilimlerini belirlemek için kullanılan iki temel ölçümdür. Ortalama, tüm veri noktalarını dikkate alarak genel bir eğilim sunarken, medyan, aykırı değerlere karşı dayanıklı olması sayesinde veri setinin ortasında kalan gerçek merkezi değeri daha doğru bir şekilde temsil eder. Hangi ölçümün kullanılacağı, veri setinin özelliklerine ve analiz amacına bağlıdır.


 

Python temellerini atıp, veri analizi ve bilimi için yetkinlik kazanmak istiyorsanız, 1 aylık yoğun Python kampına hemen kayıt olabilirsiniz. ~40 saat canlı ders, ~50 adet kapsamlı proje, ~15 adet quiz ve sayısız kodlama egzersizinden oluşan, Finlandiya eğitim modellerinden esinlenilerek Helsinki'de geliştirilen interaktif ve pratik odaklı eğitim programına hemen göz atın !




bottom of page