top of page

Üyelik Paketlerinde 25% İndirim İçin Kodun : "welcome"

Dağılım Ölçümleri



Hands-on Mentor Kapsamlı Blog İçeriği
Hands-on Mentor Tutorials



Dağılım Ölçümlerine Genel Bakış

Dağılım ölçümleri, bir veri setinin yayılımını ve değişkenliğini anlamamıza yardımcı olan istatistiksel araçlardır. Merkezi eğilim ölçümleri, verilerin merkezini belirlerken, dağılım ölçümleri verilerin bu merkez etrafında nasıl dağıldığını gösterir. Veri setinin yayılımını ölçmek, verilerin ne kadar değişken olduğunu ve aşırı değerlerin olup olmadığını anlamak için önemlidir.


Temel Dağılım Ölçümleri

  1. Aralık (Range)

  2. Çeyrekler Arası Aralık (IQR - Interquartile Range)

  3. Varyans (Variance)

  4. Standart Sapma (Standard Deviation)


1. Aralık (Range)


Tanım: Aralık, veri setindeki en büyük değer ile en küçük değer arasındaki farktır. Verilerin genel yayılımını hızlı bir şekilde gösterir.


Örnek: Bir sınıftaki öğrencilerin sınav notlarını ele alalım:


import numpy as np

# Öğrenci notları
notlar = [56, 67, 49, 92, 70, 84, 88, 73, 54, 61]

# Aralık hesaplama
aralik = np.ptp(notlar)
print("Aralık:", aralik)  # Aralık: 43


Açıklama: Bu sınıftaki öğrencilerin sınav notlarının aralığı 43'tür. Bu, en yüksek not ile en düşük not arasındaki farktır.


Avantajları ve Dezavantajları:

  • Avantajları: Hesaplaması kolaydır ve verilerin genel yayılımını hızlı bir şekilde gösterir.

  • Dezavantajları: Yalnızca iki değere dayanır ve veri setinin geri kalanını dikkate almaz.


2. Çeyrekler Arası Aralık (IQR - Interquartile Range)


Tanım: Çeyrekler arası aralık, veri setindeki ilk çeyrek (Q1) ile üçüncü çeyrek (Q3) arasındaki farktır. Verilerin orta %50'sinin yayılımını gösterir.


Örnek: Aynı öğrenci notları örneğini kullanarak IQR'yi hesaplayalım:


# Çeyrekler arası aralık (IQR) hesaplama
Q1 = np.percentile(notlar, 25)
Q3 = np.percentile(notlar, 75)
IQR = Q3 - Q1

print(f"Q1: {Q1}")  # Q1: 56.75
print(f"Q3: {Q3}")  # Q3: 84.0
print("Çeyrekler Arası Aralık (IQR):", IQR)  # IQR: 27.25


Açıklama: Bu sınıftaki öğrencilerin sınav notlarının IQR'si 27.25'tir. Bu, notların orta %50'sinin yayılımını gösterir.


Avantajları ve Dezavantajları:

  • Avantajları: Aykırı değerlere karşı dayanıklıdır ve verilerin orta kısmının yayılımını iyi bir şekilde gösterir.

  • Dezavantajları: Hesaplaması biraz daha karmaşıktır ve tüm veri noktalarını dikkate almaz.


3. Varyans (Variance)


Tanım: Varyans, verilerin ortalamadan ne kadar sapma gösterdiğinin bir ölçüsüdür. Verilerin ortalama etrafındaki dağılımını gösterir.


Örnek: Aynı öğrenci notları örneğini kullanarak varyansı hesaplayalım:


# Varyans hesaplama
varyans = np.var(notlar)
print("Varyans:", varyans)  # Varyans: 151.84


Açıklama: Bu sınıftaki öğrencilerin sınav notlarının varyansı 151.84'tir. Bu, notların ortalamadan ne kadar sapma gösterdiğini gösterir.


Avantajları ve Dezavantajları:

  • Avantajları: Tüm veri noktalarını dikkate alır ve verilerin yayılımını iyi bir şekilde ölçer.

  • Dezavantajları: Birimi, orijinal veri biriminin karesidir ve bu nedenle yorumu zor olabilir.


4. Standart Sapma (Standard Deviation)


Tanım: Standart sapma, varyansın kareköküdür ve veri setinin ortalama etrafındaki yayılımını gösterir. Orijinal veri birimiyle ifade edilir.


Örnek: Aynı öğrenci notları örneğini kullanarak standart sapmayı hesaplayalım:


# Standart sapma hesaplama
standart_sapma = np.std(notlar)
print("Standart Sapma:", standart_sapma)  # Standart Sapma: 12.32

Açıklama: Bu sınıftaki öğrencilerin sınav notlarının standart sapması 12.32'dir. Bu, notların ortalama etrafındaki yayılımını gösterir.


Avantajları ve Dezavantajları:

  • Avantajları: Tüm veri noktalarını dikkate alır ve verilerin yayılımını iyi bir şekilde ölçer. Ayrıca, orijinal veri birimiyle ifade edilir ve yorumu kolaydır.

  • Dezavantajları: Hesaplaması biraz daha karmaşıktır.


Dağılım Ölçümlerinin Uygun Kullanım Alanları


Aralık (Range):

  • Kullanım Alanları: Veri setinin genel yayılımını hızlı bir şekilde göstermek için kullanılır. Örneğin, bir şirketin yıllık gelirleri arasındaki farkı görmek için kullanılabilir.

  • Örnek: Bir mağazanın günlük en yüksek ve en düşük satış rakamları arasındaki farkı göstermek için aralık kullanılabilir.


Çeyrekler Arası Aralık (IQR):

  • Kullanım Alanları: Aykırı değerlere karşı dayanıklı olması nedeniyle verilerin orta kısmının yayılımını göstermek için kullanılır. Örneğin, bir okulun öğrencilerinin sınav notlarının yayılımını göstermek için kullanılabilir.

  • Örnek: Bir araştırmacı, bir anketin sonuçlarını analiz ederken orta %50'lik dilimi incelemek için IQR'yi kullanabilir.


Varyans ve Standart Sapma:

  • Kullanım Alanları: Verilerin ortalama etrafındaki yayılımını ve değişkenliğini ölçmek için kullanılır. Örneğin, bir yatırımcı, hisse senedi getirilerinin varyansını ve standart sapmasını analiz ederek risk düzeyini değerlendirebilir.

  • Örnek: Bir şirketin çalışanlarının maaşlarının ne kadar farklı olduğunu görmek için varyans ve standart sapma kullanılabilir.


Analojilerle Açıklama


Dağılım ölçümlerini anlamak için günlük hayattan analojiler kullanabiliriz:

  • Aralık: Bir gezide gidilen en uzak ve en yakın yer arasındaki mesafe aralık olarak düşünülebilir. Bu, gidilen yerlerin genel yayılımını gösterir.

  • Çeyrekler Arası Aralık (IQR): Bir kitabın ortalama zorluktaki bölümleri arasındaki fark, çeyrekler arası aralık olarak düşünülebilir. Bu, kitabın orta kısımlarının zorluk seviyesini gösterir.

  • Varyans ve Standart Sapma: Bir futbol takımındaki oyuncuların boylarının ne kadar farklı olduğunu ölçmek için varyans ve standart sapma kullanılabilir. Bu, takımın boy dağılımını gösterir.


 

Python temellerini atıp, veri analizi ve bilimi için yetkinlik kazanmak istiyorsanız, 1 aylık yoğun Python kampına hemen kayıt olabilirsiniz. ~40 saat canlı ders, ~50 adet kapsamlı proje, ~15 adet quiz ve sayısız kodlama egzersizinden oluşan, Finlandiya eğitim modellerinden esinlenilerek Helsinki'de geliştirilen interaktif ve pratik odaklı eğitim programına hemen göz atın !




Comments


Commenting has been turned off.
bottom of page