Varyans ve Standart Sapmanın Tanımları
Varyans ve standart sapma, bir veri setinin yayılımını ve değişkenliğini ölçen istatistiksel araçlardır. Bu ölçümler, verilerin ortalama etrafında ne kadar dağıldığını anlamamıza yardımcı olur. Varyans ve standart sapma, verilerin ne kadar değişken olduğunu ve aşırı değerlerin olup olmadığını belirlememize olanak tanır.
Varyans (Variance)
Tanım: Varyans, verilerin ortalamadan ne kadar sapma gösterdiğinin bir ölçüsüdür. Verilerin ortalama etrafındaki dağılımını gösterir. Varyans, verilerin ortalama değerden ne kadar uzaklaştığını hesaplar ve bu sapmaların karelerinin ortalamasını alır.
Örnek: Bir sınıftaki öğrencilerin sınav notlarını ele alalım:
import numpy as np
# Öğrenci notları
notlar = [56, 67, 49, 92, 70, 84, 88, 73, 54, 61]
# Varyans hesaplama
varyans = np.var(notlar)
print("Varyans:", varyans) # Varyans: 151.84
Açıklama: Bu sınıftaki öğrencilerin sınav notlarının varyansı 151.84'tür. Bu, notların ortalamadan ne kadar sapma gösterdiğini gösterir.
Avantajları ve Dezavantajları:
Avantajları: Tüm veri noktalarını dikkate alır ve verilerin yayılımını iyi bir şekilde ölçer.
Dezavantajları: Birimi, orijinal veri biriminin karesidir ve bu nedenle yorumu zor olabilir.
Standart Sapma (Standard Deviation)
Tanım: Standart sapma, varyansın kareköküdür ve veri setinin ortalama etrafındaki yayılımını gösterir. Orijinal veri birimiyle ifade edilir, bu yüzden yorumu daha kolaydır.
Örnek: Aynı öğrenci notları örneğini kullanarak standart sapmayı hesaplayalım:
# Standart sapma hesaplama
standart_sapma = np.std(notlar)
print("Standart Sapma:", standart_sapma) # Standart Sapma: 12.32
Açıklama: Bu sınıftaki öğrencilerin sınav notlarının standart sapması 12.32'dir. Bu, notların ortalama etrafındaki yayılımını gösterir.
Avantajları ve Dezavantajları:
Avantajları: Tüm veri noktalarını dikkate alır ve verilerin yayılımını iyi bir şekilde ölçer. Ayrıca, orijinal veri birimiyle ifade edilir ve yorumu kolaydır.
Dezavantajları: Hesaplaması biraz daha karmaşıktır.
Varyans ve Standart Sapmanın Uygulama Alanları
Varyans:
Kullanım Alanları: Verilerin ortalama etrafındaki yayılımını ve değişkenliğini ölçmek için kullanılır. Örneğin, bir yatırımcı, hisse senedi getirilerinin varyansını analiz ederek risk düzeyini değerlendirebilir.
Örnek: Bir şirketin çalışanlarının maaşlarının ne kadar farklı olduğunu görmek için varyans kullanılabilir.
Standart Sapma:
Kullanım Alanları: Verilerin ortalama etrafındaki yayılımını ve değişkenliğini ölçmek için kullanılır. Orijinal veri birimiyle ifade edilmesi nedeniyle yorumu daha kolaydır. Örneğin, bir öğretmen, sınıfındaki öğrencilerin sınav notlarının yayılımını standart sapma ile analiz edebilir.
Örnek: Bir spor takımındaki oyuncuların performanslarının ne kadar farklı olduğunu görmek için standart sapma kullanılabilir.
Analojilerle Açıklama
Varyans ve standart sapmayı anlamak için günlük hayattan analojiler kullanabiliriz:
Varyans: Bir sınıfta öğrencilerin boylarını ölçtüğünüzü düşünün. Eğer öğrencilerin boyları çok farklıysa, varyans yüksek olacaktır. Bu, boyların ortalamadan ne kadar saptığını gösterir.
Standart Sapma: Aynı sınıftaki öğrencilerin boylarının standart sapmasını hesapladığınızda, bu sapmanın boy biriminde (örneğin, santimetre) ifade edilmesi, yorumu daha kolay hale getirir.
Örnek Senaryo: Bir Şirketin Çalışan Maaşlarının Analizi
Bir şirketin çalışan maaşlarını analiz ederek varyans ve standart sapmayı hesaplayalım:
import numpy as np
# Çalışan maaşları
maaslar = [30000, 32000, 35000, 37000, 40000, 45000, 47000, 50000, 52000, 55000]
# Varyans ve Standart Sapma hesaplama
varyans = np.var(maaslar)
standart_sapma = np.std(maaslar)
print(f"Varyans: {varyans}") # Varyans: 52900000.0
print(f"Standart Sapma: {standart_sapma}") # Standart Sapma: 7276.14
Yorumlama:
Varyans: Çalışan maaşlarının varyansı 52900000.0'dır. Bu, maaşların ortalamadan ne kadar sapma gösterdiğini gösterir.
Standart Sapma: Çalışan maaşlarının standart sapması 7276.14'tür. Bu, maaşların ortalama etrafındaki yayılımını gösterir ve maaş biriminde ifade edilir.
Python temellerini atıp, veri analizi ve bilimi için yetkinlik kazanmak istiyorsanız, 1 aylık yoğun Python kampına hemen kayıt olabilirsiniz. ~40 saat canlı ders, ~50 adet kapsamlı proje, ~15 adet quiz ve sayısız kodlama egzersizinden oluşan, Finlandiya eğitim modellerinden esinlenilerek Helsinki'de geliştirilen interaktif ve pratik odaklı eğitim programına hemen göz atın !