top of page

Veri Özetleme ve Görselleştirme (Data Summarization and Visualization)



Hands-on Mentor Kapsamlı Blog İçeriği
Hands-on Mentor Tutorials




Veri Özetlemenin Tanımı

Veri özetleme, veri setinin temel özelliklerini ve dağılımlarını özetlemek için yapılan işlemdir. Bu süreç, verilerin daha kolay anlaşılmasını sağlar ve analizlerin doğruluğunu artırır. Veri görselleştirme ise, verilerin grafiklerle görselleştirilmesi sürecidir. Bu, verilerin desenlerini ve ilişkilerini görsel olarak keşfetmeyi sağlar.


Veri Özetleme Adımları


  1. Temel İstatistiklerin Hesaplanması

  2. Veri Dağılımlarının İncelenmesi

  3. Veri Gruplamalarının Yapılması

  4. Veri İlişkilerinin İncelenmesi


1. Temel İstatistiklerin Hesaplanması

Veri setinin temel istatistiklerini hesaplayarak veri özetlemesine başlayabiliriz. Bu istatistikler, verilerin ortalaması, medyanı, standart sapması, minimum ve maksimum değerleri gibi bilgileri içerir.


Örnek:


import pandas as pd

# Veri setini yükleme
df = pd.read_csv('customer_data.csv')

# Temel istatistikler
print(df.describe())


2. Veri Dağılımlarının İncelenmesi

Veri dağılımlarını incelemek, verilerin nasıl dağıldığını anlamamıza yardımcı olur. Histogramlar ve kutu grafikler, veri dağılımlarını görselleştirmek için yaygın olarak kullanılır.


Histogram:


import matplotlib.pyplot as plt

# Histogram çizimi (Yaş dağılımı)
df['Age'].hist()
plt.title('Yaş Dağılımı Histogramı')
plt.xlabel('Yaş')
plt.ylabel('Frekans')
plt.grid(True)
plt.show()


Kutu Grafiği (Box Plot):


# Kutu grafiği (Yıllık Gelir)
df.boxplot(column='AnnualIncome')
plt.title('Yıllık Gelir Kutu Grafiği')
plt.ylabel('Yıllık Gelir')
plt.grid(True)
plt.show()


3. Veri Gruplamalarının Yapılması

Veri gruplama, verilerin belirli kategorilere göre gruplandırılması ve özetlenmesi işlemidir. Bu, verilerin belirli gruplar arasındaki farklarını anlamamıza yardımcı olur.


Gruplama ve Ortalama Hesaplama:


# Bölgeler bazında ortalama yıllık gelir
mean_income_by_region = df.groupby('Region')['AnnualIncome'].mean()
print(mean_income_by_region)


Gruplama ve Toplam Hesaplama:


# Üyelik durumu bazında toplam harcama puanı
total_spending_by_membership = df.groupby('Membership')['SpendingScore'].sum()
print(total_spending_by_membership)


4. Veri İlişkilerinin İncelenmesi

Veri setindeki değişkenler arasındaki ilişkileri incelemek, korelasyon ve scatter plot gibi yöntemlerle yapılabilir.


Korelasyon Matrisi:


# Korelasyon matrisi hesaplama
corr_matrix = df.corr()
print(corr_matrix)

# Korelasyon matrisi görselleştirme
import seaborn as sns
plt.figure(figsize=(10, 8))
sns.heatmap(corr_matrix, annot=True, cmap='coolwarm')
plt.title('Korelasyon Matrisi Heatmap')
plt.show()


Scatter Plot:


# Scatter plot (Yıllık Gelir ve Harcama Puanı)
df.plot(kind='scatter', x='AnnualIncome', y='SpendingScore')
plt.title('Yıllık Gelir ve Harcama Puanı Scatter Plot')
plt.xlabel('Yıllık Gelir')
plt.ylabel('Harcama Puanı')
plt.grid(True)
plt.show()


Sonuç

Veri özetleme ve görselleştirme, veri setinin temel özelliklerini ve dağılımlarını anlamak için kritik adımlardır. Temel istatistiklerin hesaplanması, veri dağılımlarının incelenmesi, veri gruplamalarının yapılması ve veri ilişkilerinin incelenmesi gibi adımları içerir. Bu adımlar, verilerin daha kolay anlaşılmasını sağlar ve analizlerin doğruluğunu artırır.


Bu içerik, veri özetleme ve görselleştirmenin temel kavramlarını ve yöntemlerini detaylandırır. Veri özetlemenin yanı sıra, pratik örneklerle bu kavramların nasıl kullanılabileceğini gösterir. Bir sonraki bölümde, "Veri Gruplama ve Pivot Tablolar" konusunu ele alarak, veri gruplama ve pivot tabloların nasıl kullanılacağını inceleyeceğiz.


 

Python temellerini atıp, veri analizi ve bilimi için yetkinlik kazanmak istiyorsanız, 1 aylık yoğun Python kampına hemen kayıt olabilirsiniz. ~40 saat canlı ders, ~50 adet kapsamlı proje, ~15 adet quiz ve sayısız kodlama egzersizinden oluşan, Finlandiya eğitim modellerinden esinlenilerek Helsinki'de geliştirilen interaktif ve pratik odaklı eğitim programına hemen göz atın !




bottom of page