top of page

Veri Gruplama ve Pivot Tablolar (Data Grouping and Pivot Tables)



Hands-on Mentor Kapsamlı Blog İçeriği
Hands-on Mentor Tutorials




Veri Gruplamanın Tanımı

Veri gruplama, verilerin belirli kategorilere göre gruplandırılması ve özetlenmesi işlemidir. Bu, verilerin belirli gruplar arasındaki farklarını ve ilişkilerini anlamamıza yardımcı olur. Pivot tablolar, verilerin özetlenmesi ve görselleştirilmesi için kullanılan güçlü bir araçtır. Pivot tablolar, verileri dinamik olarak gruplandırmak ve özetlemek için kullanılır.


Veri Gruplama

Veri gruplama işlemi, groupby() fonksiyonu kullanılarak yapılır. Gruplama işlemi sonrasında, gruplar üzerinde çeşitli özetleme fonksiyonları (mean, sum, count vb.) uygulanabilir.


Örnek: Bölgeler Bazında Ortalama Yıllık Gelir


import pandas as pd

# Veri setini yükleme
df = pd.read_csv('customer_data.csv')

# Bölgeler bazında ortalama yıllık gelir
mean_income_by_region = df.groupby('Region')['AnnualIncome'].mean()
print(mean_income_by_region)


Örnek: Üyelik Durumu Bazında Toplam Harcama Puanı


# Üyelik durumu bazında toplam harcama puanı
total_spending_by_membership = df.groupby('Membership')['SpendingScore'].sum()
print(total_spending_by_membership)


Pivot Tablolar

Pivot tablolar, verilerin özetlenmesi ve görselleştirilmesi için kullanılır. Pivot tablolar, verileri dinamik olarak gruplandırmak ve özetlemek için güçlü bir araçtır.


Örnek: Bölgeler ve Cinsiyet Bazında Ortalama Yıllık Gelir


# Pivot tablo oluşturma
pivot_table = df.pivot_table(values='AnnualIncome', index='Region', columns='Gender', aggfunc='mean')
print(pivot_table)


Örnek: Üyelik Durumu ve Bölge Bazında Toplam Harcama Puanı


# Pivot tablo oluşturma
pivot_table = df.pivot_table(values='SpendingScore', index='Membership', columns='Region', aggfunc='sum')
print(pivot_table)


Pivot Tabloları Görselleştirme

Pivot tabloları görselleştirmek, verilerin daha kolay anlaşılmasını sağlar. Aşağıdaki örneklerde, pivot tablolarını görselleştirelim.


Örnek: Bölgeler ve Cinsiyet Bazında Ortalama Yıllık Gelir Grafiği


import matplotlib.pyplot as plt

# Pivot tablo oluşturma
pivot_table = df.pivot_table(values='AnnualIncome', index='Region', columns='Gender', aggfunc='mean')

# Pivot tabloyu grafikle gösterme
pivot_table.plot(kind='bar')
plt.title('Bölgeler ve Cinsiyet Bazında Ortalama Yıllık Gelir')
plt.xlabel('Bölgeler')
plt.ylabel('Ortalama Yıllık Gelir')
plt.grid(True)
plt.show()


Örnek: Üyelik Durumu ve Bölge Bazında Toplam Harcama Puanı Grafiği


# Pivot tablo oluşturma
pivot_table = df.pivot_table(values='SpendingScore', index='Membership', columns='Region', aggfunc='sum')

# Pivot tabloyu grafikle gösterme
pivot_table.plot(kind='bar', stacked=True)
plt.title('Üyelik Durumu ve Bölge Bazında Toplam Harcama Puanı')
plt.xlabel('Üyelik Durumu')
plt.ylabel('Toplam Harcama Puanı')
plt.grid(True)
plt.show()


Sonuç

Veri gruplama ve pivot tablolar, verilerin belirli kategorilere göre gruplandırılması ve özetlenmesi için güçlü araçlardır. Bu yöntemler, verilerin belirli gruplar arasındaki farklarını ve ilişkilerini anlamamıza yardımcı olur. Pivot tablolar, verilerin dinamik olarak gruplandırılması ve özetlenmesi için kullanılır ve görselleştirme ile desteklendiğinde verilerin daha kolay anlaşılmasını sağlar.


 

Python temellerini atıp, veri analizi ve bilimi için yetkinlik kazanmak istiyorsanız, 1 aylık yoğun Python kampına hemen kayıt olabilirsiniz. ~40 saat canlı ders, ~50 adet kapsamlı proje, ~15 adet quiz ve sayısız kodlama egzersizinden oluşan, Finlandiya eğitim modellerinden esinlenilerek Helsinki'de geliştirilen interaktif ve pratik odaklı eğitim programına hemen göz atın !




bottom of page