Summary Statistics
Pandas, veri özetleme ve istatistiksel analizler için çeşitli fonksiyonlar sunar. Bu fonksiyonlar, verilerin merkezi eğilim ve dağılımını anlamaya yardımcı olur.
Özet İstatistikler
describe() fonksiyonu, DataFrame'deki sayısal sütunlar için temel istatistikleri döner.
Örnek:
import pandas as pd
# DataFrame oluşturma
data = {
"Öğrenci": ["Ali", "Ayşe", "Mehmet", "Fatma", "Ahmet"],
"Matematik": [85, 95, 70, 90, 78],
"Fizik": [90, 85, 80, 92, 75],
"Kimya": [78, 88, 85, 89, 80]
}
df = pd.DataFrame(data)
# Özet istatistikler
summary = df.describe()
print(summary)
# Çıktı:
# Matematik Fizik Kimya
# count 5.000000 5.000000 5.000000
# mean 83.600000 84.400000 84.000000
# std 9.618357 6.532169 4.949747
# min 70.000000 75.000000 78.000000
# 25% 78.000000 80.000000 80.000000
# 50% 85.000000 85.000000 85.000000
# 75% 90.000000 90.000000 88.000000
# max 95.000000 92.000000 89.000000
Toplam (Sum)
sum() fonksiyonu, DataFrame'in sütunları boyunca elemanların toplamını döner.
Örnek:
import pandas as pd
# 'Matematik' notlarının toplamı
total_math = df['Matematik'].sum()
print("Total Math Score:", total_math)
# Çıktı: Total Math Score: 418
Ortalama (Mean)
mean() fonksiyonu, DataFrame'in sütunları boyunca elemanların ortalamasını döner.
Örnek:
import pandas as pd
# 'Fizik' notlarının ortalaması
average_physics = df['Fizik'].mean()
print("Average Physics Score:", average_physics)
# Çıktı: Average Physics Score: 84.4
Medyan (Median)
median() fonksiyonu, DataFrame'in sütunları boyunca elemanların medyanını döner.
Örnek:
import pandas as pd
# 'Kimya' notlarının medyanı
median_chemistry = df['Kimya'].median()
print("Median Chemistry Score:", median_chemistry)
# Çıktı: Median Chemistry Score: 85.0
Standart Sapma (Standard Deviation)
std() fonksiyonu, DataFrame'in sütunları boyunca elemanların standart sapmasını döner.
Örnek:
import pandas as pd
# 'Matematik' notlarının standart sapması
std_math = df['Matematik'].std()
print("Standard Deviation of Math Scores:", std_math)
# Çıktı: Standard Deviation of Math Scores: 9.618357
Cumulative Statistics
Pandas, kümülatif istatistikler hesaplamak için çeşitli fonksiyonlar sunar. Bu fonksiyonlar, bir DataFrame'in elemanları boyunca kümülatif toplamları, çarpımları ve diğer işlemleri hesaplar.
Kümülatif Toplam (Cumulative Sum)
cumsum() fonksiyonu, kümülatif toplamı hesaplar.
Örnek:
import pandas as pd
# 'Matematik' notlarının kümülatif toplamı
cumsum_math = df['Matematik'].cumsum()
print("Cumulative Sum of Math Scores:\\n", cumsum_math)
# Çıktı:
# 0 85
# 1 180
# 2 250
# 3 340
# 4 418
# Name: Matematik, dtype: int64
Kümülatif Çarpım (Cumulative Product)
cumprod() fonksiyonu, kümülatif çarpımı hesaplar.
Örnek:
import pandas as pd
# 'Matematik' notlarının kümülatif çarpımı
cumprod_math = df['Matematik'].cumprod()
print("Cumulative Product of Math Scores:\\n", cumprod_math)
# Çıktı:
# 0 85
# 1 8075
# 2 565250
# 3 50872500
# 4 3968035000
# Name: Matematik, dtype: int64
Kümülatif Minimum (Cumulative Minimum)
cummin() fonksiyonu, kümülatif minimumu hesaplar.
Örnek:
import pandas as pd
# 'Matematik' notlarının kümülatif minimumu
cummin_math = df['Matematik'].cummin()
print("Cumulative Minimum of Math Scores:\\n", cummin_math)
# Çıktı:
# 0 85
# 1 85
# 2 70
# 3 70
# 4 70
# Name: Matematik, dtype: int64
Kümülatif Maksimum (Cumulative Maximum)
cummax() fonksiyonu, kümülatif maksimumu hesaplar.
Örnek:
import pandas as pd
# 'Matematik' notlarının kümülatif maksimumu
cummax_math = df['Matematik'].cummax()
print("Cumulative Maximum of Math Scores:\\n", cummax_math)
# Çıktı:
# 0 85
# 1 95
# 2 95
# 3 95
# 4 95
# Name: Matematik, dtype: int64
Counting
Pandas, veri sayma işlemleri için çeşitli fonksiyonlar sunar. Bu fonksiyonlar, bir DataFrame'deki belirli değerlerin sayısını hesaplamaya yardımcı olur.
Değer Sayma (Value Counts)
value_counts() fonksiyonu, belirli bir sütundaki benzersiz değerlerin sayısını döner.
Örnek:
import pandas as pd
# Öğrencilerin 'Matematik' notlarını gruplayarak sayma
value_counts_math = df['Matematik'].value_counts()
print("Value Counts of Math Scores:\\n", value_counts_math)
# Çıktı:
# 85 1
# 95 1
# 70 1
# 90 1
# 78 1
# Name: Matematik, dtype: int64
Eleman Sayma (Count)
count() fonksiyonu, bir DataFrame'deki elemanların sayısını döner.
Örnek:
import pandas as pd
# 'Matematik' sütunundaki eleman sayısı
count_math = df['Matematik'].count()
print("Count of Math Scores:", count_math)
# Çıktı: Count of Math Scores: 5
Dropping Duplicates
Pandas, yinelenen verileri kaldırmak için drop_duplicates() fonksiyonunu sağlar. Bu fonksiyon, bir DataFrame'deki yinelenen satırları kaldırır.
Yinelenen Satırları Kaldırma
Örnek:
import pandas as pd
# Yinelenen satırları içeren DataFrame oluşturma
data = {
"Öğrenci": ["Ali", "Ayşe", "Ali", "Fatma", "Ahmet", "Ayşe"],
"Matematik": [85, 95, 85, 90, 78, 95],
"Fizik": [90, 85, 90, 92, 75, 85],
"Kimya": [78, 88, 78, 89, 80, 88]
}
df = pd.DataFrame(data)
# Yinelenen satırları kaldırma
df_no_duplicates = df.drop_duplicates()
print("DataFrame without duplicates:\\n", df_no_duplicates)
# Çıktı:
# Öğrenci Matematik Fizik Kimya
# 0 Ali 85 90 78
# 1 Ayşe 95 85 88
# 3 Fatma 90 92 89
# 4 Ahmet 78 75 80
Belirli Sütunlara Göre Yinelenen Satırları Kaldırma
Örnek:
import pandas as pd
# 'Öğrenci' sütununa göre yinelenen satırları kaldırma
df_no_duplicates = df.drop_duplicates(subset=['Öğrenci'])
print("DataFrame without duplicates based on 'Öğrenci':\\n", df_no_duplicates)
# Çıktı:
# Öğrenci Matematik Fizik Kimya
# 0 Ali 85 90 78
# 1 Ayşe 95 85 88
# 3 Fatma 90 92 89
# 4 Ahmet 78 75 80
Bu dersin yedinci partı ile Pandas ile veri özetleme, kümülatif istatistikler, veri sayma ve yinelenen verileri kaldırma işlemlerini öğrendik. Bir sonraki partta, Pandas ile gruplama ve pivot tabloları kullanarak veri analizi yapmayı öğreneceğiz.
Python temellerini atıp, veri analizi ve bilimi için yetkinlik kazanmak istiyorsanız, 1 aylık yoğun Python kampına hemen kayıt olabilirsiniz. ~40 saat canlı ders, ~50 adet kapsamlı proje, ~15 adet quiz ve sayısız kodlama egzersizinden oluşan, Finlandiya eğitim modellerinden esinlenilerek Helsinki'de geliştirilen interaktif ve pratik odaklı eğitim programına hemen göz atın !