top of page

Pandas ile Veri Manipülasyonu



Hands-on Mentor Kapsamlı Blog İçeriği
Hands-on Mentor Tutorials


Summary Statistics

Pandas, veri özetleme ve istatistiksel analizler için çeşitli fonksiyonlar sunar. Bu fonksiyonlar, verilerin merkezi eğilim ve dağılımını anlamaya yardımcı olur.


Özet İstatistikler

describe() fonksiyonu, DataFrame'deki sayısal sütunlar için temel istatistikleri döner.


Örnek:


import pandas as pd

# DataFrame oluşturma
data = {
    "Öğrenci": ["Ali", "Ayşe", "Mehmet", "Fatma", "Ahmet"],
    "Matematik": [85, 95, 70, 90, 78],
    "Fizik": [90, 85, 80, 92, 75],
    "Kimya": [78, 88, 85, 89, 80]
}

df = pd.DataFrame(data)

# Özet istatistikler
summary = df.describe()
print(summary)
# Çıktı:
#        Matematik      Fizik      Kimya
# count   5.000000   5.000000   5.000000
# mean   83.600000  84.400000  84.000000
# std     9.618357   6.532169   4.949747
# min    70.000000  75.000000  78.000000
# 25%    78.000000  80.000000  80.000000
# 50%    85.000000  85.000000  85.000000
# 75%    90.000000  90.000000  88.000000
# max    95.000000  92.000000  89.000000


Toplam (Sum)

sum() fonksiyonu, DataFrame'in sütunları boyunca elemanların toplamını döner.


Örnek:


import pandas as pd

# 'Matematik' notlarının toplamı
total_math = df['Matematik'].sum()
print("Total Math Score:", total_math)
# Çıktı: Total Math Score: 418


Ortalama (Mean)

mean() fonksiyonu, DataFrame'in sütunları boyunca elemanların ortalamasını döner.


Örnek:


import pandas as pd

# 'Fizik' notlarının ortalaması
average_physics = df['Fizik'].mean()
print("Average Physics Score:", average_physics)
# Çıktı: Average Physics Score: 84.4


Medyan (Median)

median() fonksiyonu, DataFrame'in sütunları boyunca elemanların medyanını döner.


Örnek:


import pandas as pd

# 'Kimya' notlarının medyanı
median_chemistry = df['Kimya'].median()
print("Median Chemistry Score:", median_chemistry)
# Çıktı: Median Chemistry Score: 85.0


Standart Sapma (Standard Deviation)

std() fonksiyonu, DataFrame'in sütunları boyunca elemanların standart sapmasını döner.


Örnek:


import pandas as pd

# 'Matematik' notlarının standart sapması
std_math = df['Matematik'].std()
print("Standard Deviation of Math Scores:", std_math)
# Çıktı: Standard Deviation of Math Scores: 9.618357


Cumulative Statistics

Pandas, kümülatif istatistikler hesaplamak için çeşitli fonksiyonlar sunar. Bu fonksiyonlar, bir DataFrame'in elemanları boyunca kümülatif toplamları, çarpımları ve diğer işlemleri hesaplar.


Kümülatif Toplam (Cumulative Sum)

cumsum() fonksiyonu, kümülatif toplamı hesaplar.


Örnek:


import pandas as pd

# 'Matematik' notlarının kümülatif toplamı
cumsum_math = df['Matematik'].cumsum()
print("Cumulative Sum of Math Scores:\\n", cumsum_math)
# Çıktı:
# 0     85
# 1    180
# 2    250
# 3    340
# 4    418
# Name: Matematik, dtype: int64


Kümülatif Çarpım (Cumulative Product)

cumprod() fonksiyonu, kümülatif çarpımı hesaplar.


Örnek:


import pandas as pd

# 'Matematik' notlarının kümülatif çarpımı
cumprod_math = df['Matematik'].cumprod()
print("Cumulative Product of Math Scores:\\n", cumprod_math)
# Çıktı:
# 0          85
# 1        8075
# 2      565250
# 3    50872500
# 4  3968035000
# Name: Matematik, dtype: int64


Kümülatif Minimum (Cumulative Minimum)

cummin() fonksiyonu, kümülatif minimumu hesaplar.


Örnek:


import pandas as pd

# 'Matematik' notlarının kümülatif minimumu
cummin_math = df['Matematik'].cummin()
print("Cumulative Minimum of Math Scores:\\n", cummin_math)
# Çıktı:
# 0    85
# 1    85
# 2    70
# 3    70
# 4    70
# Name: Matematik, dtype: int64


Kümülatif Maksimum (Cumulative Maximum)

cummax() fonksiyonu, kümülatif maksimumu hesaplar.


Örnek:


import pandas as pd

# 'Matematik' notlarının kümülatif maksimumu
cummax_math = df['Matematik'].cummax()
print("Cumulative Maximum of Math Scores:\\n", cummax_math)
# Çıktı:
# 0    85
# 1    95
# 2    95
# 3    95
# 4    95
# Name: Matematik, dtype: int64


Counting

Pandas, veri sayma işlemleri için çeşitli fonksiyonlar sunar. Bu fonksiyonlar, bir DataFrame'deki belirli değerlerin sayısını hesaplamaya yardımcı olur.


Değer Sayma (Value Counts)

value_counts() fonksiyonu, belirli bir sütundaki benzersiz değerlerin sayısını döner.


Örnek:


import pandas as pd

# Öğrencilerin 'Matematik' notlarını gruplayarak sayma
value_counts_math = df['Matematik'].value_counts()
print("Value Counts of Math Scores:\\n", value_counts_math)
# Çıktı:
# 85    1
# 95    1
# 70    1
# 90    1
# 78    1
# Name: Matematik, dtype: int64


Eleman Sayma (Count)

count() fonksiyonu, bir DataFrame'deki elemanların sayısını döner.


Örnek:


import pandas as pd

# 'Matematik' sütunundaki eleman sayısı
count_math = df['Matematik'].count()
print("Count of Math Scores:", count_math)
# Çıktı: Count of Math Scores: 5


Dropping Duplicates

Pandas, yinelenen verileri kaldırmak için drop_duplicates() fonksiyonunu sağlar. Bu fonksiyon, bir DataFrame'deki yinelenen satırları kaldırır.


Yinelenen Satırları Kaldırma


Örnek:


import pandas as pd

# Yinelenen satırları içeren DataFrame oluşturma
data = {
    "Öğrenci": ["Ali", "Ayşe", "Ali", "Fatma", "Ahmet", "Ayşe"],
    "Matematik": [85, 95, 85, 90, 78, 95],
    "Fizik": [90, 85, 90, 92, 75, 85],
    "Kimya": [78, 88, 78, 89, 80, 88]
}

df = pd.DataFrame(data)

# Yinelenen satırları kaldırma
df_no_duplicates = df.drop_duplicates()
print("DataFrame without duplicates:\\n", df_no_duplicates)
# Çıktı:
#   Öğrenci  Matematik  Fizik  Kimya
# 0     Ali         85     90     78
# 1    Ayşe         95     85     88
# 3   Fatma         90     92     89
# 4   Ahmet         78     75     80


Belirli Sütunlara Göre Yinelenen Satırları Kaldırma


Örnek:


import pandas as pd

# 'Öğrenci' sütununa göre yinelenen satırları kaldırma
df_no_duplicates = df.drop_duplicates(subset=['Öğrenci'])
print("DataFrame without duplicates based on 'Öğrenci':\\n", df_no_duplicates)
# Çıktı:
#   Öğrenci  Matematik  Fizik  Kimya
# 0     Ali         85     90     78
# 1    Ayşe         95     85     88
# 3   Fatma         90     92     89
# 4   Ahmet         78     75     80


Bu dersin yedinci partı ile Pandas ile veri özetleme, kümülatif istatistikler, veri sayma ve yinelenen verileri kaldırma işlemlerini öğrendik. Bir sonraki partta, Pandas ile gruplama ve pivot tabloları kullanarak veri analizi yapmayı öğreneceğiz.

 

Python temellerini atıp, veri analizi ve bilimi için yetkinlik kazanmak istiyorsanız, 1 aylık yoğun Python kampına hemen kayıt olabilirsiniz. ~40 saat canlı ders, ~50 adet kapsamlı proje, ~15 adet quiz ve sayısız kodlama egzersizinden oluşan, Finlandiya eğitim modellerinden esinlenilerek Helsinki'de geliştirilen interaktif ve pratik odaklı eğitim programına hemen göz atın !




bottom of page