top of page

Büyük Bir Örnek Veri Seti Oluşturma



Hands-on Mentor Kapsamlı Blog İçeriği
Hands-on Mentor Tutorials



Büyük bir örnek veri seti oluşturmak için, Python'da pandas ve numpy kütüphanelerini kullanarak çeşitli sütunlara sahip bir veri seti oluşturabiliriz. Bu veri seti, gerçek dünyada karşılaşabileceğimiz farklı veri türlerini ve ilişkileri temsil edecektir.


Örnek Veri Seti: Müşteri Bilgileri


Bu veri seti, bir e-ticaret şirketinin müşteri bilgilerini içerecektir. Aşağıdaki sütunlara sahip olacak:


  • CustomerID: Müşteri kimliği (sayı)

  • Age: Yaş (sayı)

  • Gender: Cinsiyet (kategori)

  • AnnualIncome: Yıllık Gelir (sayı)

  • SpendingScore: Harcama Puanı (sayı)

  • Region: Bölge (kategori)

  • Membership: Üyelik Durumu (kategori)

  • PurchaseAmount: Satın Alma Miktarı (sayı)


import pandas as pd
import numpy as np

# Rastgele veri oluşturma için parametreler
np.random.seed(42)
num_samples = 1000

# Müşteri kimlikleri
customer_ids = np.arange(1, num_samples + 1)

# Yaşlar
ages = np.random.randint(18, 70, num_samples)

# Cinsiyetler
genders = np.random.choice(['Male', 'Female'], num_samples)

# Yıllık Gelirler
annual_incomes = np.random.randint(20000, 120000, num_samples)

# Harcama Puanları
spending_scores = np.random.randint(1, 101, num_samples)

# Bölgeler
regions = np.random.choice(['North', 'South', 'East', 'West'], num_samples)

# Üyelik Durumu
memberships = np.random.choice(['Basic', 'Silver', 'Gold', 'Platinum'], num_samples)

# Satın Alma Miktarı
purchase_amounts = np.round(np.random.uniform(20.0, 2000.0, num_samples), 2)

# Veri seti oluşturma
data = {
    'CustomerID': customer_ids,
    'Age': ages,
    'Gender': genders,
    'AnnualIncome': annual_incomes,
    'SpendingScore': spending_scores,
    'Region': regions,
    'Membership': memberships,
    'PurchaseAmount': purchase_amounts
}

# DataFrame oluşturma
df = pd.DataFrame(data)

# CSV dosyasına kaydetme
df.to_csv('customer_data.csv', index=False)

print("Veri seti başarıyla oluşturuldu ve 'customer_data.csv' dosyasına kaydedildi.")


Veri Seti İçeriği


  • CustomerID: Her bir müşteri için benzersiz bir kimlik numarası.

  • Age: Müşterinin yaşı.

  • Gender: Müşterinin cinsiyeti (Male veya Female).

  • AnnualIncome: Müşterinin yıllık geliri (20000 ile 120000 arasında rastgele değerler).

  • SpendingScore: Müşterinin harcama puanı (1 ile 100 arasında rastgele değerler).

  • Region: Müşterinin ikamet ettiği bölge (North, South, East, West).

  • Membership: Müşterinin üyelik durumu (Basic, Silver, Gold, Platinum).

  • PurchaseAmount: Müşterinin yaptığı satın alma miktarı (20.0 ile 2000.0 arasında rastgele değerler).


Veri Setinin Kullanımı

Bu veri seti, veri keşfi ve doğrulama süreçlerinde kullanılabilir. İstatistiksel analizler, veri temizleme, veri görselleştirme ve korelasyon analizleri gibi çeşitli işlemler için uygundur.

Bu veri setini kullanarak, veri keşfi ve doğrulama adımlarını detaylı bir şekilde uygulayabilirsiniz.


 

Python temellerini atıp, veri analizi ve bilimi için yetkinlik kazanmak istiyorsanız, 1 aylık yoğun Python kampına hemen kayıt olabilirsiniz. ~40 saat canlı ders, ~50 adet kapsamlı proje, ~15 adet quiz ve sayısız kodlama egzersizinden oluşan, Finlandiya eğitim modellerinden esinlenilerek Helsinki'de geliştirilen interaktif ve pratik odaklı eğitim programına hemen göz atın !




bottom of page