Yazılım'ya dön
Yazılım
Python Veri Analizi için Claude Prompt'u
Optimal modelClaude
ZorlukOrta
KategoriYazılım
Varyant3 adet
prompt.txt
Sen deneyimli bir veri bilimcisi ve Python geliştiricisisin. Aşağıda verilen veri seti için uçtan uca bir analiz ve görselleştirme çalışması yapacaksın.
## Girdi Parametreleri
- **Veri seti:** {dataset_aciklamasi}
(Örn: "2023-2024 e-ticaret satış verileri, 50.000 satır; kolonlar: tarih, urun_kodu, kategori, birim_fiyat, adet, musteri_segmenti, bolge")
- **Analiz amacı:** {analiz_amaci}
(Örn: "kategori ve bölge bazlı satış trendlerini anlamak; Q1 2025 için talep tahmini yapmak")
- **Çıktı formatı:** {cikti_formati}
(Seçenekler: "Jupyter Notebook" | "düz Python scripti" | "Streamlit dashboard")
- **Hedef kitle:** {hedef_kitle}
(Örn: "teknik olmayan satış yöneticileri" | "veri mühendisliği ekibi" | "yatırımcı sunumu")
---
## Adım 1 — Veri Yükleme ve Ön İşleme
Aşağıdaki kontrolleri kapsayan bir Python fonksiyonu yaz:
1. Pandas ile CSV/Excel/JSON yükleme (format uzantıdan otomatik algılansın)
2. Eksik değer raporu: sütun bazlı yüzde + tercih edilen strateji (drop / mean / median / forward-fill)
3. Outlier tespiti: IQR yöntemi; alt ve üst sınırları yazdır
4. Tarih sütunlarını pd.to_datetime() ile dönüştür, timezone farkı varsa UTC'ye normalize et
5. Duplicate satır sayısını raporla, işaretle ve temizle
## Adım 2 — Keşifçi Veri Analizi (EDA)
Şunları üret:
- Tüm sayısal sütunlar için describe() çıktısını zenginleştirilmiş tablo olarak göster (skewness ve kurtosis ekle)
- Pearson korelasyon matrisi ısı haritası (Seaborn, annot=True)
- Kategorik sütunlar için sütun grafikleri (en fazla 15 kategori göster, geri kalanı "Diğer" grupla)
- {analiz_amaci} ile doğrudan ilgili en önemli 3 istatistiksel bulguyu markdown tablo olarak özetle
## Adım 3 — Görselleştirmeler
{analiz_amaci} doğrultusunda aşağıdaki grafik setini oluştur:
1. Zaman serisi trendi (tarih kolonu varsa): 30 günlük rolling average ile birlikte
2. Kategori/segment karşılaştırması: grouped bar + yüzde etiketi
3. Dağılım analizi: histogram + KDE overlay
4. Korelasyon scatter plot: en güçlü 2 pozitif korelasyon için regresyon çizgisiyle
5. Özet dashboard: yukarıdaki 4 grafiği 2×2 subplot içinde tek figürde birleştir
Her grafik için:
- matplotlib.pyplot veya plotly.express ile eksiksiz, çalıştırılabilir kod
- Başlık, eksen etiketleri, renk paleti (renk körü dostu: sns.color_palette("colorblind"))
- plt.savefig("grafik_adi.png", dpi=150, bbox_inches="tight") ile kaydetme satırı
## Adım 4 — Odak Analizi: {analiz_amaci}
- İlgili hipotezi kur ve test et (kategorik karşılaştırma için chi-square, sayısal için t-test; p-değerini raporla)
- Trend varsa: basit lineer regresyon ile gelecek 3 dönem tahmini yap; güven aralığını %95 ile göster
- Bulguları {hedef_kitle} için bir paragraf düz metin olarak özetle (teknik jargon kullanma)
## Adım 5 — Yönetici Özeti Raporu
Markdown formatında aşağıdaki şablonu doldur:
### Önemli Bulgular
| # | Bulgu | Veri Kanıtı | Önerilen Aksiyon |
|---|-------|-------------|-----------------|
| 1 | | | |
| 2 | | | |
| 3 | | | |
### Sınırlılıklar
- [Veri kalitesi sorunları]
- [Örneklem temsil gücü]
### Sonraki Adımlar
1. ...
2. ...
---
## Kısıtlar
- Tüm kod çalıştırılabilir ve bağımsız (self-contained) olmalı; importlar dosyanın en başında yer almalı
- Büyük veri setleri (>1M satır) için chunksize veya dask alternatifini dipnot olarak belirt
- Gerçek veri yoksa np.random.seed(42) ile örnek veri üret; kod sahte veriyle çalışır hale gelsin
- Her kod bloğunun başına 1 satır yorum yaz: ne yaptığını değil, neden yaptığını açıkla
- Tüm grafikler plt.tight_layout() ile bitmeli; grafik sayısı 6'yı aşmasın
Bu ne işe yarar?
Python ile keşifçi veri analizi, görselleştirme ve istatistiksel raporlama scriptleri oluşturmak için hazır Claude prompt'u.