Python ile Veri Analizine Giriş: Pandas ve NumPy ile İlk Adımlarınız 
Selam dostlar! Bugün sizlere, yazılım dünyasının en heyecan verici ve popüler alanlarından biri olan veri analizine Python ile nasıl başlayabileceğinizden bahsedeceğim. Eğer verilerle uğraşmak, onlardan anlamlı hikayeler çıkarmak ve kararlarınızı bu hikayelerle desteklemek size heyecan veriyorsa, doğru yerdesiniz.
Python, bu alanda neredeyse bir standart haline geldi. Bunun en büyük sebeplerinden ikisi ise NumPy ve Pandas kütüphaneleri. Gelin, bu iki güçlü aracı tanıyalım ve ilk adımlarımızı atalım.
NumPy: Sayısal Hesaplamaların Temel Taşı
NumPy, Python'da çok boyutlu diziler (arrays) ve matrislerle çalışmak için tasarlanmış temel bir kütüphanedir. En büyük gücü, Python'un standart listelerine kıyasla çok daha hızlı ve verimli olmasıdır. Çünkü arka planda C diliyle optimize edilmiş kodlar çalıştırır.
İlk olarak, bu kütüphaneleri kurmamız gerekiyor. Terminalinizi (veya komut istemcinizi) açın ve şu komutu çalıştırın:
Kurulum tamamlandığında, artık kod yazmaya başlayabiliriz. İşte basit bir NumPy örneği:
Gördüğünüz gibi, matematiksel işlemleri birkaç satır kodla yapabiliyoruz. NumPy, veri analizinin "motoru" gibidir.
Pandas: Verilerle Dans Etmenin Yolu
NumPy güçlüdür ama ham verilerle (Excel, CSV dosyaları, veritabanları) çalışırken biraz daha üst seviye bir araca ihtiyaç duyarız. İşte tam burada Pandas devreye giriyor. Pandas, verileri düzenlemek, temizlemek, filtrelemek ve analiz etmek için kullanılan, DataFrame adı verilen esnek ve güçlü bir veri yapısı sunar.
Haydi basit bir CSV dosyası yükleyip üzerinde işlem yapalım. Diyelim ki "satislar.csv" adında bir dosyamız var. İçeriği şöyle olsun:
[Tarih,Ürün,Miktar,Fiyat]
2023-10-01,Laptop,5,8000
2023-10-01,Telefon,12,4000
2023-10-02,Laptop,3,8000
2023-10-02,Kulaklık,20,500
Pandas ile verileri okumak, gruplamak, yeni bilgiler türetmek ve filtrelemek inanılmaz kolay hale geliyor.
İlk Proje Fikirleri ve Sonraki Adımlar
Bu araçları öğrenirken en iyi yöntem, hemen küçük projelere dalmaktır. İşte size birkaç fikir:
Unutmayın, yolculuğun başındayken her şeyi bilmek zorunda değilsiniz. Önemli olan başlamak ve denemektir. NumPy ve Pandas'ın dokümantasyonları harikadır, sık sık ziyaret edin.
Umarım bu rehber, veri dünyasına açılan kapıda size küçük bir ışık tutmuştur.
Sormak istediğiniz bir şey var mı? Hangi konuda daha derinlemesine bir yazı görmek istersiniz? Yorumlarda buluşalım!
Selam dostlar! Bugün sizlere, yazılım dünyasının en heyecan verici ve popüler alanlarından biri olan veri analizine Python ile nasıl başlayabileceğinizden bahsedeceğim. Eğer verilerle uğraşmak, onlardan anlamlı hikayeler çıkarmak ve kararlarınızı bu hikayelerle desteklemek size heyecan veriyorsa, doğru yerdesiniz.
Python, bu alanda neredeyse bir standart haline geldi. Bunun en büyük sebeplerinden ikisi ise NumPy ve Pandas kütüphaneleri. Gelin, bu iki güçlü aracı tanıyalım ve ilk adımlarımızı atalım.
NumPy: Sayısal Hesaplamaların Temel Taşı
NumPy, Python'da çok boyutlu diziler (arrays) ve matrislerle çalışmak için tasarlanmış temel bir kütüphanedir. En büyük gücü, Python'un standart listelerine kıyasla çok daha hızlı ve verimli olmasıdır. Çünkü arka planda C diliyle optimize edilmiş kodlar çalıştırır.
İlk olarak, bu kütüphaneleri kurmamız gerekiyor. Terminalinizi (veya komut istemcinizi) açın ve şu komutu çalıştırın:
Python:
pip install numpy pandas
Kurulum tamamlandığında, artık kod yazmaya başlayabiliriz. İşte basit bir NumPy örneği:
Python:
import numpy as np
# Basit bir NumPy dizisi oluşturalım
sayilarim = np.array([10, 20, 30, 40, 50])
print("NumPy Dizim:", sayilarim)
# Dizinin ortalamasını alalım
ortalama = np.mean(sayilarim)
print("Ortalama:", ortalama)
# 3x3'lük bir matris oluşturalım
matris = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print("\nMatrisimiz:")
print(matris)
# Matrisin transpozunu (devriğini) alalım
transpoz = matris.T
print("\nMatrisin Transpozu:")
print(transpoz)
Gördüğünüz gibi, matematiksel işlemleri birkaç satır kodla yapabiliyoruz. NumPy, veri analizinin "motoru" gibidir.
Pandas: Verilerle Dans Etmenin Yolu
NumPy güçlüdür ama ham verilerle (Excel, CSV dosyaları, veritabanları) çalışırken biraz daha üst seviye bir araca ihtiyaç duyarız. İşte tam burada Pandas devreye giriyor. Pandas, verileri düzenlemek, temizlemek, filtrelemek ve analiz etmek için kullanılan, DataFrame adı verilen esnek ve güçlü bir veri yapısı sunar.
Haydi basit bir CSV dosyası yükleyip üzerinde işlem yapalım. Diyelim ki "satislar.csv" adında bir dosyamız var. İçeriği şöyle olsun:
[Tarih,Ürün,Miktar,Fiyat]
2023-10-01,Laptop,5,8000
2023-10-01,Telefon,12,4000
2023-10-02,Laptop,3,8000
2023-10-02,Kulaklık,20,500
Python:
import pandas as pd
# CSV dosyasını okuma
df = pd.read_csv('satislar.csv')
print("Ham Veri Çerçevemiz:")
print(df)
print("\nVeri Çerçevesi Bilgisi:")
print(df.info())
# İlk 5 satırı göster
print("\nİlk 5 Kayıt:")
print(df.head())
# Basit bir analiz: Her ürünün toplam satış miktarı
toplam_satis = df.groupby('Ürün')['Miktar'].sum()
print("\nHer Ürünün Toplam Satış Miktarı:")
print(toplam_satis)
# Yeni bir sütun oluşturma: Ciro (Miktar * Fiyat)
df['Ciro'] = df['Miktar'] * df['Fiyat']
print("\nCiro Sütunu Eklendi:")
print(df[['Ürün', 'Ciro']])
Pandas ile verileri okumak, gruplamak, yeni bilgiler türetmek ve filtrelemek inanılmaz kolay hale geliyor.
İlk Proje Fikirleri ve Sonraki Adımlar
Bu araçları öğrenirken en iyi yöntem, hemen küçük projelere dalmaktır. İşte size birkaç fikir:
- Kendi kişisel harcamalarınızı bir CSV'ye kaydedin ve Pandas ile aylık özetler çıkarın.
- İnternetten ücretsiz bir veri seti (örneğin, hava durumu veya film verileri) bulun ve keşfedici veri analizi (EDA) yapın.
- NumPy ile basit bir lineer regresyon modeli yazmayı deneyin.
Unutmayın, yolculuğun başındayken her şeyi bilmek zorunda değilsiniz. Önemli olan başlamak ve denemektir. NumPy ve Pandas'ın dokümantasyonları harikadır, sık sık ziyaret edin.
Umarım bu rehber, veri dünyasına açılan kapıda size küçük bir ışık tutmuştur.
Sormak istediğiniz bir şey var mı? Hangi konuda daha derinlemesine bir yazı görmek istersiniz? Yorumlarda buluşalım!