Python for Data Science Cheat Sheet

Giriş: Veri Biliminin Temelleri

Veri bilimi, günümüzün en popüler ve önemli alanlarından biridir. Veri analizi, modelleme, görselleştirme ve makine öğrenmesi gibi konular, iş dünyasından akademiye kadar birçok alanda kullanılmaktadır. Python, veri bilimi için en popüler programlama dillerinden biri olarak öne çıkmaktadır. Bu rehberde, veri bilimi çalışmalarınızı hızlandıracak temel Python bilgilerini derleyecek ve bir ‘cheat sheet’ formatında sunacağız.

Python için veri bilimi alanında en yaygın kütüphaneler arasında NumPy, Pandas, Matplotlib, Seaborn ve scikit-learn bulunmaktadır. Bu kütüphaneler, veri analizi, görselleştirme ve makine öğrenmesi dahil olmak üzere farklı alanlarda kullanabileceğiniz oldukça faydalı araçlar sunar. Aşağıda yer alan içerik, bu kütüphanelerin temel işlevlerini ve kullanımını kapsayacaktır.

Bu cheat sheet, veri bilimine yeni başlayanlar ve kendini geliştirmek isteyenler için temel bir kaynak olacaktır. Python dilinde veri biliminin kapılarını aralarken, aynı zamanda sıkça kullanılan yöntemleri ve kod parçalarını da sizlerle paylaşacağız.

NumPy ile Veri İşleme

NumPy, Python’da sayısal hesaplamalar yapmak için kullanılan temel bir kütüphanedir. Çok boyutlu diziler oluşturma, matematiksel işlemler yapma ve veri analizi için temel araçlar sunar. Aşağıda, NumPy’de sıkça kullanılan bazı işlevleri ve bunların nasıl kullanılacağını bulacaksınız:

Diziler Oluşturma

import numpy as np

# 1 boyutlu dizi oluşturma
array_1d = np.array([1, 2, 3, 4, 5])

# 2 boyutlu dizi (matris) oluşturma
array_2d = np.array([[1, 2], [3, 4]])

Diziler üzerinde birçok işlem yapabilirsiniz. Aşağıda bazı temel işlevler bulunmaktadır:

Temel İşlemler

# Elemanlara ulaşmak
value = array_1d[2]  # 3. elemanı alır

# Dizinin boyutunu öğrenmek
shape = array_2d.shape

# Toplama işlemi
sum_array = np.sum(array_1d)

Bu temel işler, veri analizi sırasında dizilerle nasıl çalışacağınızı anlamanıza yardımcı olacaktır. İleri düzeyde uygulamalar için daha karmaşık işlemlere de başvurabilirsiniz, ancak öncelikle bu temel bilgilerin sağlam olması önemlidir.

Pandas ile Veri Manipülasyonu

Pandas, veri analizi için en çok tercih edilen kütüphanelerden biridir. Veri çerçeveleri (DataFrame) ve seriler (Series) ile çalışarak, karmaşık veri manipülasyonları yapmanıza olanak tanır. Aşağıda, Pandas ile veri yükleme, temizleme ve analiz etme adımlarını inceleyeceğiz.

Veri Yükleme

import pandas as pd

# CSV dosyasından veri yükleme
data = pd.read_csv('data.csv')

Pandas ile veri yükledikten sonra veri çerçevesinin temel özelliklerini inceleyebilirsiniz:

Veri Çerçevesini İnceleme

# İlk 5 satırı görüntüleme
data.head()

# Veri çerçevesinin bilgilerini görmek için
data.info()

Veri analizi sırasında veriyi temizlemek de oldukça önemlidir. Pandas, eksik verileri kontrol etme, doldurma ve silme işlemleri için oldukça işlevseldir:

Veri Temizleme

# Eksik değerlere ulaşma
a_missing = data.isnull().sum()

# Eksik değerleri silme
cleaned_data = data.dropna()

Veri Görselleştirme: Matplotlib ve Seaborn

Veri analizi sürecinde, sonuçları görselleştirmek oldukça önemlidir. Matplotlib ve Seaborn, veri görselleştirmede en yaygın kullanılan kütüphanelerdir. Matplotlib, temel grafikler oluşturmanıza olanak tanırken, Seaborn daha estetik ve karmaşık görselleştirmeler yapmanıza yardımcı olur.

Matplotlib Kullanımı

import matplotlib.pyplot as plt

# Basit bir çizgi grafiği oluşturma
plt.plot(data['x'], data['y'])
plt.title('Basit Çizgi Grafiği')
plt.xlabel('X Ekseni')
plt.ylabel('Y Ekseni')
plt.show()

Matplotlib ile birçok farklı türde grafik oluşturabilirsiniz. Aşağıda bazı örnekler verilmiştir:

Bar Grafik ve Histogram

# Bar grafiği oluşturma
plt.bar(['A', 'B', 'C'], [10, 20, 15])
plt.title('Bar Grafiği')
plt.show()

# Histogram oluşturma
plt.hist(data['a'], bins=10)
plt.title('Histogram')
plt.show()

Seaborn ile İleri Düzey Görselleştirme

import seaborn as sns

# Seaborn ile scatter plot oluşturma
sns.scatterplot(data=data, x='x', y='y')
plt.title('Scatter Plot')
plt.show()

Seaborn, ek olarak daha karmaşık grafikler ve stil oluşturma imkanı sunar. Özellikle veriler arasındaki ilişkileri görmek için çeşitli grafik türleri önerir.

Makine Öğrenmesine Giriş: scikit-learn

Makine öğrenmesi, veri bilimindeki bir diğer kritik alan olarak karşımıza çıkmaktadır. scikit-learn, makine öğrenmesi algoritmalarını uygulamak için en yaygın kullanılan kütüphanedir. Başlangıç seviyesindeki kullanıcılar için temel makine öğrenmesi uygulamalarını ele alacağız.

Veri Kümesi Hazırlama

from sklearn.model_selection import train_test_split

# Özellikler ve etiketleri ayırma
X = data[['feature1', 'feature2']]
Y = data['label']

# Eğitim ve test kümesine ayırma
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.2, random_state=42)

Veri kümesi hazırlandıktan sonra, bir model oluşturmak ve eğitmek için gerekli adımları gerçekleştirebiliriz:

Model Oluşturma ve Eğitme

from sklearn.ensemble import RandomForestClassifier

# Model oluşturma
model = RandomForestClassifier()

# Modeli eğitme
model.fit(X_train, Y_train)

Model eğitildikten sonra, test verisi ile sonuçları değerlendirmek de önemlidir:

Model Değerlendirme

from sklearn.metrics import accuracy_score

# Tahmin yapma
predictions = model.predict(X_test)

# Başarı oranını hesaplama
accuracy = accuracy_score(Y_test, predictions)
print(f'Model Başarı Oranı: {accuracy}')

Sonuç ve İleri Düzey Kaynaklar

Bu cheat sheet, Python kullanarak veri bilime giriş yapmak isteyenler için temel bilgileri derlemektedir. NumPy, Pandas, Matplotlib, Seaborn ve scikit-learn gibi kütüphaneler, veri analizi ve makine öğrenmesi süreçlerinde en sık kullanılan araçlardır. Bu kütüphanelerin gelişmiş özelliklerini öğrenmek ve projelerinizi daha da ileri taşımak için resmi dokümantasyonlarını ve topluluk kaynaklarını takip etmenizi öneririm.

Ayrıca, veri biliminde kendinizi geliştirirken, projeler ve pratik uygulamalar yaparak becerilerinizi pekiştirmeyi unutmayın. Verileri anlamak ve analiz etmek, zamanla daha iyi bir uzman olmanızı sağlayacaktır. Her yeni öğrendiğiniz bilgi, sizi veri bilimi yolculuğunuzda bir adım ileri taşıyacaktır.

Python ile veri bilimi öğrenme yolculuğunuzda bol şans! Herhangi bir sorunuz, yorumunuz veya eklemek istediğiniz bir şey olursa, topluluğumuzla paylaşmaktan çekinmeyin!

Scroll to Top