Giriş
Pandas, Python ekosistemindeki en popüler veri analizi kütüphanelerinden biridir. Veri çerçeveleri (DataFrame), Pandas’ın sunduğu temel veri yapılarından biridir ve veri analizi sürecinde sıklıkla kullanılır. Bu yazıda, Pandas DataFrame üzerinde satır ve sütun silme işlemlerini nasıl gerçekleştirebileceğimizi öğreneceğiz. Satır ve sütunları silmek, veri setinizi temizlemek ve gereksiz bilgileri ortadan kaldırmak için kritik bir adımdır.
DataFrame’da satır veya sütun silmek, veri setinizin boyutunu küçültmek veya belirli bir analize odaklanmak amacıyla yapılır. Örneğin, bazı sütunlar analizinize katkıda bulunmuyorsa veya belirli satırlardaki veriler hatalıysa, bunları kaldırarak daha anlamlı bir analiz yapabilirsiniz. Şimdi, Pandas kullanarak bu işlemleri adım adım inceleyelim.
DataFrame Oluşturma
Öncelikle veri silme işlemlerini gerçekleştirmek için bir DataFrame oluşturmamız gerekiyor. Aşağıdaki kod parçacığı ile basit bir DataFrame oluşturalım:
import pandas as pd
# Basit bir DataFrame oluşturma
data = {
'İsim': ['Ege', 'Ali', 'Ayşe', 'Fatma'],
'Yaş': [28, 34, 22, 41],
'Şehir': ['İstanbul', 'Ankara', 'İzmir', 'Bursa']
}
df = pd.DataFrame(data)
print(df)
Yukarıdaki kod çalıştığında, aşağıdaki gibi bir DataFrame elde ederiz:
İsim Yaş Şehir
0 Ege 28 İstanbul
1 Ali 34 Ankara
2 Ayşe 22 İzmir
3 Fatma 41 Bursa
Artık bu DataFrame üzerinde işlemler gerçekleştirmeye hazırız. Şimdi, satır ve sütun silme işlemlerine bakalım.
Pandas DataFrame’da Satır Silme
DataFrame’da satır silmek için birkaç farklı yöntem vardır. En yaygın yöntemlerden biri, drop
metodunu kullanmaktır. Bu metod, belirli bir satırı silmek için satırın indeksini belirtmemizi gerektirir. Örneğin, 1 numaralı indekse sahip olan satırı kaldırmak için aşağıdaki kodu kullanabiliriz:
# Belirli bir satırı silme
df_silinen = df.drop(1)
print(df_silinen)
Yukarıdaki kod çalıştığında, 1 numaralı indeksteki satır (Ali) silinecektir:
İsim Yaş Şehir
0 Ege 28 İstanbul
2 Ayşe 22 İzmir
3 Fatma 41 Bursa
Pandas’da silme işlemlerinin kalıcı hale gelmesini isterseniz, inplace=True
parametresini kullanabilirsiniz. Bu durumda, orijinal DataFrame’iniz değişecektir:
# Orijinal DataFrame'i güncelleme
df.drop(1, inplace=True)
print(df)
Bu kod çalıştırıldığında, orijinal DataFrame’daki Ali satırı da kalıcı olarak silinmiş olacak.
Koşullu Satır Silme
Bazen belirli koşullara bağlı olarak satırlar silmek isteyebiliriz. Örneğin, yaş değeri 30’dan büyük olan tüm satırları kaldırmak istersek, aşağıdaki gibi bir işlem yapabiliriz:
# Koşullu satır silme
df = df[df['Yaş'] <= 30]
print(df)
Bu kod, 30 yaşından büyük olan tüm satırları siler ve geriye kalan satırları gösterir:
İsim Yaş Şehir
0 Ege 28 İstanbul
2 Ayşe 22 İzmir
Bu şekilde, veri setinizi analiz etmek için ihtiyacınız olan doğru satırları tutabilir, gereksiz verileri kolayca kaldırabilirsiniz.
Pandas DataFrame’da Sütun Silme
DataFrame’da sütun silmek de oldukça basittir. drop
metodunu yine kullanabiliriz. Sadece, silmek istediğimiz sütunun adını belirtmeliyiz. Örnek olarak, ‘Şehir’ adlı sütunu silmek için şöyle bir kod yazabiliriz:
# Belirli bir sütunu silme
df_sutun_silinen = df.drop('Şehir', axis=1)
print(df_sutun_silinen)
Bu işlem sonucunda, ‘Şehir’ sütunu silinmiş olur:
İsim Yaş
0 Ege 28
2 Ayşe 22
3 Fatma 41
Sütun silme işlemini yaparken de inplace=True
parametresini kullanarak orijinal DataFrame üzerinde değişiklik yapabilirsiniz:
# Orijinal DataFrame'den sütunu silme
df.drop('Şehir', axis=1, inplace=True)
print(df)
Bu işlem, ‘Şehir’ sütununu kalıcı olarak orijinal DataFrame’den kaldırır. Sonuç aşağıdaki gibi olacaktır:
İsim Yaş
0 Ege 28
1 Ali 34
2 Ayşe 22
3 Fatma 41
Birden Fazla Satır veya Sütun Silme
Pandas, birden fazla satır veya sütunu aynı anda silmenizi sağlar. Ayrıca, silmek istediğiniz birden fazla sütunu veya satırı bir liste olarak belirtebilirsiniz. Örneğin, 0 ve 2 indeksli satırları birden fazla olarak silmek için:
# Birden fazla satırı silme
df_silinen = df.drop([0, 2])
print(df_silinen)
Bu kod çalıştığında, 0 ve 2 numaralı satırlar silinecektir ve sonuç:
İsim Yaş Şehir
1 Ali 34 Ankara
3 Fatma 41 Bursa
Aynı işlem, birden fazla sütunu silerken de uygulanabilir:
# Birden fazla sütunu silme
df_sonuc = df.drop(['Yaş', 'Şehir'], axis=1)
print(df_sonuc)
Bu kod, ‘Yaş’ ve ‘Şehir’ sütunlarını silmiş olacaktır ve elde edeceğimiz DataFrame yalnızca ‘İsim’ sütunundan oluşacaktır:
İsim
0 Ege
1 Ali
2 Ayşe
3 Fatma
Sonuç
Pandas DataFrame’da satır ve sütun silme işlemleri, veri analizi sürecinde oldukça önemli bir adımdır. Yüksek kaliteli analizler yapabilmek için gereksiz verileri temizlemek ve yalnızca gerekli bilgileri tutmak gerekir. Bu yazıda, drop
metodunu kullanarak nasıl satır ve sütun silineceğini öğrendik. Hem belirli indekslere göre hem de koşullara bağlı olarak veri siliminin nasıl yapılacağını detaylandırdık.
Pandas ile çalışırken, veri temizliği ve ön işleme süreçlerinin başarıyla gerçekleştirilmesi, doğru analiz sonuçları elde etmenin anahtarıdır. Kendi veri setlerinizi kullanarak bu yöntemleri deneyebilir ve verilerinizin kalitesini artırabilirsiniz. Unutmayın, analiz yaptığınız veri ne kadar temiz ve anlamlı olursa, sonuçlarınız da o kadar güvenilir olacaktır.
Veri analizi yolculuğunuzda başarılar dilerim! Kendi projelerinizde denemeler yapmayı unutmayın ve yeni sorular ve projeler için benimle iletişime geçmekten çekinmeyin.