Python Pandas DataFrame’da Satır ve Sütun Silme İşlemleri

Giriş

Pandas, Python ekosistemindeki en popüler veri analizi kütüphanelerinden biridir. Veri çerçeveleri (DataFrame), Pandas’ın sunduğu temel veri yapılarından biridir ve veri analizi sürecinde sıklıkla kullanılır. Bu yazıda, Pandas DataFrame üzerinde satır ve sütun silme işlemlerini nasıl gerçekleştirebileceğimizi öğreneceğiz. Satır ve sütunları silmek, veri setinizi temizlemek ve gereksiz bilgileri ortadan kaldırmak için kritik bir adımdır.

DataFrame’da satır veya sütun silmek, veri setinizin boyutunu küçültmek veya belirli bir analize odaklanmak amacıyla yapılır. Örneğin, bazı sütunlar analizinize katkıda bulunmuyorsa veya belirli satırlardaki veriler hatalıysa, bunları kaldırarak daha anlamlı bir analiz yapabilirsiniz. Şimdi, Pandas kullanarak bu işlemleri adım adım inceleyelim.

DataFrame Oluşturma

Öncelikle veri silme işlemlerini gerçekleştirmek için bir DataFrame oluşturmamız gerekiyor. Aşağıdaki kod parçacığı ile basit bir DataFrame oluşturalım:

import pandas as pd

# Basit bir DataFrame oluşturma
data = {
    'İsim': ['Ege', 'Ali', 'Ayşe', 'Fatma'],
    'Yaş': [28, 34, 22, 41],
    'Şehir': ['İstanbul', 'Ankara', 'İzmir', 'Bursa']
}

df = pd.DataFrame(data)
print(df)

Yukarıdaki kod çalıştığında, aşağıdaki gibi bir DataFrame elde ederiz:

   İsim  Yaş     Şehir
0   Ege   28  İstanbul
1   Ali   34    Ankara
2  Ayşe   22     İzmir
3 Fatma   41     Bursa

Artık bu DataFrame üzerinde işlemler gerçekleştirmeye hazırız. Şimdi, satır ve sütun silme işlemlerine bakalım.

Pandas DataFrame’da Satır Silme

DataFrame’da satır silmek için birkaç farklı yöntem vardır. En yaygın yöntemlerden biri, drop metodunu kullanmaktır. Bu metod, belirli bir satırı silmek için satırın indeksini belirtmemizi gerektirir. Örneğin, 1 numaralı indekse sahip olan satırı kaldırmak için aşağıdaki kodu kullanabiliriz:

# Belirli bir satırı silme
df_silinen = df.drop(1)
print(df_silinen)

Yukarıdaki kod çalıştığında, 1 numaralı indeksteki satır (Ali) silinecektir:

   İsim  Yaş     Şehir
0   Ege   28  İstanbul
2  Ayşe   22     İzmir
3 Fatma   41     Bursa

Pandas’da silme işlemlerinin kalıcı hale gelmesini isterseniz, inplace=True parametresini kullanabilirsiniz. Bu durumda, orijinal DataFrame’iniz değişecektir:

# Orijinal DataFrame'i güncelleme
df.drop(1, inplace=True)
print(df)

Bu kod çalıştırıldığında, orijinal DataFrame’daki Ali satırı da kalıcı olarak silinmiş olacak.

Koşullu Satır Silme

Bazen belirli koşullara bağlı olarak satırlar silmek isteyebiliriz. Örneğin, yaş değeri 30’dan büyük olan tüm satırları kaldırmak istersek, aşağıdaki gibi bir işlem yapabiliriz:

# Koşullu satır silme
df = df[df['Yaş'] <= 30]
print(df)

Bu kod, 30 yaşından büyük olan tüm satırları siler ve geriye kalan satırları gösterir:

   İsim  Yaş     Şehir
0   Ege   28  İstanbul
2  Ayşe   22     İzmir

Bu şekilde, veri setinizi analiz etmek için ihtiyacınız olan doğru satırları tutabilir, gereksiz verileri kolayca kaldırabilirsiniz.

Pandas DataFrame’da Sütun Silme

DataFrame’da sütun silmek de oldukça basittir. drop metodunu yine kullanabiliriz. Sadece, silmek istediğimiz sütunun adını belirtmeliyiz. Örnek olarak, ‘Şehir’ adlı sütunu silmek için şöyle bir kod yazabiliriz:

# Belirli bir sütunu silme
df_sutun_silinen = df.drop('Şehir', axis=1)
print(df_sutun_silinen)

Bu işlem sonucunda, ‘Şehir’ sütunu silinmiş olur:

   İsim  Yaş
0   Ege   28
2  Ayşe   22
3 Fatma   41

Sütun silme işlemini yaparken de inplace=True parametresini kullanarak orijinal DataFrame üzerinde değişiklik yapabilirsiniz:

# Orijinal DataFrame'den sütunu silme
df.drop('Şehir', axis=1, inplace=True)
print(df)

Bu işlem, ‘Şehir’ sütununu kalıcı olarak orijinal DataFrame’den kaldırır. Sonuç aşağıdaki gibi olacaktır:

   İsim  Yaş
0   Ege   28
1   Ali   34
2  Ayşe   22
3 Fatma   41

Birden Fazla Satır veya Sütun Silme

Pandas, birden fazla satır veya sütunu aynı anda silmenizi sağlar. Ayrıca, silmek istediğiniz birden fazla sütunu veya satırı bir liste olarak belirtebilirsiniz. Örneğin, 0 ve 2 indeksli satırları birden fazla olarak silmek için:

# Birden fazla satırı silme
df_silinen = df.drop([0, 2])
print(df_silinen)

Bu kod çalıştığında, 0 ve 2 numaralı satırlar silinecektir ve sonuç:

   İsim  Yaş     Şehir
1   Ali   34    Ankara
3 Fatma   41     Bursa

Aynı işlem, birden fazla sütunu silerken de uygulanabilir:

# Birden fazla sütunu silme
df_sonuc = df.drop(['Yaş', 'Şehir'], axis=1)
print(df_sonuc)

Bu kod, ‘Yaş’ ve ‘Şehir’ sütunlarını silmiş olacaktır ve elde edeceğimiz DataFrame yalnızca ‘İsim’ sütunundan oluşacaktır:

   İsim
0   Ege
1   Ali
2  Ayşe
3 Fatma

Sonuç

Pandas DataFrame’da satır ve sütun silme işlemleri, veri analizi sürecinde oldukça önemli bir adımdır. Yüksek kaliteli analizler yapabilmek için gereksiz verileri temizlemek ve yalnızca gerekli bilgileri tutmak gerekir. Bu yazıda, drop metodunu kullanarak nasıl satır ve sütun silineceğini öğrendik. Hem belirli indekslere göre hem de koşullara bağlı olarak veri siliminin nasıl yapılacağını detaylandırdık.

Pandas ile çalışırken, veri temizliği ve ön işleme süreçlerinin başarıyla gerçekleştirilmesi, doğru analiz sonuçları elde etmenin anahtarıdır. Kendi veri setlerinizi kullanarak bu yöntemleri deneyebilir ve verilerinizin kalitesini artırabilirsiniz. Unutmayın, analiz yaptığınız veri ne kadar temiz ve anlamlı olursa, sonuçlarınız da o kadar güvenilir olacaktır.

Veri analizi yolculuğunuzda başarılar dilerim! Kendi projelerinizde denemeler yapmayı unutmayın ve yeni sorular ve projeler için benimle iletişime geçmekten çekinmeyin.

Scroll to Top