Python ile Sütunları Sıralama: Adım Adım Rehber

Python’da Sütunları Sıralamanın Önemi

Veri analizi ve işleme sürecinde, verilerin düzenli bir biçimde sunulması büyük önem taşır. Özellikle pandas kütüphanesi kullanılarak çalışırken, veri çerçevelerindeki (DataFrame) sütunları sıralama, verilerin analiz edilmesini, görselleştirilmesini ve raporlanmasını kolaylaştırır. Doğru sıralama ile daha iyi içgörüler elde edebilir, karmaşık veri kümelerini daha yönetilebilir hale getirebilirsiniz. Python ile sütun sıralama işlemleri, hem başlangıç seviyesindeki kullanıcılar hem de deneyimli veri bilimcileri için sıkça başvurulan bir tekniktir.

Python’daki pandas kütüphanesi, kullanıcıların veri çerçeveleri üzerinde birçok işlemi hızlı ve etkili bir şekilde gerçekleştirmesini sağlar. Sütun sıralama işlemi, veri setinin düzenlenmesi ve analizinin kolaylaştırılması için temel adımlardan biridir. Ayrıca, verileri belirli bir kritere göre sıralamak, analiz sırasında elde edilen sonuçların daha anlamlı hale gelmesine yardımcı olur.

Eğer veri setiniz üzerinde çalışıyorsanız ve sütunları sıralamak istiyorsanız, bu makalede Python’da bu işlemi nasıl yapacağınızı detaylı bir şekilde açıklayacağım. Adım adım örneklerle ilerleyerek, farklı durumlarda nasıl sıralama yapabileceğinizi de göstereceğim.

Pandas Kütüphanesi ile Sıralama Yapma

Pandas kütüphanesi, Python’da veri analizi için en popüler araçlardan biridir. Veri çerçeveleri (DataFrame) üzerinde birçok işlem yapmanızı sağlar. Sütunları sıralamak için kullanabileceğiniz sort_values() fonksiyonu ile başlayalım. Bu fonksiyon, belirttiğiniz sütuna göre sıralama yapar ve sonuçları yeni bir DataFrame olarak döner.

İlk olarak, pandas kütüphanesini içe aktaralım ve basit bir DataFrame oluşturalım:

import pandas as pd

# Basit bir DataFrame oluşturalım
data = {
    'İsim': ['Ege', 'Ali', 'Merve', 'Zeynep', 'Can'],
    'Yaş': [28, 22, 24, 29, 21],
    'Şehir': ['İstanbul', 'Ankara', 'İzmir', 'Bursa', 'İstanbul']
}
df = pd.DataFrame(data)

Yukarıdaki kod ile oluşturduğumuz DataFrame şu şekilde görünecektir:

    İsim  Yaş      Şehir
0    Ege   28  İstanbul
1   Ali    22     Ankara
2  Merve   24      İzmir
3  Zeynep  29     Bursa
4   Can    21  İstanbul

Artık sütunları sıralamak için sort_values() fonksiyonunu kullanabiliriz. Örneğin, yaş sütununa göre sıralamak istiyoruz:

df_sorted = df.sort_values(by='Yaş')

Bu işlem sonrasında, Yaş sütununa göre sıralanmış yeni bir DataFrame elde ederiz:

    İsim  Yaş      Şehir
4   Can    21  İstanbul
1   Ali    22     Ankara
2  Merve   24      İzmir
0    Ege   28  İstanbul
3  Zeynep  29     Bursa

Sıralama Parametreleri ve Seçenekleri

Pandas’ın sort_values() fonksiyonu, sıralama yaparken farklı seçenekler sunar. Örneğin, sıralamanın artan (ascending) veya azalan (descending) düzende yapılmasını belirleyebilirsiniz. Varsayılan değer artandır, ancak azalan sıralama yapmak için ascending=False parametresini kullanabilirsiniz:

df_sorted_desc = df.sort_values(by='Yaş', ascending=False)

Aşağıda, azalan sıralama sonrası elde edilen DataFrame örneğini görebilirsiniz:

    İsim  Yaş      Şehir
3  Zeynep  29     Bursa
0    Ege   28  İstanbul
2  Merve   24      İzmir
1   Ali    22     Ankara
4   Can    21  İstanbul

Birden fazla sütun üzerinden sıralama yapmak da mümkündür. Örneğin, hem yaşa hem de isme göre sıralamak istersek, by parametresine bir liste verebiliriz:

df_sorted_multi = df.sort_values(by=['Yaş', 'İsim'])

Bunun sonucunda, yaş sütunu sıralandıktan sonra eşit olan yaşlar için isim sütununa göre sıralama yapılır. Bu şekilde, karmaşık veri setlerinde daha anlamlı sıralama yapabiliriz.

Hatalı Senaryolar ve Çözüm Yöntemleri

Sıralama yaparken karşılaşabileceğiniz bazı yaygın hatalar vardır. Örneğin, sıralama işlemi yapacağınız sütun, DataFrame’de mevcut değilse bir hata alırsınız. Eğer sütun isimlerinde yazım hatası yaptıysanız, Python KeyError hatası verecektir. Bu gibi sorunları önlemek için sütun adlarını kontrol etmek her zaman iyi bir fikirdir.

Bir başka yaygın sorun ise, sıralama yapılacak sütunun veri tipidir. Örneğin, sayısal bir sütuna sayısal olmayan veriler eklediğinizde sıralama beklendiği gibi çalışmayabilir. Bu nedenle, sıralama yapmadan önce tüm verilerin doğru türde olduğundan emin olmanız gerekir. Örneğin, sayısal değerlerle karışan metin değerlerini bir DataFrame’den çıkarın veya veri türlerini düzenleyin.

Eğer bir sütunu sıraladıktan sonra DataFrame’inizi çok fazla değiştirdiğinizi fark ederseniz, orijinal DataFrame’inizi koruyarak sıralama yapmayı düşünebilirsiniz. Bunu yapmak için, inplace=False parametresini kullanarak sıralama işlemini gerçekleştirdiğinizde, orijinal DataFrame değişmeden kalır.

Uygulamalı Örnek: Veri Analizi

Örneklerimizde basit bir DataFrame kullandık. Şimdi, gerçek hayatta daha büyük bir veri seti ile çalışarak, pratikte sütun sıralama yöntemini nasıl uygulayabileceğimizi görelim. Ayrıca, bu süreçte sıralama seçeneklerini de gösterebiliriz. Örneğin, büyük bir öğrenci veritabanımız olduğunu varsayalım. Bu veritabanında öğrencilerin adları, yaşları, notları ve kayıtlı oldukları şehirler yer alsın:

data_students = {
    'Öğrenci Adı': ['Ege', 'Ali', 'Merve', 'Zeynep', 'Can'],
    'Yaş': [28, 22, 24, 29, 21],
    'Not': [85, 92, 88, 95, 90],
    'Şehir': ['İstanbul', 'Ankara', 'İzmir', 'Bursa', 'İstanbul']
}
df_students = pd.DataFrame(data_students)

Bu öğrenci veri setine göre, notlar üzerinden sıralama yapalım:

df_sorted_students = df_students.sort_values(by='Not', ascending=False)

Notlara göre sıralama yaparak, en yüksek not alan öğrencileri üstte bulabiliriz:

    Öğrenci Adı  Yaş  Not      Şehir
3       Zeynep   29   95     Bursa
4         Can    21   90  İstanbul
2       Merve   24   88      İzmir
0         Ege    28   85  İstanbul
1         Ali    22   92     Ankara

Bakıldığında, Zeynep en yüksek notu almış. Bu tür verileri kullanarak her öğrencinin akademik başarısını kıyaslayabiliriz.

Sonuç ve Teşvik

Python’da sütunları sıralamak, veri analizi sürecinin önemli bir parçasıdır. Pandas kütüphanesi ile bu işlemi kolay bir şekilde gerçekleştirebilirsiniz. Öğrendiklerimizi bir araya getirerek, sıralama işlemlerinin önemini, nasıl yapılacağını, sıralama seçeneklerini, karşılaşabileceğiniz hataları ve çözümlerini gördük. Ayrıca, uygulamalı örnekler ile gerçek hayatta nasıl kullanılabileceğini de inceledik.

Unutmayın, bu tür işlemleri denemekten çekinmeyin. Gerçek veri setlerinde çalışarak pratik yapmanız, öğrendiklerinizi pekiştirmenize yardımcı olacaktır. Yapacağınız sıralamalar, veri analizi sürecinde size büyük avantaj sağlayacaktır.

Yeni projelerinizde bu teknikleri kullanarak analizlerinizi geliştirebilir, veri setlerinizi daha anlamlı hale getirebilirsiniz. Verilerle çalışmak heyecan verici bir yolculuk ve Python bu yolculukta en büyük yardımcınız olacaktır!

Scroll to Top