Python ile Excel’den Veri Alma Yöntemleri

Giriş

Veri analizi ve işleme yöntemleri günümüz dijital dünyasında büyük bir öneme sahip. En yaygın veri kaynakları arasında yer alan Excel dosyaları, birçok işletme ve araştırmacı tarafından kullanılmakta. Python, veri analizi ve otomasyonu konusunda sağladığı güçlü kütüphaneleri ile Excel dosyalarındaki verileri almak ve işlemek için mükemmel bir araçtır. Bu yazıda, Python kullanarak Excel’den veri almanın farklı yöntemlerine odaklanacağız.

Excel ile çalışırken, en çok kullanılan kütüphaneler arasında pandas, openpyxl ve xlrd yer alıyor. Her biri farklı ihtiyaçlar için çeşitli özellikler sunuyor. Pandas, veri analizi için en popüler kütüphane olup, veri çerçevesi yapısı ile Excel dosyalarını kolaylıkla okuyup işleyebilmemize olanak tanırken; openpyxl, doğrudan Excel dosyaları üzerinde okuma ve yazma işlemleri yapabilmemizi sağlıyor. xlrd ise eski Excel dosyalarını (xls uzantılı) okumada kullanılır.

Bu makalede, her bir kütüphaneyi ve kullanımını inceleyerek, Excel’den veri almanın en etkili yollarını keşfedeceğiz. Adım adım örneklerle destekleyeceğimiz bu rehber, Python’a yeni başlayanlar ve veri analizi konularında bilgi edinmek isteyenler için kapsamlı bir kaynak olacaktır.

Pandas ile Excel Dosyalarından Veri Alma

Pandas kütüphanesi, veri analizi ve manipülasyonu için en güçlü araçlardan biri olarak kabul edilmektedir. Excel dosyalarından veri alma işlemi de oldukça basittir. Pandas ile Excel dosyasını okumak için öncelikle kütüphaneyi yüklememiz gerekiyor. Eğer hâlâ kurulu değilse, terminal veya komut istemcisinde aşağıdaki komutu çalıştırarak kurulum yapabilirsiniz:

pip install pandas

Pandas, read_excel() fonksiyonunu kullanarak doğrudan Excel dosyasını okuyabilir. Aşağıda, basit bir örnekle bir Excel dosyasından veri okuma işleminin nasıl yapıldığını göreceksiniz:

import pandas as pd

# Excel dosyasını okuma
veri = pd.read_excel('dosya_adı.xlsx')

# Veriyi görüntüleme
print(veri.head())

Bu kod parçası, belirtilen ‘dosya_adı.xlsx’ dosyasını okuşarak, içindeki verinin ilk beş satırını gösterecektir. Bu şekilde sadece birkaç satırda eksiksiz bir veri çerçevesine ulaşmış olursunuz. Pandas ile, herhangi bir Excel sayfasından veya belirli bir sayfadan veri almak için sheet_name parametresini kullanabilirsiniz:

veri = pd.read_excel('dosya_adı.xlsx', sheet_name='Sayfa1')

Bu şekilde, Excel dosyasının ‘Sayfa1’ isimli sayfasından veri çekmiş olursunuz. Aynı zamanda verilerin yalnızca belirli bir aralığını almak için usecols ve skiprows parametrelerini kullanabilirsiniz.

Pandas ile Veri Manipülasyonu

Excel dosyasından veri okuduktan sonra, pandas ile bu verileri manipüle etmek oldukça kolaydır. Veri çerçevenizin içeriğini inceleyebilir, filtreleyebilir, düzenleme yapabilir ya da yeni hesaplamalar ekleyebilirsiniz. Örneğin, veri çerçevenizi filtreleyip belirli bir şartı sağlayan satırları almak için aşağıdaki yöntemi kullanabilirsiniz:

filtreli_veri = veri[veri['Kolon1'] > 50]

Burada ‘Kolon1’ alanı, 50’den büyük olan satırları filtreleyecektir. Ayrıca, veri çerçevenizin her bir kolonu için çeşitli istatistiksel hesaplamalar yapabilirsiniz:

ortalama = veri['Kolon2'].mean()

Pandas ile sadece veri okuma değil aynı zamanda Excel dosyalarının içindeki verilere dinamik hesaplamalar yaparak daha fazla bilgi çıkarabiliriz. Bunun yanı sıra, pandas kütüphanesi ile veri analizi ve görselleştirme yapmak da mümkün.

Openpyxl ile Excel Dosyalarını Okuma ve Yazma

openpyxl, Excel dosyalarını okuma ve yazma adına oldukça faydalı bir kütüphanedir. Eğer gelişmiş özellikler arıyorsanız (örneğin, hücre biçimlendirme, grafik ekleme, vb.), openpyxl sizin için kesinlikle ideal bir seçenektir. Öncelikle openpyxl kütüphanesini yüklemek için terminalde aşağıdaki komutu yazmamız yeterlidir:

pip install openpyxl

Openpyxl kullanarak bir Excel dosyasını okuma süreci de oldukça basittir. Aşağıdaki örnekte, bir Excel dosyasını açıp verilerini nasıl okuyabileceğinizi göreceksiniz:

from openpyxl import load_workbook

# Excel dosyasını yükle
kitap = load_workbook('dosya_adı.xlsx')

# Belirli bir sayfayı seç
sayfa = kitap['Sayfa1']

# Hücre değerini okuma
veri = sayfa['A1'].value
print(veri)

Bu yöntemle, belirtilen hücrenin değerine erişebilirsiniz. Ayrıca, birden fazla hücreyi döngü kullanarak okuyabilirsiniz:

for satir in sayfa.iter_rows(min_row=2, max_col=3, max_row=10):
    for hucre in satir:
        print(hucre.value)

Yukarıdaki döngü, ‘Sayfa1’ sayfasındaki 2. satırdan 10. satıra kadar olan A, B ve C kolonlarındaki hücre değerlerini yazdıracaktır.

Openpyxl ile Veri Yazma

Openpyxl ile sadece veri okuma işlemine odaklanmakla kalmaz, aynı zamanda yeni veriler ekleyebilir veya mevcut verileri düzenleyebilirsiniz. Örneğin, yeni bir hücreye veri yazmak istiyorsanız, aşağıdaki yöntemi kullanabilirsiniz:

satir = sayfa.max_row + 1
sayfa['A' + str(satir)] = 'Yeni Veri'

# Değişiklikleri kaydet
kitap.save('dosya_adı.xlsx')

Bu kod ile mevcut sayfanın sonuna yeni bir hücrede veri ekleyebilirsiniz. Değişikliklerinizi kaydetmeyi unutmamalısınız, aksi takdirde yaptığınız değişiklikler kaybolacaktır. Openpyxl, bu tür işlemler için birçok gelişmiş işlev sunarak Excel dosyaları ile etkileşiminizi kolaylaştırır.

xlrd ile Eski Excel Dosyalarını Okuma

xlrd, eski Excel dosyalarını (xls uzantılı) okumak için kullanılan bir başka popüler kütüphanedir. Ancak, bu kütüphane yalnızca okuma işlemi için kullanılmaktadır. xlrd kütüphanesini yüklemek için aşağıdaki komutu terminalde çalıştırmanız yeterli olacaktır:

pip install xlrd

xlrd kütüphanesi ile Excel dosyasını okumak için open_workbook fonksiyonunu kullanarak aşamalar gerçekleştireceğiz. Aşağıdaki kodda bunun nasıl yapılacağına dair örnek bulabilirsiniz:

import xlrd

# Excel dosyasını aç
kitap = xlrd.open_workbook('dosya_adı.xls')

# Belirli bir sayfayı seç
sayfa = kitap.sheet_by_name('Sayfa1')

# Hücre değerini okuma
veri = sayfa.cell_value(0, 0)
print(veri)

Böylelikle, belirtilen hücreden (ilk satır, ilk sütun) veri okuma işlemi yapılmış olur. xlrd ile hücrelerden veri okumanın yanı sıra sayfa bilgilerine ulaşabilir, toplam sayfa sayısını öğrenebilir ve her sayfanın adını yazdırabilirsiniz:

print(kitap.nsheets)
for sayfa_indeksi in range(kitap.nsheets):
    print(kitap.sheet_by_index(sayfa_indeksi).name)

Bunlar xlrd kütüphanesinin sunduğu temel özelliklerdir. Ancak, yalnızca okuma işlemleriyle sınırlı olduğu için sadece eski dosyalarla çalışırken kullanılması tavsiye edilir.

Sonuç

Python, Excel dosyalarından veri almak ve bu verileri işlemek için güçlü bir araçtır. Pandas, openpyxl ve xlrd gibi kütüphaneler ile verilerinizi kolayca okuyabilir, düzenleyebilir ve analiz edebilirsiniz. Özellikle pandas kütüphanesi, veri analizi ve bilimsel hesaplamalar için sunduğu kolaylıklarla bu alandaki en çok tercih edilen seçenektir.

Unutmayın ki, doğru kütüphaneyi ve yöntemi seçmek, projelerinizin gereksinimlerine ve veri türüne bağlıdır. Bu yazıda, Excel gerek müşteriler/değişken verilerle çalışırken, gerekse veri analizi süreçlerinde önemli bir araç olarak Python’un sunduğu imkanları keşfettik. Verilerinizi projelerinizde kullanarak daha anlamlı içgörüler elde edebilir ve iş süreçlerinizi kolaylaştırabilirsiniz.

Artık veri analizi ile ilgili temel bilgilere sahip olduğunuza göre, kendi projelerinizde bu yöntemleri deneyimleyebilir ve daha iyi sonuçlar elde edebilirsiniz. Python ile Excel’den veri almanın yanı sıra, bu verileri analiz edip farklı görselleştirme teknikleri ile zenginleştirerek sunabilirsiniz.

Scroll to Top