Excel, verileri düzenlemek ve analiz etmek için en yaygın kullanılan araçlardan biridir. Birçok kişi, günlük işlerinde büyük verileri Excel tablolarında tutmaktadır. Ancak, veri analizi ve işleme sırasında zaman zaman bu verileri Python diline aktarmak gerekebilir. Bu yazıda, Excel dosyalarındaki verileri Python kullanarak nasıl liste formatına dönüştürebileceğinizi adım adım açıklayacağım. Hem basit hem de etkili yöntemlerle Excel’den veri çekip Python listelerine aktararak veri analizi süreçlerinizi nasıl hızlandırabileceğinizi öğrenmek için makaleyi okumaya devam edin.
Python, veri bilimi ve otomasyon alanlarında oldukça popüler bir programlama dilidir ve bu popülaritenin bir nedeni de veri kaynaklarıyla kolay entegrasyon sağlamasıdır. Excel dosyalarıyla çalışabileceğimiz birkaç farklı kütüphane mevcut. Bu yazıda, `pandas` kütüphanesini kullanarak Excel verilerini Python listesine aktarmanın yanı sıra, `openpyxl` gibi diğer kütüphaneleri kullanma yöntemlerine de göz atacağız. Hazırsanız, Excel dosyalarımızı Python ortamına nasıl taşıyabileceğimizi incelemekle başlayalım.
Excel Dosyasını Yüklemek için Pandas Kütüphanesi
Excel dosyalarındaki verileri Python’a aktarmanın en popüler yollarından biri, `pandas` kütüphanesini kullanmaktır. `Pandas`, veri analizi için oldukça kapsamlı bir araçtır ve Excel dosyalarıyla çalışmak için kullanımı son derece kolaydır. İlk olarak, `pandas` kütüphanesini yüklemeniz gerekecek. Eğer kütüphaneniz yüklü değilse, aşağıdaki komutu kullanarak yükleyebilirsiniz:
pip install pandas
Ardından, Excel dosyanızı yüklemek için aşağıdaki kodu kullanabilirsiniz:
import pandas as pd
df = pd.read_excel('dosya_adı.xlsx')
Bu kod, belirtilen Excel dosyasını okuyarak bir DataFrame (veri çerçevesi) oluşturacaktır. DataFrame, veri analizinde sıklıkla kullanılan bir veri yapısıdır ve tablolardaki verileri manupile etmemize olanak tanır. Şimdi, bu DataFrame’deki verileri liste formatına nasıl dönüştüreceğimize bakalım.
DataFrame’i Listeye Dönüştürmek
Excel’den yüklediğimiz veriler şimdi bir DataFrame olarak saklanıyor. Bu verileri liste formatına dönüştürmek oldukça basit. `pandas`, DataFrame nesnesini listeye dönüştürmek için çeşitli yöntemler sunar. Öncelikle, sadece belirli bir sütunu liste formatına almak istiyorsanız, aşağıdaki gibi bir kod kullanabilirsiniz:
liste = df['sütun_adı'].tolist()
Bu kod, belirttiğiniz sütundaki tüm verileri bir Python listesine aktarır. Örneğin, Excel dosyasında “Ad” isimli bir sütun olduğunu varsayalım. Bu durumda, listeniz şu şekilde oluşturulacaktır:
ad_liste = df['Ad'].tolist()
Diğer bir seçenek ise, DataFrame’deki tüm satırları liste formatına dönüştürmektir. Bunun için, `values` yöntemini kullanarak büyük bir liste oluşturabiliriz:
tam_liste = df.values.tolist()
Bu kod, tüm tablo verilerini bir listeye aktarır ve her satırı içeren bir liste döndürür. Dolayısıyla, `tam_liste` listesi, her bir satırı bir alt liste olarak içerecektir. Bu yaklaşım, özellikle tüm verileri analiz etmek istediğimizde faydalıdır.
OpenPyXL Kullanarak Excel Verilerini Listeye Aktarma
`pandas` dışında bir diğer popüler Python kütüphanesi de `openpyxl`’dir. Bu kütüphane, Excel dosyalarıyla çalışmak için kullanılır ve özellikle daha detaylı işlemler yapmak isteyenler için uygundur. `openpyxl`, Excel dosyalarını okuma ve yazma işlemlerinde esneklik sağlar. Öncelikle, `openpyxl` kütüphanesini yükleyelim:
pip install openpyxl
Yükleme işlemi tamamlandıktan sonra, Excel dosyasını okuma işlemini aşağıdaki gibi gerçekleştirebiliriz:
from openpyxl import load_workbook
workbook = load_workbook('dosya_adı.xlsx')
sheet = workbook.active
Bu kod, belirtilen Excel dosyasını yükler ve aktif sayfayı seçer. Artık bu sayfadaki verileri listeye aktarmaya hazırız. Her bir hücreyi dolaşarak aşağıdaki gibi bir liste elde edebiliriz:
liste = []
for row in sheet.iter_rows(values_only=True):
liste.append(row)
Bu şekilde, Excel sayfanızdaki verilerin her satırı, listenize bir alt liste olarak eklenir. `openpyxl` ile elde edilen liste, sırasıyla hücre değerlerini tutan alt listeleri içerecektir ve daha fazla işlem yapmak için kullanılabilir.
Excel Verileriyle İleri Düzey İşlemler
Excel’den Python’a veri aktarımı sadece başlangıçtır. Artık verilerinizi liste formatında elde ettiğinize göre, bunları analiz etmeye, modellemeye veya daha fazlasına hazır hale getirebilirsiniz. İlk olarak, bu verileri `pandas` ile bir DataFrame’e dönüştürmeyi düşünebilirsiniz. Aşağıdaki gibi bir kod ile ilk verilerinizi DataFrame’e aktarabilirsiniz:
df_yeni = pd.DataFrame(liste)
Bu kod, elde ettiğiniz listeyi yeni bir DataFrame’e dönüştürerek daha fazla veri manipülasyonu yapmanıza olanak sağlar. `pandas` ile birlikte, bu yeni DataFrame üzerinde istatistiksel analizler, görselleştirme ve daha fazlasını gerçekleştirebilirsiniz.
Ayrıca, Python’da `matplotlib` ve `seaborn` gibi kütüphaneleri kullanarak verilerinizi görsel hale getirebilir, daha görsel analizler yapabilirsiniz. Örneğin, alınan verileri çubuk grafikler veya çizgi grafikler ile göstermek için gerekli adımları kolayca takip edebilirsiniz.
Sonuç
Bu makalede, Excel’den Python’a veri aktarma sürecini detaylı bir şekilde ele aldık. `pandas` ve `openpyxl` gibi kütüphaneler sayesinde verilerinizi mükemmel bir şekilde Python ortamına taşıyabilir ve işlemler yapabilirsiniz. Unutmayın ki, Python, geniş veri analizi ve otomasyon yetenekleri sunan güçlü bir araçtır; bu süreçte istediğiniz verileri liste formatına dönüştürmek, daha karmaşık projeler geliştirmenize olanak sağlar.
Excel ile çalışırken, teknolojinin sunduğu bu temiz ve modern araçları kullanarak süreçlerinizi daha verimli hale getirebilir, zaman kazanabilir ve veri analizlerinizi profesyonel bir nitelikte yapabilirsiniz. Şimdi kendi projelerinizi denemeye ve Python ile veri analizi yolculuğunuza başlamaya hazır olun!