Python’da plt.scatter ile Renkli Dağılım Grafikleri Oluşturma

Giriş

Veri görselleştirmenin en etkili yollarından biri, verileri grafikler aracılığıyla sunmaktır. Python’un güçlü kütüphanelerinden biri olan Matplotlib, verilerinizi görselleştirmenizi sağlayarak, karmaşık verileri daha anlamlı hale getirmenize yardımcı olur. Özellikle, plt.scatter fonksiyonu, noktaların x-y düzleminde renkli bir dağılımını oluşturmak için ideal bir seçimdir. Bu yazıda, plt.scatter kullanarak renkli dağılım grafiklerinin nasıl oluşturulacağını ve veri analizi için nasıl kullanabileceğinizi öğreneceksiniz.

Matplotlib ile İlk Adımlar

Matplotlib, Python için en yaygın kullanılan veri görselleştirme kütüphanesidir. Kullanımı oldukça basittir ve farklı grafik türleri oluşturmanıza olanak tanır. Renkli dağılım grafikleri, verinin iki veya daha fazla boyutunu göstermek için oldukça etkili bir yöntemdir. plt.scatter, koordinat düzleminde noktaları temsil eden basit bir araçtır.

Bu kütüphaneyi kullanmaya başlamak için öncelikle Matplotlib’i yüklemeniz gerekmektedir. Eğer daha önce yüklemediyseniz, terminal veya komut istemcisine şu komutu girerek yükleyebilirsiniz:

pip install matplotlib

Yükleme işlemi tamamlandığında, Matplotlib’i projenizde kullanmaya başlayabilirsiniz. Temel bir scatter grafiği oluşturmak için şu kodu yazabilirsiniz:

import matplotlib.pyplot as plt
import numpy as np

x = np.random.rand(50)
y = np.random.rand(50)
plt.scatter(x, y)
plt.show()

Renklerin Kullanımı ve Anlamı

plt.scatter fonksiyonu, noktaların rengine karar verirken sizin için çeşitli seçenekler sunar. Renkler, verinin farklı yönlerini vurgulamak veya gruplamak için kullanılabilir. Örneğin, farklı veri gruplarını ayırt etmek için farklı renklerde noktalar kullanabilirsiniz.

Renklerin belirlenmesi için iki yaygın yöntem vardır: renk haritaları (color maps) ve belirli renklerin atanması. Renk haritaları, verilerinize göre otomatik olarak renk atayabilmenize olanak tanır. Örneğin, aşağıdaki kod parçasında, c parametresi ile noktaların renklerini belirtiyoruz:

c = np.random.rand(50)  # Noktaların renklerini rastgele belirle
plt.scatter(x, y, c=c, cmap='viridis')
plt.colorbar()  # Renk çubuğunu göster

Bu kod, her bir noktanın rengini rastgele değerlerle belirler ve ‘viridis’ renk haritasını kullanarak renk çubuğunu gösterir. Renk haritaları, verilerinizi daha anlamlı hale getirebilir ve görselleştirmenizi güçlendirebilir.

Scatter Grafiği Özelleştirme

Matplotlib ile oluşturduğunuz scatter grafiği özelleştirmek için birçok parametre kullanabilirsiniz. plt.scatter fonksiyonunda, noktaların boyutunu, şekillerini ve renklerini farklı parametrelerle değiştirebilirsiniz. İşte bazı önemli parametreler:

  • s: Noktaların boyutunu belirler.
  • marker: Noktanın şekli (örneğin, ‘o’ daire, ‘s’ kare, ‘^’ üçgen).
  • alpha: Noktaların saydamlık seviyesini belirler (0.0 tam saydam, 1.0 tam opak).

Aşağıdaki örnekte bu parametrelerin nasıl kullanılabileceğini görebilirsiniz:

plt.scatter(x, y, s=100, marker='^', alpha=0.5, c=c, cmap='plasma')
plt.colorbar()
plt.show()

Bu örnekte, boyutları 100, şekilleri üçgen olan ve saydamlığı %50 olan noktalar oluşturulmuştur. Bu tür kişiselleştirmeler, grafiğinizi daha dikkat çekici hale getirebilir.

Pratik Uygulamalar ve Örnekler

Daha fazla pratik kazanmak adına, veri kümesine göre scatter grafikleri oluşturma örnekleri üzerinde çalışabilirsiniz. Örneğin, bir müşteri segmentasyonu verisini düşünün. Müşterilerin yaşını x ekseninde, yıllık gelirini ise y ekseninde gösteren bir scatter grafiği oluşturabilirsiniz. Renkleri ise müşteri segmentlerine göre belirleyebilirsiniz.

ages = np.random.randint(18, 70, size=100)  # Yaş verileri
incomes = np.random.randint(20000, 100000, size=100)  # Gelir verileri
segments = np.random.choice(['Segment A', 'Segment B', 'Segment C'], size=100)  # Müşteri segmentleri

# Segmentleri renklere dönüştürme
colors = {'Segment A': 'red', 'Segment B': 'blue', 'Segment C': 'green'}
seg_colors = [colors[segment] for segment in segments]

plt.scatter(ages, incomes, c=seg_colors)
plt.xlabel('Yaş')
plt.ylabel('Yıllık Gelir')
plt.title('Müşteri Segmentasyonu Dağılımı')
plt.show()

Bu örnekte müşteri segmentlerine göre renklerin belirlendiğini ve scatter grafik ile görselleştirildiğini görebilirsiniz. Bu tür uygulamalar, veri analizi sürecine önemli katkılarda bulunabilir.

Sonuç ve Öneriler

Python’da plt.scatter ile renkli dağılım grafiklerinin nasıl oluşturulacağını öğrendiniz. Çeşitli özelleştirme seçenekleri ile grafiklerinizi hem daha bilgilendirici hale getirebilir hem de görsel estetiği artırabilirsiniz. Renklerin ve parametrelerin doğru kullanımı ile grafiklerinizde verileri daha etkin bir şekilde sunabilirsiniz.

Gelecekte, daha karmaşık verileri ve grafik türlerini keşfetmek için Matplotlib ve diğer kütüphaneleri kullanmayı düşünebilirsiniz. İlerleyen yazılarımda, daha ileri düzey görselleştirme tekniklerini inceleyeceğiz. Umuyorum ki bu yazıdan ilham alarak kendi projelerinizde yaratıcılığınızı gösterebilirsiniz.

Unutmayın, veri analizi bir yolculuktur. Pratik yaparak ve farklı senaryoları deneyerek, bu alandaki becerilerinizi geliştirebilirsiniz. Herhangi bir sorun yaşarsanız veya yardım isterseniz, bana ulaşmaktan çekinmeyin. İyi kodlamalar!

Scroll to Top