Python ile Standart Sapma Hesaplama: NumPy Olmadan

Standart Sapma Hesaplama Adımları

Standart sapma hesaplamak için şu adımları takip edeceğiz:

1. Veri Kümesini Belirleme

Veri kümesini oluşturan sayıların listesine ihtiyacımız var. Örnek bir veri kümesi oluşturmak için basit bir Python listesi tanımlayacağız. Örneğin, bir öğrencinin aldığı notları temsil eden bir liste oluşturabiliriz:

notlar = [85, 92, 78, 88, 90, 100, 67, 81, 77]

Bu liste, farklı öğrencilerin sınav notlarını temsil ediyor. Şimdi bu verilerin ortalamasını bulmalıyız. Ortalama, tüm değerlerin toplamının, değer sayısına bölünmesiyle hesaplansa da Python’da bunu yapmanın kolay bir yolu var.

2. Ortalama Hesaplama

Pythonda ortalama hesaplamak için, verilerin toplamını bulup, bu toplamı veri sayısına bölmek yeterlidir. Aşağıda ortalamanın nasıl hesaplanacağını görebilirsiniz:

ortalama = sum(notlar) / len(notlar)

Burası basit bir matematik işlemi, Python’da ise sum() ve len() işlevlerini kullanarak hızlıca halledebiliriz. Yukarıdaki satırda, sum() işlevi notlar listesindeki tüm notların toplamını hesaplar, len() işlevi ise listenin uzunluğunu verir ve bu ikisini birbirine böldüğümüzde aritmetik ortalamayı elde ederiz.

3. Sapma Hesaplama

Ortalamanızı bulduktan sonra, her bir notun ortalamadan ne kadar uzak olduğunu bulmalıyız. Her not için: ortalama – not farkını almalı, sonra bu farkı karesini almalıyız. İşte bu adım için gerekli kod:

sapmalar = [(x - ortalama) ** 2 for x in notlar]

Burada list comprehension kullanarak, her bir not için ortalamadan ne kadar uzak olduğunu hesaplıyoruz ve bu farkın karesini alıyoruz. Bu listenin her bir değeri, veri kümesinin her bir elemanının ortalama ile olan uzaklığının karesini temsil eder.

4. Varyans Hesaplama

Varyans, hesapladığımız bu sapmaların ortalaması olacaktır. Varyansı bulmak için aşağıdaki kodu yazabiliriz:

varyans = sum(sapmalar) / len(sapmalar)

Bu adımda, sapmaların toplamını alıp, sapmaların sayısına bölüyoruz. Burada dikkat edilmesi gereken nokta, eğer bir örnekleme yapıyorsak varyansı hesaplarken sonucun tüm nüfusa bağlı olarak yanında 1 ile bölmeliyiz. Bu durumda varyansı bulmak için aşağıdaki kodu kullanırız:

varyans = sum(sapmalar) / (len(sapmalar) - 1)

Bir sonraki adımda, varyans paydasını ayarlamak, verilerimizin belirli bir örneği temsil ettiğinde daha doğru bir sonuç elde edebilmemizi sağlar.

5. Standart Sapmayı Hesaplama

Varyans değerini elde ettikten sonra, standart sapmayı bulmak için varyansın karekökünü alacağız:

import math
standart_sapma = math.sqrt(varyans)

Python’daki math.sqrt() işlevi, bir sayının karekökünü almak için kullanılır. Yukarıdaki kod, varyansın karekökünü alarak standart sapmayı elde etmemizi sağlar. Tüm bu adımları bir araya getirecek olursak:

Adım Adım Uygulama Kodu

Aşağıda, yukarıda anlatılan adımları birleştiren tam bir Python kodu örneğini bulabilirsiniz:

notlar = [85, 92, 78, 88, 90, 100, 67, 81, 77]
ortalama = sum(notlar) / len(notlar)
sapmalar = [(x - ortalama) ** 2 for x in notlar]
varyans = sum(sapmalar) / (len(sapmalar) - 1)
standart_sapma = math.sqrt(varyans)
print(f'Standart Sapma: {standart_sapma}')

Bu kod parçacığı, elimizdeki veriler için standart sapmayı hesaplayarak çıktısını vermektedir.

Sonuç

Python programında standart sapmayı hesaplamak için NumPy kütüphanesine ihtiyaç duymadan, yalnızca yerleşik fonksiyonları kullanarak adım adım ilerledik. Her bir aşamada verilerin ortalamasını, sapmalarını, varyanslarını ve en sonunda standart sapmayı elde ettik. Bu yöntem, veri analizi ve istatistiksel işlemler yaparken temel bir ders niteliği taşır. NumPy gibi kütüphaneler kullanmak çok yaygın olsa da, Python’un sunduğu basit yapılarla bu tarz hesaplamaları gerçekleştirmek de mümkündür.

Son olarak, kendi veri setlerinizle bu yöntemi deneyebilirsiniz. Bu tür hesaplamalar, veri analizi konusunda temel bir giriş yapmanıza yardımcı olacaktır. Python ile istatistiksel verileri yorumlamak ve analiz etmek, yazılım geliştiricileri için önemli bir beceridir. Şimdi sırada denemeler yapma zamanı!

Scroll to Top