Python ile Google Ses Tanıma API’sini Kullanmak

Ses tanıma, doğal dil işleme (NLP) ve makine öğreniminin birleşimidir. Bu uygulama, insan konuşmasını anlamak için bir bilgisayarın belirli işlevleri gerçekleştirmesine olanak tanır. Python, birçok ses tanıma API’siyle kolay entegrasyon sunarak bu teknolojiyi daha erişilebilir hale getirir.

Python ile Google Speech Recognition API Nedir?

Google Speech Recognition API, insanların söylediklerini anlayabilen ve belirli işlevleri gerçekleştirebilen bir makine öğrenimi teknolojisidir. Python programlama dili, bu API’nin kolay ve etkili bir şekilde kullanılmasına olanak tanır.

Speech Recognition Kütüphanesi Nedir?

Speech Recognition kütüphanesi, Python dili için geliştirilmiş bir araçtır ve Google Speech Recognition API dahil olmak üzere birçok ses tanıma API’sini destekler. Bu kütüphane sayesinde Python ile ses tanıma uygulamaları oluşturmak daha kolay hale gelir.

Kütüphaneyi Nasıl Kurabilirsiniz?

Speech Recognition kütüphanesini kullanabilmek için öncelikle bu kütüphaneyi Python ortamınıza kurmalısınız. Kütüphaneyi kurmak için aşağıdaki adımları izleyebilirsiniz:

pip install SpeechRecognition

Bu komut, SpeechRecognition kütüphanesini Python ortamınıza kuracaktır.

Pip ile Kütüphaneyi Yükleme Komutu

Yukarıda bahsedilen komutu kullanarak pip ile Speech Recognition kütüphanesini yükleyebilirsiniz. Bu işlem, Python ortamınızdaki paket yöneticisi pip aracılığıyla gerçekleşir.

PyAudio Kütüphanesinin Önemi

Ses tanıma işlemleri için ses verilerini işlemek önemlidir. Bu işlemi gerçekleştirmek için PyAudio kütüphanesine ihtiyaç vardır. PyAudio, ses akışlarını kontrol etmemizi sağlayan bir araçtır ve Speech Recognition kütüphanesi ile birlikte çalışır.

PyAudio Kütüphanesini Yüklemek İçin Komut

PyAudio kütüphanesini yüklemek için aşağıdaki komutu kullanabilirsiniz:

pip install PyAudio

Bu komut, PyAudio kütüphanesini Python ortamınıza kuracaktır.

Python ile Google Speech Recognition API Kullanımı

Google Speech Recognition API’yi Python ile kullanmaya başlamak için önce gerekli kütüphaneleri kurmalısınız. Ardından API’yi kullanmak için gerekli kodları yazabilirsiniz.

Kütüphanelerin İçe Aktarılması

Kütüphaneleri içe aktarmak için aşağıdaki kodu kullanabilirsiniz:

import speech_recognition as sr

Bu kod, SpeechRecognition kütüphanesini projeye dahil eder.

Tanıyıcı Oluşturma

Google’ın ses tanıma API’sini kullanabilmek için önce bir tanıyıcı oluşturmalısınız. Bunu şu şekilde yapabilirsiniz:

tanıyıcı = sr.Recognizer()

Böylece Google’ın ses tanıma API’sine bağlanabilirsiniz.

Ses Kaynağı Oluşturma

Sesi tanıyabilmek için bir ses kaynağı oluşturmalısınız. Bunu da şu şekilde yapabilirsiniz:

with sr.Microphone() as kaynak:
    tanıyıcı = sr.Recognizer()

Ses Kaynağından Ses Alma

Sesi tanıyabilmek için öncelikle ses kaynağından ses almanız gerekir. Bunu şu şekilde yapabilirsiniz:

with sr.Microphone() as kaynak:
    ses = tanıyıcı.listen(kaynak)

Böylece mikrofon aracılığıyla gelen sesi yakalamış olursunuz.

Sesi Metne Çevirme

Mikrofon aracılığıyla aldığınız sesi metne çevirmek için aşağıdaki kodu kullanabilirsiniz:

with sr.Microphone() as kaynak:
    ses = tanıyıcı.listen(kaynak)
mukerrer = tanıyıcı.recognize_google(ses)

Böylece mikrofon aracılığıyla aldığınız sesi metne çevirmiş olursunuz.

Sesi Metne Çevirme İşleminin Detayları

Sesi metne çevirme işlemi sırasında bazı parametreler kullanabilirsiniz:

Pytube Kütüphanesi ile Youtube Videolarından Ses Tanıma

Pytube kütüphanesini kullanarak Youtube videolarından ses tanıma işlemi gerçekleştirebilirsiniz. Pytube, Youtube videolarını indirmenize olanak tanır.

Kütüphanelerin İçe Aktarılması

Pytube kütüphanesini kullanabilmek için önce bu kütüphaneyi de projeye dahil etmelisiniz. Bunu şu şekilde yapabilirsiniz:

from pytube import YouTube

YouTube Bağlantısından Ses Dosyası İndirme

YouTube bağlantısından ses dosyası indirmek için aşağıdaki kodu kullanabilirsiniz:

videoBağlantısı = "Youtube bağlantınızı buraya yapıştırın"
videoyuİndir = YouTube(videoBağlantısı)
videoyuİndir.streams.filter(only_audio=True).first().download("./sesler")

Sesi MP3 Formatında İndirme

Sesi MP3 formatında indirmek için video dosyasının uzantısını değiştirmelisiniz. Bu işlemi ffmpeg veya benzeri bir araç kullanarak gerçekleştirebilirsiniz.

Sesi MP4 Formatında İndirme

Sesi MP4 formatında indirmek için Pytube kütüphanesinin özelliklerini kullanarak video dosyasının uzantısını mp4 olarak ayarlayabilirsiniz.

Sesi Metne Çevirme İşlemi

YouTube’dan indirdiğiniz ses dosyasını metne çevirmek için aşağıdaki kodu kullanabilirsiniz:

tanıyıcı = sr.Recognizer()
sesKaynağı = sr.AudioFile("./sesler/indirdiğiniz_ses_dosyası.wav")
yardımcı = AudioFile("./sesler/indirdiğiniz_ses_dosyası.wav")
yardımcı.record(sesKaynağı)
mukerrer = tanıyıcı.recognize_google(yardımcı)
yazdır(mukerrer)
yazdır("Sonuç başarılı bir şekilde döndürüldü.")
yardımcı.close()
sesKaynağı.close()

Python ile Google Speech Recognition API Kullanırken Dikkat Edilmesi Gerekenler

Python ile Google Speech Recognition API kullanırken bazı hususlara dikkat etmelisiniz:

  • Mikrofonun bağlı olduğundan emin olun ve doğru konumda olduğundan emin olun.
  • Kayıt sırasında gürültüsüz bir ortamda olun.
  • Kayıt sırasında ses seviyesinin çok yüksek veya düşük olmamasına dikkat edin.
  • Kayıt sırasında net bir diksiyonla konuşmaya özen gösterin.
  • Kayıt sırasında argo kelimelerden kaçının.
  • Kayıt sırasında çok fazla duraksamadan konuşmaya özen gösterin.
  • Kayıt sırasında ses tonu değişikliklerinden kaçının.
Scroll to Top