Ses tanıma, doğal dil işleme (NLP) ve makine öğreniminin birleşimidir. Bu uygulama, insan konuşmasını anlamak için bir bilgisayarın belirli işlevleri gerçekleştirmesine olanak tanır. Python, birçok ses tanıma API’siyle kolay entegrasyon sunarak bu teknolojiyi daha erişilebilir hale getirir.
Python ile Google Speech Recognition API Nedir?
Google Speech Recognition API, insanların söylediklerini anlayabilen ve belirli işlevleri gerçekleştirebilen bir makine öğrenimi teknolojisidir. Python programlama dili, bu API’nin kolay ve etkili bir şekilde kullanılmasına olanak tanır.
Speech Recognition Kütüphanesi Nedir?
Speech Recognition kütüphanesi, Python dili için geliştirilmiş bir araçtır ve Google Speech Recognition API dahil olmak üzere birçok ses tanıma API’sini destekler. Bu kütüphane sayesinde Python ile ses tanıma uygulamaları oluşturmak daha kolay hale gelir.
Kütüphaneyi Nasıl Kurabilirsiniz?
Speech Recognition kütüphanesini kullanabilmek için öncelikle bu kütüphaneyi Python ortamınıza kurmalısınız. Kütüphaneyi kurmak için aşağıdaki adımları izleyebilirsiniz:
pip install SpeechRecognition
Bu komut, SpeechRecognition kütüphanesini Python ortamınıza kuracaktır.
Pip ile Kütüphaneyi Yükleme Komutu
Yukarıda bahsedilen komutu kullanarak pip ile Speech Recognition kütüphanesini yükleyebilirsiniz. Bu işlem, Python ortamınızdaki paket yöneticisi pip aracılığıyla gerçekleşir.
PyAudio Kütüphanesinin Önemi
Ses tanıma işlemleri için ses verilerini işlemek önemlidir. Bu işlemi gerçekleştirmek için PyAudio kütüphanesine ihtiyaç vardır. PyAudio, ses akışlarını kontrol etmemizi sağlayan bir araçtır ve Speech Recognition kütüphanesi ile birlikte çalışır.
PyAudio Kütüphanesini Yüklemek İçin Komut
PyAudio kütüphanesini yüklemek için aşağıdaki komutu kullanabilirsiniz:
pip install PyAudio
Bu komut, PyAudio kütüphanesini Python ortamınıza kuracaktır.
Python ile Google Speech Recognition API Kullanımı
Google Speech Recognition API’yi Python ile kullanmaya başlamak için önce gerekli kütüphaneleri kurmalısınız. Ardından API’yi kullanmak için gerekli kodları yazabilirsiniz.
Kütüphanelerin İçe Aktarılması
Kütüphaneleri içe aktarmak için aşağıdaki kodu kullanabilirsiniz:
import speech_recognition as sr
Bu kod, SpeechRecognition kütüphanesini projeye dahil eder.
Tanıyıcı Oluşturma
Google’ın ses tanıma API’sini kullanabilmek için önce bir tanıyıcı oluşturmalısınız. Bunu şu şekilde yapabilirsiniz:
tanıyıcı = sr.Recognizer()
Böylece Google’ın ses tanıma API’sine bağlanabilirsiniz.
Ses Kaynağı Oluşturma
Sesi tanıyabilmek için bir ses kaynağı oluşturmalısınız. Bunu da şu şekilde yapabilirsiniz:
with sr.Microphone() as kaynak:
tanıyıcı = sr.Recognizer()
Ses Kaynağından Ses Alma
Sesi tanıyabilmek için öncelikle ses kaynağından ses almanız gerekir. Bunu şu şekilde yapabilirsiniz:
with sr.Microphone() as kaynak:
ses = tanıyıcı.listen(kaynak)
Böylece mikrofon aracılığıyla gelen sesi yakalamış olursunuz.
Sesi Metne Çevirme
Mikrofon aracılığıyla aldığınız sesi metne çevirmek için aşağıdaki kodu kullanabilirsiniz:
with sr.Microphone() as kaynak:
ses = tanıyıcı.listen(kaynak)
mukerrer = tanıyıcı.recognize_google(ses)
Böylece mikrofon aracılığıyla aldığınız sesi metne çevirmiş olursunuz.
Sesi Metne Çevirme İşleminin Detayları
Sesi metne çevirme işlemi sırasında bazı parametreler kullanabilirsiniz:
Pytube Kütüphanesi ile Youtube Videolarından Ses Tanıma
Pytube kütüphanesini kullanarak Youtube videolarından ses tanıma işlemi gerçekleştirebilirsiniz. Pytube, Youtube videolarını indirmenize olanak tanır.
Kütüphanelerin İçe Aktarılması
Pytube kütüphanesini kullanabilmek için önce bu kütüphaneyi de projeye dahil etmelisiniz. Bunu şu şekilde yapabilirsiniz:
from pytube import YouTube
YouTube Bağlantısından Ses Dosyası İndirme
YouTube bağlantısından ses dosyası indirmek için aşağıdaki kodu kullanabilirsiniz:
videoBağlantısı = "Youtube bağlantınızı buraya yapıştırın"
videoyuİndir = YouTube(videoBağlantısı)
videoyuİndir.streams.filter(only_audio=True).first().download("./sesler")
Sesi MP3 Formatında İndirme
Sesi MP3 formatında indirmek için video dosyasının uzantısını değiştirmelisiniz. Bu işlemi ffmpeg veya benzeri bir araç kullanarak gerçekleştirebilirsiniz.
Sesi MP4 Formatında İndirme
Sesi MP4 formatında indirmek için Pytube kütüphanesinin özelliklerini kullanarak video dosyasının uzantısını mp4 olarak ayarlayabilirsiniz.
Sesi Metne Çevirme İşlemi
YouTube’dan indirdiğiniz ses dosyasını metne çevirmek için aşağıdaki kodu kullanabilirsiniz:
tanıyıcı = sr.Recognizer()
sesKaynağı = sr.AudioFile("./sesler/indirdiğiniz_ses_dosyası.wav")
yardımcı = AudioFile("./sesler/indirdiğiniz_ses_dosyası.wav")
yardımcı.record(sesKaynağı)
mukerrer = tanıyıcı.recognize_google(yardımcı)
yazdır(mukerrer)
yazdır("Sonuç başarılı bir şekilde döndürüldü.")
yardımcı.close()
sesKaynağı.close()
Python ile Google Speech Recognition API Kullanırken Dikkat Edilmesi Gerekenler
Python ile Google Speech Recognition API kullanırken bazı hususlara dikkat etmelisiniz:
- Mikrofonun bağlı olduğundan emin olun ve doğru konumda olduğundan emin olun.
- Kayıt sırasında gürültüsüz bir ortamda olun.
- Kayıt sırasında ses seviyesinin çok yüksek veya düşük olmamasına dikkat edin.
- Kayıt sırasında net bir diksiyonla konuşmaya özen gösterin.
- Kayıt sırasında argo kelimelerden kaçının.
- Kayıt sırasında çok fazla duraksamadan konuşmaya özen gösterin.
- Kayıt sırasında ses tonu değişikliklerinden kaçının.