İşte zurnanın bip sesini çıkardığı nokta orası.Ses tanıma sistemlerini yapmak bu yüzden zor.İki wav dosyasını karşılaştırdığında iki sesin aynı olup olmadığını sınarsın.Ancak ses tanıma teknolojilerinde harflerin frekarslarına göre metne dönüştürme işlemi var.Focus dergisinde bu konu hakkında bilgi vardı.Tahminen 3-4 ay önce.acolak yazdı:hocam her ses tonu aynı degildir diyorsun sonrada sesi metne cevirmek lazım diyorsun.farzedelim elinde iki farkı tonda ses dosyası var.bu aradaki fark frekanslarından doguyor.sence bu fark metne de yansımazmı?Ali Erdoğan yazdı:Abi konu biraz dağıldı ama bende şimdi şeyi merak ettim:Şimdi tamam kaydettim wörd deyince wörd açılıyor.Ancak yarın nezle olursam,sesim kısılırsa ne olacak.Veya bi başka biri oturdu o tuttu Woord dedi bu sefer gibi bir yöntem izlenecek.
Keşke atalarımız zamanında bir dili oluştururken ses olarak birbiri ile çok zıt 6-7 harf ile konuşsalardı.Şimdi bu sistem kolay olurdu.
Bunun yanında ses tanıma teknolojisinde önemli olan sesi tanımak ve önceden kayıtlı bir sesle karşılaştırmak değil.Sesi metine dönüştürerek anında bunu bir komuta çevirebilmek.Değilse her yazdığın programın sesle yönetilebilmesi için önce kullanacak kişinin sesini kaydetmek gerekirdi.
telefondan hangi tuşa basıldı
Forum kuralları
Forum kurallarını okuyup, uyunuz!
Forum kurallarını okuyup, uyunuz!
-
- Kıdemli Üye
- Mesajlar: 1026
- Kayıt: 11 Şub 2005 02:12
- Konum: İstanbul
Merhaba...
- Ses ve Frekans deyince dayanamadım söze giriyorum... (mesleğim gereği)
- Ses tanıma konusunda frekansa hiç girmeyin derim... Çünkü zaman ile orantılanarak düzelemde yatay ile ifade edilir. Teknik detaya inilmek gerekirse inerim, şimdilik bu kadar yeter...
- Yine zamanı baz alıp kaydedilmiş örnek sesteki birim zamandaki Volume değişikliğinin (düzlemde dikey) analizi işinizi daha da kolaylaştırır. Bunları, konu güvenlik olmadığı için söylüyorum... Yoksa yazdıklarımı yok sayın...
- Örnekleme tabiri kullanmdan önce bunun teknik anlamını açıklamak istiyorum...
- Örnekleme iki şekilde tanımlanabilir.
1. Daha sonra karşılaştırma yapmak için referans teşkil edecek ses kaydı yapma...
2. Referans ses kaydının bir zaman peryodu ile dilimlenerek her dilimlenmiş parçasını elde etmek...
- Bir ses komutun önce örneklenmesi, yani kaydedilip elimizde bir referansının bulunması gerekiyor.
- Bu referans sesimiz Delphi IDE Aç olsun. bu yaklaşık 1,5 saniyelik bir kayıt olacaktır. Bu 1,5 saniyelik kaydı 100 milisaniyelik dilimlere bölersek, 1500 / 100 = 15 örnek elde ederiz. Bu her örnekteki ses volume (seviye) değerinin belli bir seviye üzerini 1, geri kalanları 0 yaparsak 15 bitlik ikilik düzende bir sayı elde ederiz. Bu sayı o örneğin rakamsal ifadesidir.
- Gelen her komutu birim zamanda aynı şekilde değerlendirirsek ve çıkan sonuçları rakamsal olarak içinde geçiyor mu ya da eşit mi (isteğe bağlı) değerlendirmesiyle o komutun verilip verilmediğini tespit ederiz...
- Basit anlamda bir ses komut denetimi bu şekildedir. Komut kısa kalırsa karışıklık olacağından, bu metod için mümkün olduğunca uzun komutlar tercih edilmelidir. Aç ve At bireysel olarak aynı değerde olabilir. Komut Dosyasını Aç, Geri Dönüşüm Kutusuna At gibi genişleterek uygulamayı olumlu yönde geliştirmiş olursunuz.
- Umarım karışık ifade etmemişimdir.
- Ses ve Frekans deyince dayanamadım söze giriyorum... (mesleğim gereği)

- Ses tanıma konusunda frekansa hiç girmeyin derim... Çünkü zaman ile orantılanarak düzelemde yatay ile ifade edilir. Teknik detaya inilmek gerekirse inerim, şimdilik bu kadar yeter...
- Yine zamanı baz alıp kaydedilmiş örnek sesteki birim zamandaki Volume değişikliğinin (düzlemde dikey) analizi işinizi daha da kolaylaştırır. Bunları, konu güvenlik olmadığı için söylüyorum... Yoksa yazdıklarımı yok sayın...
- Örnekleme tabiri kullanmdan önce bunun teknik anlamını açıklamak istiyorum...
- Örnekleme iki şekilde tanımlanabilir.


- Bir ses komutun önce örneklenmesi, yani kaydedilip elimizde bir referansının bulunması gerekiyor.

- Bu referans sesimiz Delphi IDE Aç olsun. bu yaklaşık 1,5 saniyelik bir kayıt olacaktır. Bu 1,5 saniyelik kaydı 100 milisaniyelik dilimlere bölersek, 1500 / 100 = 15 örnek elde ederiz. Bu her örnekteki ses volume (seviye) değerinin belli bir seviye üzerini 1, geri kalanları 0 yaparsak 15 bitlik ikilik düzende bir sayı elde ederiz. Bu sayı o örneğin rakamsal ifadesidir.

- Gelen her komutu birim zamanda aynı şekilde değerlendirirsek ve çıkan sonuçları rakamsal olarak içinde geçiyor mu ya da eşit mi (isteğe bağlı) değerlendirmesiyle o komutun verilip verilmediğini tespit ederiz...

- Basit anlamda bir ses komut denetimi bu şekildedir. Komut kısa kalırsa karışıklık olacağından, bu metod için mümkün olduğunca uzun komutlar tercih edilmelidir. Aç ve At bireysel olarak aynı değerde olabilir. Komut Dosyasını Aç, Geri Dönüşüm Kutusuna At gibi genişleterek uygulamayı olumlu yönde geliştirmiş olursunuz.

- Umarım karışık ifade etmemişimdir.
