Sesi Tanımak ve Ona göre İşlem Yapmak..

Delphi'de kod yazma ile ilgili sorularınızı bu foruma yazabilirsiniz.
Cevapla
s1lv3r
Üye
Mesajlar: 91
Kayıt: 09 Nis 2006 03:03

Sesi Tanımak ve Ona göre İşlem Yapmak..

Mesaj gönderen s1lv3r »

Arkadaşlar bazı programlar [GVZ KOMUTANLAR] ses ile verilen bir komutu algılıyor ve ona göre yapılması gerekni yapıyor bunu nasıl yapabiliriz.

Yani kullanıcı vindovz diye yazı olarak girecek. Daha sonra program açıkken vindovx dediğinde o algılanacak ve vindovz ile ilgili kod devreye girecek :?:
Kullanıcı avatarı
zynex
Üye
Mesajlar: 87
Kayıt: 02 Nis 2006 02:53
Konum: Çanakkale

Mesaj gönderen zynex »

valla tam olarak bilmemekler birlikte http://www.pegai.net/Oscilloscope4Source.zip adresine bi ses grafiğini çıkaran bir program ekledim bu programı indirip biraz araştırırsan belki bişeyler yapabilirsin?
s1lv3r
Üye
Mesajlar: 91
Kayıt: 09 Nis 2006 03:03

Mesaj gönderen s1lv3r »

Maalesef istediğim sonuca ulaşamıyorum :( Başka comp. varmı acaba
Kullanıcı avatarı
Trial_Cooder
Üye
Mesajlar: 236
Kayıt: 17 Nis 2006 04:44

Mesaj gönderen Trial_Cooder »

Ses Grafiği İşini Görür. Gelen Sesin Ses Grafiğinde Önceden Kayıtlı Olan Sesle Grafiği Aynımı Diye Bakacak
Akin_Delphi
Üye
Mesajlar: 163
Kayıt: 06 Nis 2006 12:22

Mesaj gönderen Akin_Delphi »

s1lv3r yazdı:Maalesef istediğim sonuca ulaşamıyorum :( Başka comp. varmı acaba
Sayın Arkadaşım,

Bilmiyorum sizin yaklaşımınız ne ancak, bildiğim kadarıyla ses tanıma programlarına önce tanıyacağı sesi vermeniz lazım. Tıpki cep telefonlarında olduğu gibi.

Yani diyeceğim o ki, tanıyacağı sesi önceden programa giriyor ve karşılaştırma yapıyor musunuz :?:

Bu forumda üye olan herkesin aynı kelimeyi söylemesini sağlasanız ve söyledikleri kelimeyi osiloskopta inceleseniz, her birinin ses imzasının farklı olduğunu görürsünüz.

İnsan beyni gerçekten akıllı olduğu için, farklı insanlar bile konuşsa anlayabiliyor ancak, bilgisayar açısından frekansta, genlikte, konuşma hızında meydana gelen en ufak değişiklik bile o sesin farklı bir ses olduğu izlenimini verir ve dolayısıyla yazacağınız program sesi tanıyamaz.

Çok fazla yardımcı olamadım farkındayım ancak en azından bir başlangıçtır.
Saygılar ve Başarılar.
aLonE CoDeR
Kıdemli Üye
Mesajlar: 1223
Kayıt: 26 Nis 2005 04:08

Mesaj gönderen aLonE CoDeR »

torry.net'de bi ara bulmuştum böyle bi component.Çok detaylı değil ama winamptaki spectrum benzeri şeyler yapmak için ses seviyesini veriyordu.Geri besleme tekniğini kullanarak yakın bir eşlemeyle sesi tanımayı ortalama bir yüzdeyle çözmüştüm.Öncelikle veritabanı ya da herhangi bir veri depolama sistemine bu spectrum/grafik değerlerini kaydediyorsun.Ses mikrofondan okunduğunda anlık olarak kaydediyorsun ve play ederek onun da grafiğini çıkarıyorsun.Akabinden yakın bir eşlemeyle veri kaynağından arama yapıyorsun vs.vs.

Kolay gele..
Anadolu27
Üye
Mesajlar: 35
Kayıt: 04 Nis 2006 11:42
Konum: Nizip

Mesaj gönderen Anadolu27 »

Merhaba,

Her bir harfin ses dalgası veya imzası farklı. burdan yola çıkarak istediğin şey yapılabilir.

Sen sıfırdan bişey yapayım dersen bu iş için azıcık Mathlab + YSA bilmek gerekiyor. Farklı toollarlada yapılabilir belki.. Elektronikten bir arkadaşın tezi Türkçe harflerin tanıtılması idi.
Siz Ş,Ö,Ü... gibi harfleri seslendirdiğinizde pogram bunu alğılayabiliyordu.
ve bu işi programlama mantığı oturmamış birisi yaptı.

buraya aktarmak üzere şimdi kendi bilgisayarımda aradıma ama bulamadım bu projeyi.

Genel mantık 8-10 kişiden konuşma önekleri alınıyor. bunlar Mathlab ile bir kaç işlemden geçirilip harfler konuşma metni içerisinden ayrıştırılıyor. Sonra yine mathlab ile küçük bir YSA uygulmasına bu harfler aktarılıyor.
Yani oluşturduğunuz networkünüzü harf harf eğitiyorsunuz.
Networkünüzü eğittikten sonra farklı bir kişiden aldığınız konuşma örneklerini sistem çözümleyebiliyor. Bunun başarı oranını artırmak için networkünüzü çok farklı seslerle eğitmeniz gerekiyor. Ama sadece komutu siz verecekseniz ve sadece sizin sesinizle eğitilirse networkünüzün verimi çok daha yüksek olacaktır. yüksekten kastım sayısal olarak %99 dur.

Biraz karışık anlattım sanırsam ama kesinlikle üzerine düşüldüğünde yapılabilecek bir uygulama.

İnşallah Sohbet formunda açtığımız "Genel katılımla OpenSource Uygulamalar Geliştirmek" başlığı altında bir katılım sağlayabilir ve bir sonraki adımı olan proje seçimlerine geçersek bunuda bir proje olarak dile getirecez.

Sağlıcakla...
shadowmann
Üye
Mesajlar: 508
Kayıt: 30 Oca 2004 10:49

Mesaj gönderen shadowmann »

Her zaman bir vâmuk-i azra olur alem bu ya,
Nev-be-nev efsaneler peydâ olur alem bu ya,
Kabz u bast kıl tefekkür aleminde ey gönül,
Vakt-i sermânın sonu, vakt-i germân olur alem bu ya...
Kullanıcı avatarı
mrmarman
Üye
Mesajlar: 4741
Kayıt: 09 Ara 2003 08:13
Konum: İstanbul
İletişim:

Mesaj gönderen mrmarman »

Selam..

- Osiloskop yerine birim zamandaki ses volume değişikliğini örnekleyerek daha basit haledebilirsin. Bunun için eşik volume değerini belirleyip o değeri geçtiği noktalara 1 geçemediği noktalara 0 dersen, birim zamanda ölçüm değeri kadar bitlik veri elde edilmiş olur. Bu metodu ilk creative ses kartımın sesle komut yazılımında görmüştüm. Birim zamandaki örnek sayısı hassasiyeti belirliyor.

- Bu metod kısa komutları karıştırabilmesinden dolayı sorunlu olmasına rağmen cümle halindeki komutlarda başarı oranı oldukça yüksek. Ayrıca ortamdaki fon sesler komut seviyelerine direkt etki etmediğinden herhangi bir sürekli çalışan cihaz sesi olsa da görev yapabiliyor.

- Osiloskop halinde karşılaştırma durumunda, ortamdaki fon sesindeki değişiklik grafiğe direkt etki ettiğinden karşılaştırma başarısı büyük oranda düşüyor.

- Başarılar..
Resim
Resim ....Resim
aLonE CoDeR
Kıdemli Üye
Mesajlar: 1223
Kayıt: 26 Nis 2005 04:08

Mesaj gönderen aLonE CoDeR »

Sohbet bölümündeki open source topicine, proje konusu olarak bu kabul edilebilir :idea:
Kullanıcı avatarı
bluekid
Kıdemli Üye
Mesajlar: 541
Kayıt: 11 Haz 2004 10:45
İletişim:

Mesaj gönderen bluekid »

öncelikle Yapay Zeka ve YSA yapay sinir ağları - ANN Artfical Neural Networks - , Hidden Markov Models (HMM) konularıyla uğraşman gerecek
Kolayca yapılacak bir şey olmadığını da bil
aşağıdaki linklerden başlaya bilirsin
http://www.tldp.org/HOWTO/Speech-Recogn ... index.html
http://www.yapay-zeka.org/
YSA olarak FANN kütüphanesini önerebilirim
http://leenissen.dk/fann/
tarikogut
Üye
Mesajlar: 32
Kayıt: 11 Nis 2006 04:31

Mesaj gönderen tarikogut »

microsoftun speech apisi var onunla haledebilirsin
100 Adet Dedicated Server
Vpn Network Uzmanlığı
3 Gbit Internet Connection
s1lv3r
Üye
Mesajlar: 91
Kayıt: 09 Nis 2006 03:03

Mesaj gönderen s1lv3r »

İlgilenen herkeze teşekkürler. Verdiğiniz link ve bilgiler doğrultusunda başlangıcı yaptım takıldığım yerlerde yine buradan devam ederim.
Cevapla