Sesi Tanımak ve Ona göre İşlem Yapmak..

s1lv3r · Mesaj gönderen **s1lv3r** » 09 Nis 2006 03:11

Arkadaşlar bazı programlar [GVZ KOMUTANLAR] ses ile verilen bir komutu algılıyor ve ona göre yapılması gerekni yapıyor bunu nasıl yapabiliriz.

Yani kullanıcı vindovz diye yazı olarak girecek. Daha sonra program açıkken vindovx dediğinde o algılanacak ve vindovz ile ilgili kod devreye girecek

zynex · Mesaj gönderen **zynex** » 09 Nis 2006 03:51

valla tam olarak bilmemekler birlikte http://www.pegai.net/Oscilloscope4Source.zip adresine bi ses grafiğini çıkaran bir program ekledim bu programı indirip biraz araştırırsan belki bişeyler yapabilirsin?

s1lv3r · Mesaj gönderen **s1lv3r** » 27 Nis 2006 06:22

Maalesef istediğim sonuca ulaşamıyorum

Başka comp. varmı acaba

Trial_Cooder · Mesaj gönderen **Trial_Cooder** » 27 Nis 2006 06:44

Ses Grafiği İşini Görür. Gelen Sesin Ses Grafiğinde Önceden Kayıtlı Olan Sesle Grafiği Aynımı Diye Bakacak

Akin_Delphi · Mesaj gönderen **Akin_Delphi** » 27 Nis 2006 07:59

s1lv3r yazdı:Maalesef istediğim sonuca ulaşamıyorum Başka comp. varmı acaba

Sayın Arkadaşım,

Bilmiyorum sizin yaklaşımınız ne ancak, bildiğim kadarıyla ses tanıma programlarına önce tanıyacağı sesi vermeniz lazım. Tıpki cep telefonlarında olduğu gibi.

Yani diyeceğim o ki, tanıyacağı sesi önceden programa giriyor ve karşılaştırma yapıyor musunuz

Bu forumda üye olan herkesin aynı kelimeyi söylemesini sağlasanız ve söyledikleri kelimeyi osiloskopta inceleseniz, her birinin ses imzasının farklı olduğunu görürsünüz.

İnsan beyni gerçekten akıllı olduğu için, farklı insanlar bile konuşsa anlayabiliyor ancak, bilgisayar açısından frekansta, genlikte, konuşma hızında meydana gelen en ufak değişiklik bile o sesin farklı bir ses olduğu izlenimini verir ve dolayısıyla yazacağınız program sesi tanıyamaz.

Çok fazla yardımcı olamadım farkındayım ancak en azından bir başlangıçtır.
Saygılar ve Başarılar.

Mesaj gönderen **aLonE CoDeR** » 27 Nis 2006 09:34

torry.net'de bi ara bulmuştum böyle bi component.Çok detaylı değil ama winamptaki spectrum benzeri şeyler yapmak için ses seviyesini veriyordu.Geri besleme tekniğini kullanarak yakın bir eşlemeyle sesi tanımayı ortalama bir yüzdeyle çözmüştüm.Öncelikle veritabanı ya da herhangi bir veri depolama sistemine bu spectrum/grafik değerlerini kaydediyorsun.Ses mikrofondan okunduğunda anlık olarak kaydediyorsun ve play ederek onun da grafiğini çıkarıyorsun.Akabinden yakın bir eşlemeyle veri kaynağından arama yapıyorsun vs.vs.

Kolay gele..

Anadolu27 · Mesaj gönderen **Anadolu27** » 28 Nis 2006 01:03

Merhaba,

Her bir harfin ses dalgası veya imzası farklı. burdan yola çıkarak istediğin şey yapılabilir.

Sen sıfırdan bişey yapayım dersen bu iş için azıcık Mathlab + YSA bilmek gerekiyor. Farklı toollarlada yapılabilir belki.. Elektronikten bir arkadaşın tezi Türkçe harflerin tanıtılması idi.
Siz Ş,Ö,Ü... gibi harfleri seslendirdiğinizde pogram bunu alğılayabiliyordu.
ve bu işi programlama mantığı oturmamış birisi yaptı.

buraya aktarmak üzere şimdi kendi bilgisayarımda aradıma ama bulamadım bu projeyi.

Genel mantık 8-10 kişiden konuşma önekleri alınıyor. bunlar Mathlab ile bir kaç işlemden geçirilip harfler konuşma metni içerisinden ayrıştırılıyor. Sonra yine mathlab ile küçük bir YSA uygulmasına bu harfler aktarılıyor.
Yani oluşturduğunuz networkünüzü harf harf eğitiyorsunuz.
Networkünüzü eğittikten sonra farklı bir kişiden aldığınız konuşma örneklerini sistem çözümleyebiliyor. Bunun başarı oranını artırmak için networkünüzü çok farklı seslerle eğitmeniz gerekiyor. Ama sadece komutu siz verecekseniz ve sadece sizin sesinizle eğitilirse networkünüzün verimi çok daha yüksek olacaktır. yüksekten kastım sayısal olarak %99 dur.

Biraz karışık anlattım sanırsam ama kesinlikle üzerine düşüldüğünde yapılabilecek bir uygulama.

İnşallah Sohbet formunda açtığımız "Genel katılımla OpenSource Uygulamalar Geliştirmek" başlığı altında bir katılım sağlayabilir ve bir sonraki adımı olan proje seçimlerine geçersek bunuda bir proje olarak dile getirecez.

Sağlıcakla...

shadowmann · Mesaj gönderen **shadowmann** » 28 Nis 2006 09:29

http://groups.google.com.tr/groups/sear ... i&qt_s=Ara

mrmarman · Mesaj gönderen **mrmarman** » 28 Nis 2006 10:34

Selam..

- Osiloskop yerine birim zamandaki ses volume değişikliğini örnekleyerek daha basit haledebilirsin. Bunun için eşik volume değerini belirleyip o değeri geçtiği noktalara 1 geçemediği noktalara 0 dersen, birim zamanda ölçüm değeri kadar bitlik veri elde edilmiş olur. Bu metodu ilk creative ses kartımın sesle komut yazılımında görmüştüm. Birim zamandaki örnek sayısı hassasiyeti belirliyor.

- Bu metod kısa komutları karıştırabilmesinden dolayı sorunlu olmasına rağmen cümle halindeki komutlarda başarı oranı oldukça yüksek. Ayrıca ortamdaki fon sesler komut seviyelerine direkt etki etmediğinden herhangi bir sürekli çalışan cihaz sesi olsa da görev yapabiliyor.

- Osiloskop halinde karşılaştırma durumunda, ortamdaki fon sesindeki değişiklik grafiğe direkt etki ettiğinden karşılaştırma başarısı büyük oranda düşüyor.

- Başarılar..

Mesaj gönderen **aLonE CoDeR** » 28 Nis 2006 10:57

Sohbet bölümündeki open source topicine, proje konusu olarak bu kabul edilebilir

Mesaj gönderen **bluekid** » 28 Nis 2006 12:19

öncelikle Yapay Zeka ve YSA yapay sinir ağları - ANN Artfical Neural Networks - , Hidden Markov Models (HMM) konularıyla uğraşman gerecek
Kolayca yapılacak bir şey olmadığını da bil
aşağıdaki linklerden başlaya bilirsin
http://www.tldp.org/HOWTO/Speech-Recogn ... index.html
http://www.yapay-zeka.org/
YSA olarak FANN kütüphanesini önerebilirim
http://leenissen.dk/fann/

tarikogut · Mesaj gönderen **tarikogut** » 28 Nis 2006 06:13

microsoftun speech apisi var onunla haledebilirsin

s1lv3r · Mesaj gönderen **s1lv3r** » 30 Nis 2006 12:57

İlgilenen herkeze teşekkürler. Verdiğiniz link ve bilgiler doğrultusunda başlangıcı yaptım takıldığım yerlerde yine buradan devam ederim.