Bir ses dosyasındaki sözleri dosyaya yazdırmak
Forum kuralları
Forum kurallarını okuyup, uyunuz!
Forum kurallarını okuyup, uyunuz!
Bir ses dosyasındaki sözleri dosyaya yazdırmak
arkadaşlar ben herhangi bir ses dosyasındaki sözleri bir dosyaya yazdırmak istiyorum...böylece şarkı sözlerini yazmak değilde hazırlamak çok kolay olacak...yorumlarınızı bekliyorum
Siz hayal edin...Biz yapalım TuannaSoft...
merhaba, sen fazla hayal kuruyosun galiba.
şaka yaptım alınma sakın.
Bunun mümkün olabileceğini pek sanmıyorum. çünkü ses dosyalarında müzikte seste iç içe girmiş frekanslar olarak saklanıyor bildiğim kadarıyla.
belki baskın olan frekansları ayıklayabilirsin ama bunuda nasıl text kaydedersin bilemem.
kolay gelsin

Bunun mümkün olabileceğini pek sanmıyorum. çünkü ses dosyalarında müzikte seste iç içe girmiş frekanslar olarak saklanıyor bildiğim kadarıyla.
belki baskın olan frekansları ayıklayabilirsin ama bunuda nasıl text kaydedersin bilemem.
kolay gelsin
- veliadiguzel
- Üye
- Mesajlar: 197
- Kayıt: 09 Tem 2003 02:11
- Konum: Gebze/Kocaeli
- İletişim:
Selamun Aleyküm
Aslında senin bahsettiğin şeyi japonlar (tam bilmiyorum ama o civardan bi ülke ) yapmış konuşmaları sms olarak kaydediyor ama senin söylediğin biraz daha uçuk şarkı içindeki sözleri ayıklamak bayaa zor sadece programcılık bilgisi yetmeye bilir ve sesin kodlama şeklide önemli mp3 de wav da v.d anlıyacağın işin zor ama başarırsan devrim olur. Sekreter lere şu sen sööle bilgisyar yazsın
AEO
Aslında senin bahsettiğin şeyi japonlar (tam bilmiyorum ama o civardan bi ülke ) yapmış konuşmaları sms olarak kaydediyor ama senin söylediğin biraz daha uçuk şarkı içindeki sözleri ayıklamak bayaa zor sadece programcılık bilgisi yetmeye bilir ve sesin kodlama şeklide önemli mp3 de wav da v.d anlıyacağın işin zor ama başarırsan devrim olur. Sekreter lere şu sen sööle bilgisyar yazsın

AEO
kardeşlerim bu hususta cevap vermek belki erken ama sizlerin hepinizin yorumlarınızı bekliyorum...bir program vardı fon müzikleri yapmak için yani şarkı sözlerini göz ardı ediyordu...dolayısıyla bu yapılıyorsa benim dediğimde olabilir ...hayel hususunda bundan yüz yıl önce insanlar bir birleriyle bu kadar hızlı iletişim olacak dese herkes adama hayel der ve adamı ileri giderek deli ilan ederlerdi...1970 insanalar araba nedir bilmeszken ve hatta çoğu insan şehirler arasında giderken yürüyordu...ben çok uçuk bir sey istemedin sunuda isteyebilirdim bir program yazınki beni niğde den istanbula göndersin ...ve aynı hızla geri getirsin hatta zaman kavramınıda ortadan kaldırsın ve ben buna inanıyorum...ama ne zaman olacak onu kestiremiyorum...
En son tuanna tarafından 27 Oca 2005 01:01 tarihinde düzenlendi, toplamda 1 kere düzenlendi.
Siz hayal edin...Biz yapalım TuannaSoft...
merhaba.
) yaptığı en önemli şey de olayı daha da geliştirmek oldu..yani daha önce telefonlar 10 kişiye kadar, kayıtlı seslerden bulabiliyordu,bunu geliştirdiler..bu da ciddi bi gelişme olarak görülemez zaten, ki; örneğin biz Türk milleti olarak ortalama 300 kelime kullanıyoruz,gerisini siz hesap edin..
soruya gelince;
arkadaşların da dediği gibi, elinde bi veri olmadan, karşılaştırma yapmadan bunu yapman imkansız (şimdilik..kimbilir ilerleyen yıllarda çözülebilir belki).
kolay gelsin.
hocam bahsettiğiniz olay bildiğiniz üzre kayıtlı olan veriler üzerindeki eşleme olayı..onların (japonlar kesinlikle değil ama ülkeyi ben de hatırlayamadımveliadiguzel yazdı:konuşmaları sms olarak kaydediyor

soruya gelince;
arkadaşların da dediği gibi, elinde bi veri olmadan, karşılaştırma yapmadan bunu yapman imkansız (şimdilik..kimbilir ilerleyen yıllarda çözülebilir belki).
kolay gelsin.
1. Bahsettiğin filtredeki gibi arka fon sesleri filtreleyip sadece sözleri elde etmen lazım ve bunu oldukça temiz parazitsiz bir şekilde elde etmen gerek.
2. Bir Voice Recognition algoritması ile bu ses verisini yazıya dönüştürmen lazım. Bununla Microsoft, IBM gibi firmalar halen uğraşıyorlar. Gene de %100 doğru bir şekilde yazıya dönüştürmeyi henüz yapamadılar. Microsoft'un kullandığı API açık. Hatta bununla ilgili Delphi componentleri mevcut.
2. Bir Voice Recognition algoritması ile bu ses verisini yazıya dönüştürmen lazım. Bununla Microsoft, IBM gibi firmalar halen uğraşıyorlar. Gene de %100 doğru bir şekilde yazıya dönüştürmeyi henüz yapamadılar. Microsoft'un kullandığı API açık. Hatta bununla ilgili Delphi componentleri mevcut.
peki eğitme gereksinimi duymadan neyi baz alarak tanıyabiliyor çok merak ettim.örneğin "delphi" derken 34-38-22-40-46-35 gibi spectrum (gösterge için örnektir) değeri dönerken, "visual" için 22-35-52-46-48-35 gibi bi değer dönecek..ikisi de 6 harf olmasına (yazıldığı gibi okunduğunu varsayıyorum, Türkçe'nin en önemli özelliğini dikkate aldım) rağmen ortada farklı değerler var.neye göre kontrol edilebilir bu sence?bir süre ses eşleme konusuyla ilgilenmiş ve gözardı edilmeyecek bi mesafe katetmiştim.bu nedenle merak ettim yeni gelişmeleri.
teşekkürler..
teşekkürler..
Ben senin kadar geniş kapsamlı bir çalışma hiç yapmadım. Muhtemelen dile özel, generic datalarla çalışıyorlar veya algoritma kendi kendine öğreniyor kullanıcıdan geri-besleme alarak. Yanlız spectrum örneğinde bence bir eksiklik var. Orada sadece pik değerler değil, zaman da önemli.
Bu, zaman verisini de kullanarak vurgu, tonlama vs.. gibi , dile özel detaylar generic data kullanarak tanımlamada kullanılabilir.
Diğer detayları bilemeyeceğim.
İyi günler.
Bu, zaman verisini de kullanarak vurgu, tonlama vs.. gibi , dile özel detaylar generic data kullanarak tanımlamada kullanılabilir.
Diğer detayları bilemeyeceğim.
İyi günler.
En son fduman tarafından 27 Oca 2005 02:18 tarihinde düzenlendi, toplamda 1 kere düzenlendi.
ben de editlemek durumunda kaldım
spectrum örneğindeki sadece fikir vermek içindi..oldukça detaylı bi konudur spectrum fikrimce..bir dönem radyolar için program yazıyorduk, ciddi olarak ilgilenmiştim..
evet geri besleme mantığı olabilir..
gvz.com sitesinde daha önce gördüğüm bişey vardı, emin değilim tabi ama koç şirketlerinin birisinin kendilerinin sistemlerini kullandıklarından bahsediyorlardı. bu sistemde ses tanınabiliyor(muş).yani ben merhaba dediğimde "delphi_coder hoşgeldin", sen merhaba dediğinde "coder lord hoşgeldin" diyor gibi bişey..gerçi hala bi patlama olmadı bu konuda kendilerinden ama..konuyla direkt alakası olmasa da paralel bi konu olduğundan bahsetmeden geçemedim.
kolay gelsin.

spectrum örneğindeki sadece fikir vermek içindi..oldukça detaylı bi konudur spectrum fikrimce..bir dönem radyolar için program yazıyorduk, ciddi olarak ilgilenmiştim..
evet geri besleme mantığı olabilir..
gvz.com sitesinde daha önce gördüğüm bişey vardı, emin değilim tabi ama koç şirketlerinin birisinin kendilerinin sistemlerini kullandıklarından bahsediyorlardı. bu sistemde ses tanınabiliyor(muş).yani ben merhaba dediğimde "delphi_coder hoşgeldin", sen merhaba dediğinde "coder lord hoşgeldin" diyor gibi bişey..gerçi hala bi patlama olmadı bu konuda kendilerinden ama..konuyla direkt alakası olmasa da paralel bi konu olduğundan bahsetmeden geçemedim.
kolay gelsin.
En son Misafir tarafından 27 Oca 2005 02:24 tarihinde düzenlendi, toplamda 2 kere düzenlendi.
ilk önce kullanıcı harfleri tek tek söyleyerek kendi ses frekansını kaydecek örneğin a karşıtı 38 (atıyorum) daha sonra konuşma sırasında o harflerle söylenen kelime ile karşılaştırma yapacak kelimeyi nasıl harfle derseniz eğer frekans değişikliğini baz alarak pos olayı gibi kelimeyi bölüp daha sonra karşılaştırma yaparak yazacak ama önemli olan aynı tonda konuşmak için kullanıcının kendini kasması veya çok hassas cihazlar olması gerecektir.
Benim kafamda böyle bir algolitma oluştu
Benim kafamda böyle bir algolitma oluştu
Başkasına Olan Saygımız.. Kendimize Olan saygıdır..