Bir ses dosyasındaki sözleri dosyaya yazdırmak
Forum kuralları
Forum kurallarını okuyup, uyunuz!
Forum kurallarını okuyup, uyunuz!
Merhaba...
- Mesleğimle ilgili bir bağlantısı olduğundan konuya katılma isteği duydum...
- Stereo kayıtlardaki uygulama, solistin hem sağ kanala hem de sol kanala eşit olarak kaydedilmesi şeklindedir. Enstrumanlar pek ortada kullanılmaz. Türk Müziğinde ve yabancı müzikte bile tersdir. Ama konumuz burada sağa ya da sola panlanmış tabir edilen aktarılmış olmasıdır. Aktarma oranı ne %25'den az ne de %100'üdür. Ortalama bir değerde Panorama edilir...
- Bu bize ne kazandırıyor, Aynı fazdaki Sağ kanal sesi, Ters fazı alınmış Sol kanal sesle mixlediğinizde mükemmele yakın bir şekilde solistin sesini yok edebiliyoruz... cebirsel olarak yani (+)'lar (-)'leri yokediyor... Hani Karaoke özelliği olan müzik setlerinin uyguladığı metod da bu galiba...
- Şimdi elimizde solist olmayan bir mono kayıt elde ettik. Bu sesi her iki kanala da tekrar ters fazda mix edersek biraz da EQ yardımıyla mükemmel olmasa da müziğin sadece derinden geldiği ve solistin solo olduğu bir sonuç elde ederiz... sesi ayıklamış gibi birşey oluruz...
- Çalışmaya bu aşamadan başayabilirsin... Ses yazılımı olarak Sony SoundForge 7.0'ı tavsiye ederim. Denemelerini yapar ve ses hakkında yoksa biraz bilgi sahibi olmanda fayda var.
- Merak ettiğim konu, çevirmek istediğin şeyin bir Telefon konuşması, bir diyalog vb. değil de müzik içinden isteme sebebin. Hemen her parçanın zaten sözleri (Lyric) Internette mevcut.
- Mesleğimle ilgili bir bağlantısı olduğundan konuya katılma isteği duydum...
- Stereo kayıtlardaki uygulama, solistin hem sağ kanala hem de sol kanala eşit olarak kaydedilmesi şeklindedir. Enstrumanlar pek ortada kullanılmaz. Türk Müziğinde ve yabancı müzikte bile tersdir. Ama konumuz burada sağa ya da sola panlanmış tabir edilen aktarılmış olmasıdır. Aktarma oranı ne %25'den az ne de %100'üdür. Ortalama bir değerde Panorama edilir...
- Bu bize ne kazandırıyor, Aynı fazdaki Sağ kanal sesi, Ters fazı alınmış Sol kanal sesle mixlediğinizde mükemmele yakın bir şekilde solistin sesini yok edebiliyoruz... cebirsel olarak yani (+)'lar (-)'leri yokediyor... Hani Karaoke özelliği olan müzik setlerinin uyguladığı metod da bu galiba...
- Şimdi elimizde solist olmayan bir mono kayıt elde ettik. Bu sesi her iki kanala da tekrar ters fazda mix edersek biraz da EQ yardımıyla mükemmel olmasa da müziğin sadece derinden geldiği ve solistin solo olduğu bir sonuç elde ederiz... sesi ayıklamış gibi birşey oluruz...
- Çalışmaya bu aşamadan başayabilirsin... Ses yazılımı olarak Sony SoundForge 7.0'ı tavsiye ederim. Denemelerini yapar ve ses hakkında yoksa biraz bilgi sahibi olmanda fayda var.
- Merak ettiğim konu, çevirmek istediğin şeyin bir Telefon konuşması, bir diyalog vb. değil de müzik içinden isteme sebebin. Hemen her parçanın zaten sözleri (Lyric) Internette mevcut.
belkide bu hususta haklısın ama sunu söyleyeyim her zaman istediğin parçacın sözünü bulamıyorsun hem böyle bir programı yapman demen şarkı sözleri arşivi oluşması hususunda bir devrim alabilir...Buda bize bir gelişim aşaması olarak suan yapılan bir sey olan
konuştuğunu bilgisayarın yazması gibi bir projenin temelleri olabilir...
aslında bilgisayara konustuğumuzu nasıl yazdırabiliriz....
konuştuğunu bilgisayarın yazması gibi bir projenin temelleri olabilir...
aslında bilgisayara konustuğumuzu nasıl yazdırabiliriz....
Siz hayal edin...Biz yapalım TuannaSoft...
Tekrar merhaba...
- @Abrak ve @coderlord son iki mesajında bu sorunu çok güzel cevaplamış... Örnekleme ve karşılaştırma, iki adım yani...
- Benim düşüncelerime gelince arkadaşlarla aynı. Ek olarak metodoloji olarak şu tip bir metod uygulandığını biliyorum.
- Bir dosya kağıdı uzunluğunda, konuşma diline dayalı, hemen hemen tüm hece ve bağlacı kapsayan metin hazırlanır ve bunun, sesi tanımlanacak kullanıcı tarafından okunması sağlanır ve kayda alınır. Bu klavuzdur.
- Anlayacağın sadece harflerle değil heceler ve kelime / kelime grupları da değerlendirmeye alınmalıdır...
- Sonra bir tane imla klavuzuna ihtiyacın olur. Bu klavuzdan kelime bankası olarak faydalanırsın. Bulunan kelimeler klavuzda yoksa benzerlerini arar en yakın sonucu bildirirsin...
- Kullanıcı, hatalı çevirileri düzelttikçe senin program da bunu öğrenir ve aynı hatayı tekrar yapmamaya gayret gösterir. Zamanla programa has kelime ve spektrum bankası oluşur.
- Bu böyle sürüp gider... Bu başlık altında yazılanları genel kültür bilgisi olarak kabul et.
- Kızabilirsin, lütfen kızma. Bu tip bir proje için sarfedeceğin vakit ve emeği daha faydalı demiyorum ama mantık ve yazılım dili hakimiyetine harcaman yönündeki samimi fikrimi kabul et...
- @Abrak ve @coderlord son iki mesajında bu sorunu çok güzel cevaplamış... Örnekleme ve karşılaştırma, iki adım yani...
- Benim düşüncelerime gelince arkadaşlarla aynı. Ek olarak metodoloji olarak şu tip bir metod uygulandığını biliyorum.
- Bir dosya kağıdı uzunluğunda, konuşma diline dayalı, hemen hemen tüm hece ve bağlacı kapsayan metin hazırlanır ve bunun, sesi tanımlanacak kullanıcı tarafından okunması sağlanır ve kayda alınır. Bu klavuzdur.
- Anlayacağın sadece harflerle değil heceler ve kelime / kelime grupları da değerlendirmeye alınmalıdır...
- Sonra bir tane imla klavuzuna ihtiyacın olur. Bu klavuzdan kelime bankası olarak faydalanırsın. Bulunan kelimeler klavuzda yoksa benzerlerini arar en yakın sonucu bildirirsin...
- Kullanıcı, hatalı çevirileri düzelttikçe senin program da bunu öğrenir ve aynı hatayı tekrar yapmamaya gayret gösterir. Zamanla programa has kelime ve spektrum bankası oluşur.
- Bu böyle sürüp gider... Bu başlık altında yazılanları genel kültür bilgisi olarak kabul et.
- Kızabilirsin, lütfen kızma. Bu tip bir proje için sarfedeceğin vakit ve emeği daha faydalı demiyorum ama mantık ve yazılım dili hakimiyetine harcaman yönündeki samimi fikrimi kabul et...
yaklaşık üç yıl önce konuşulmuş bu konu hakkında birkaç şey söylemek istiyorum.
Sanırım denildiği gibi en güzel yöntem karşılaştırmaktır. Fakat burada frekanstan bahsetmek yanlış olur. Karşılaştırma analog sinyallerin sayısal sinyallere dönüştürülmesiyle ve sonra işlenmesiyle yapılacaktır. Frekans değil ses dalgasının genlikleriyle alakalıdır. Çünkü insan sesinin belli bir frekans aralığı zaten vardır. Bir insanın konuşmasında sesinin frekansındaki değişmeden söz edilemez, ancak genlikleri değişir ve böylece bir titreşim oluşur. Oluşan titreşim hava moleküllerini zoruna salındırarak bir mikrofona ulaşır ve bu titreşim aynı yöntemle mikrofon alıcılarını zoruna titreştirir..
Bu konu Dalgalar ve Titreşimler başlığı altında incelenebilir.
Sanırım denildiği gibi en güzel yöntem karşılaştırmaktır. Fakat burada frekanstan bahsetmek yanlış olur. Karşılaştırma analog sinyallerin sayısal sinyallere dönüştürülmesiyle ve sonra işlenmesiyle yapılacaktır. Frekans değil ses dalgasının genlikleriyle alakalıdır. Çünkü insan sesinin belli bir frekans aralığı zaten vardır. Bir insanın konuşmasında sesinin frekansındaki değişmeden söz edilemez, ancak genlikleri değişir ve böylece bir titreşim oluşur. Oluşan titreşim hava moleküllerini zoruna salındırarak bir mikrofona ulaşır ve bu titreşim aynı yöntemle mikrofon alıcılarını zoruna titreştirir..
Bu konu Dalgalar ve Titreşimler başlığı altında incelenebilir.
@LazyCoder
- Soru ve konu ilişkisi açısından frekans bahsi, müzik ve insan sesini ayrıştırmak adına filtre içindir. Bu operasyon için gereklidir.
- İnsan sesi tekil kalması başarıldığında o zaman ancak karşılaştırma yapılmaya başlanabilir.
- Başka bir başlıkta bahsettiğim genel metod ile basit çözümler üretilebilir. Karşılaştırma daha da zor bir işlemdir.
Ref : viewtopic.php?t=14681#86511
- Soru ve konu ilişkisi açısından frekans bahsi, müzik ve insan sesini ayrıştırmak adına filtre içindir. Bu operasyon için gereklidir.
- İnsan sesi tekil kalması başarıldığında o zaman ancak karşılaştırma yapılmaya başlanabilir.
- Başka bir başlıkta bahsettiğim genel metod ile basit çözümler üretilebilir. Karşılaştırma daha da zor bir işlemdir.
Ref : viewtopic.php?t=14681#86511
ya kardeş bu bana pek yapılabilir bişey gibi gelmedi, çünkü şarkıların sözlerini bir kaç kez dikkatli dinlememe rağmen ben bile anlayamıyorum bazen kaldı ki bilgisayar anlayacak
programın bazı karşılaştırmalar yapması lazım. mesela bir kelime bulduğu zaman o kelimenin anlamlı bişey olup olmadığını sorgulaması lazım.
Davut Güloğlu'nun "Güleyirum haluna katula katula, bi sözini geçüremedün karunaaaa" şarkısını bilgisayara verseniz, makine patlar
programın bazı karşılaştırmalar yapması lazım. mesela bir kelime bulduğu zaman o kelimenin anlamlı bişey olup olmadığını sorgulaması lazım.
Davut Güloğlu'nun "Güleyirum haluna katula katula, bi sözini geçüremedün karunaaaa" şarkısını bilgisayara verseniz, makine patlar
@nitrokonat bu sözlerin bir kısmı bana ise, zaten yapılabileceğini söylemiyorum. Yapılmak istenirse gerekenlerden bahsediyorum. Örneğin karşıdan karşıya geçmek için Türkiye'de önce sola bakmak lazım diyorum ama kesintisiz akan bir otoyoldan bunu denersen tabii ki olmaz gibi.. Şartlar ve değerler yani...
- Diğer türlü ise bu mesajımı yok farzet.
- Diğer türlü ise bu mesajımı yok farzet.
Konuşmaları kaydetme?
Merhaba. Bir müzik dosyasından şarkı sözlerini almak çok zor. Eğer bulursan bizide unutma...
Onun tek dostu Allah
yazdıklarım sadece olayı okurken neşem yerinde olduğu için öyleydi. Ama hakkaten bir çok şarkı var ki sözlerini hala anlaşım değilim
Muharrem abi, sözlerimin bir kısmı sna değil, daha doğrusu kimseye ithafen bir şey yazmadım.
Ayrıca sizin ve diğer forum üyelerimizin hangi mesajınız olursa olsun yok sayılmayacak kadar kıymetlidir. Sürç-ü lisan ettiysem affola.
Muharrem abi, sözlerimin bir kısmı sna değil, daha doğrusu kimseye ithafen bir şey yazmadım.
Ayrıca sizin ve diğer forum üyelerimizin hangi mesajınız olursa olsun yok sayılmayacak kadar kıymetlidir. Sürç-ü lisan ettiysem affola.
Microsoft
Microsoft Senlerdir bir mikrofon aracılığı ile girilen bilgiyi Text olarak yazmaya çalışıyor ama bi türlü beceremedi yazıyı sese dönüştürdüler ama onu malesef beceremediler işin çok zor Kolay gelsin ama benim bi arkadaşın bitirme ödevi sonuç çıkarsa sana tekrar yazarım
@WCI®
-
- Kıdemli Üye
- Mesajlar: 1223
- Kayıt: 26 Nis 2005 04:08
Re: Microsoft
Güney Kore'de bir GSM üreticisi bunu çözdü ve mesaj yazmayı kolaylaştırmak için monte ettiler.Performansı tatmin edici değil ama yakın zamanda onu da aşacaklarını sanıyorum zira algoritma oturmuş vaziyette.Sorudaki asıl istenen ya da sorulan şey farklı Radyolar bilgisayarla yayın yapmaya başlamadan önce dec sistemiyle entegre çalışan büyük playerler vardı (hala da var gerçi..).Bu playerlerde örneğin 3.parçaya git dediğinde kasette 3.parçayı bulabiliyor.Her ne kadar sıradan bir karşılaştırma gibi görünse de esasında temel olarak bu teknik kullanılabilir.AWCI yazdı:Microsoft Senlerdir bir mikrofon aracılığı ile girilen bilgiyi Text olarak yazmaya çalışıyor ama bi türlü beceremedi yazıyı sese dönüştürdüler ama onu malesef beceremediler işin çok zor
Kolay gele..
- sabanakman
- Kıdemli Üye
- Mesajlar: 3077
- Kayıt: 17 Nis 2006 08:11
- Konum: Ah bi Antalya olaydı keşke (Ankara)
Ses analizi
Ses frekansını müzikten ayıklamak fazla sorun sayılmaz. Çünkü insan sesi ile enstüman sesi birbirinden ayrışabilir. Asıl önemli olan ses bilgisinin analiz işlemi. Bu iş herhalde soğuk füzyonu bulmak kadar değerli olsa gerek. Zira yazılım sektörünün önde gelen firmaları yüzlerce kişilik kadrosuyla bu resim ve ses gibi bilgileri analiz etmek için uğraşmaktalar.
Önemli Not:Yazılım sektöründe imkansız diye bir şey yoktur.
Önemli Not:Yazılım sektöründe imkansız diye bir şey yoktur.
Şaban Şahin AKMAN
_________________
Derin olan kuyu değil kısa olan iptir. - .
_________________
Derin olan kuyu değil kısa olan iptir. - .
Re: Ses analizi
Bu insan sesi ile enstüman sesini bir birinden ayıran kücük bir uygulama ve code örneği yazmanız mümkünmü...sabanakman yazdı:Ses frekansını müzikten ayıklamak fazla sorun sayılmaz. Çünkü insan sesi ile enstüman sesi birbirinden ayrışabilir. Asıl önemli olan ses bilgisinin analiz işlemi. Bu iş herhalde soğuk füzyonu bulmak kadar değerli olsa gerek. Zira yazılım sektörünün önde gelen firmaları yüzlerce kişilik kadrosuyla bu resim ve ses gibi bilgileri analiz etmek için uğraşmaktalar.
Önemli Not:Yazılım sektöründe imkansız diye bir şey yoktur.
Siz hayal edin...Biz yapalım TuannaSoft...
-
- Kıdemli Üye
- Mesajlar: 395
- Kayıt: 22 Tem 2004 09:15
- Konum: İzmir
- İletişim:
Selam,
Bu konuda OS/2 Warp 4.0 ın üstüne daha daha iyi birşey görmedim. Orada makinayı konuşarak pekala kontrol edebiliyordunuz. Birşeyleri karşılaştırmadan yaptığı da açık.
Misal;
"Open http://www.ibm.com"
dediğinizde browser açılıp o isteye bağlanabiliyordu. Buradan söylediğinizi bir şekilde harflere çevirdiğini anlayabilirsiniz. Bir notepad açıp içine dikte edebiliyordunuz bir metni.
Sonradan bir ara Windows ta da gördüm bunu. Word e bir kaç şey dikte edeyim dedim sanal bellek yetmedi hatası gelene kadar diskin ışığı yanık kaldı bir daha denemedim.
Bu konuda ibm daha iyi birşeyler ortaya koymuştu kişisel deneyimlerime göre. Sanırım onlar bu projelerini opensource yapmışlardı. IBM sitesinde yapılacak bir araştırmayla detaylı bilgiye ulaşılabilir sanırım.
Not: VR açıkken birisi size birşey sorarsa "sleep" demeyi unutursanız geri döndüğünüzde ekrana sizi dğişik sürprizler karşılıyordu
Bu konuda OS/2 Warp 4.0 ın üstüne daha daha iyi birşey görmedim. Orada makinayı konuşarak pekala kontrol edebiliyordunuz. Birşeyleri karşılaştırmadan yaptığı da açık.
Misal;
"Open http://www.ibm.com"
dediğinizde browser açılıp o isteye bağlanabiliyordu. Buradan söylediğinizi bir şekilde harflere çevirdiğini anlayabilirsiniz. Bir notepad açıp içine dikte edebiliyordunuz bir metni.
Sonradan bir ara Windows ta da gördüm bunu. Word e bir kaç şey dikte edeyim dedim sanal bellek yetmedi hatası gelene kadar diskin ışığı yanık kaldı bir daha denemedim.
Bu konuda ibm daha iyi birşeyler ortaya koymuştu kişisel deneyimlerime göre. Sanırım onlar bu projelerini opensource yapmışlardı. IBM sitesinde yapılacak bir araştırmayla detaylı bilgiye ulaşılabilir sanırım.
Not: VR açıkken birisi size birşey sorarsa "sleep" demeyi unutursanız geri döndüğünüzde ekrana sizi dğişik sürprizler karşılıyordu
Doğan Zorlu, İzmir
------------------------
"Bu Kitap'ı sana yalnız şunun için indirdik: Hakkında ayrılığa düştükleri şeyi onlara iyice açıklayasın ve Kitap, iman eden bir topluluk için kılavuz ve rahmet olsun." (NAHL 64)
------------------------
"Bu Kitap'ı sana yalnız şunun için indirdik: Hakkında ayrılığa düştükleri şeyi onlara iyice açıklayasın ve Kitap, iman eden bir topluluk için kılavuz ve rahmet olsun." (NAHL 64)
Konuyla ilgili zaten gereken pek çok şey söylenmiş, ilave olarak bu konu hakkında araştrma yapmak isteyenler için anahtar bir kaç kelime: "speech to text", "speech recognition", "voice recognition".
Bu konularla ilgili araştırma yaparsanız kullanılacak algoritmalar ve tekniklere ulaşabilirsiniz. Sonuç olarak da karşınıza çoğunlukla yapay sinir ağları (Neural Networks) çıkacak, bu da çok kapsamlı bir konu. Yani araştırdıkça konu derinleşecek, dallanıp budaklanacak. Pek çok firma zaten sesi yazıya çevirme konusunda ciddi çalışmalar yapmakta. Bu bile tam olarak çözüme kavuşmamışken bir de fon müziğiyle karışık ses işin içine giriyor
Şarkı sözü arşivi hazırlayan bir program yapmak uğruna, böyle hengamelere girmek açıkçası pek mantıklı gelimiyor bana ama denirse ki: "Ben halen optimal ve yaygın çözüm bulunamamış bu konuda araştırmalar yapıp sesi yazıya çeviren bir program yazıp kullanıcıları klavye derdinden kurtaracağım" bu anlaşılabilir.
Imkansız diye bir şey tabi ki yoktur, fakat ne demiş Çin atasözü:
"Attığınız taş, ürküttüğünüz kurbağaya değsin"
Bu konularla ilgili araştırma yaparsanız kullanılacak algoritmalar ve tekniklere ulaşabilirsiniz. Sonuç olarak da karşınıza çoğunlukla yapay sinir ağları (Neural Networks) çıkacak, bu da çok kapsamlı bir konu. Yani araştırdıkça konu derinleşecek, dallanıp budaklanacak. Pek çok firma zaten sesi yazıya çevirme konusunda ciddi çalışmalar yapmakta. Bu bile tam olarak çözüme kavuşmamışken bir de fon müziğiyle karışık ses işin içine giriyor
Şarkı sözü arşivi hazırlayan bir program yapmak uğruna, böyle hengamelere girmek açıkçası pek mantıklı gelimiyor bana ama denirse ki: "Ben halen optimal ve yaygın çözüm bulunamamış bu konuda araştırmalar yapıp sesi yazıya çeviren bir program yazıp kullanıcıları klavye derdinden kurtaracağım" bu anlaşılabilir.
Imkansız diye bir şey tabi ki yoktur, fakat ne demiş Çin atasözü:
"Attığınız taş, ürküttüğünüz kurbağaya değsin"
"Evine bakmaktan aciz olan; ilerici, üç kıtaya hükmeden ecdadın mı gerici?"