Bir ses dosyasındaki sözleri dosyaya yazdırmak

Delphi'de kod yazma ile ilgili sorularınızı bu foruma yazabilirsiniz.
Kullanıcı avatarı
mrmarman
Üye
Mesajlar: 4740
Kayıt: 09 Ara 2003 08:13
Konum: İstanbul
İletişim:

Mesaj gönderen mrmarman »

Merhaba...

- Mesleğimle ilgili bir bağlantısı olduğundan konuya katılma isteği duydum... :oops:

- Stereo kayıtlardaki uygulama, solistin hem sağ kanala hem de sol kanala eşit olarak kaydedilmesi şeklindedir. Enstrumanlar pek ortada kullanılmaz. Türk Müziğinde ve yabancı müzikte bile tersdir. Ama konumuz burada sağa ya da sola panlanmış tabir edilen aktarılmış olmasıdır. Aktarma oranı ne %25'den az ne de %100'üdür. Ortalama bir değerde Panorama edilir... :wink:

- Bu bize ne kazandırıyor, Aynı fazdaki Sağ kanal sesi, Ters fazı alınmış Sol kanal sesle mixlediğinizde mükemmele yakın bir şekilde solistin sesini yok edebiliyoruz... cebirsel olarak yani (+)'lar (-)'leri yokediyor... Hani Karaoke özelliği olan müzik setlerinin uyguladığı metod da bu galiba... :idea:

- Şimdi elimizde solist olmayan bir mono kayıt elde ettik. Bu sesi her iki kanala da tekrar ters fazda mix edersek biraz da EQ yardımıyla mükemmel olmasa da müziğin sadece derinden geldiği ve solistin solo olduğu bir sonuç elde ederiz... :) sesi ayıklamış gibi birşey oluruz... :)

- Çalışmaya bu aşamadan başayabilirsin... Ses yazılımı olarak Sony SoundForge 7.0'ı tavsiye ederim. Denemelerini yapar ve ses hakkında yoksa biraz bilgi sahibi olmanda fayda var. :idea:

- Merak ettiğim konu, çevirmek istediğin şeyin bir Telefon konuşması, bir diyalog vb. değil de müzik içinden isteme sebebin. Hemen her parçanın zaten sözleri (Lyric) Internette mevcut. :?:
Resim
Resim ....Resim
Kullanıcı avatarı
tuanna
Üye
Mesajlar: 582
Kayıt: 06 Ara 2004 05:01
Konum: Ankara
İletişim:

Mesaj gönderen tuanna »

belkide bu hususta haklısın ama sunu söyleyeyim her zaman istediğin parçacın sözünü bulamıyorsun hem böyle bir programı yapman demen şarkı sözleri arşivi oluşması hususunda bir devrim alabilir...Buda bize bir gelişim aşaması olarak suan yapılan bir sey olan
konuştuğunu bilgisayarın yazması gibi bir projenin temelleri olabilir...
aslında bilgisayara konustuğumuzu nasıl yazdırabiliriz....
Siz hayal edin...Biz yapalım TuannaSoft...
Kullanıcı avatarı
mrmarman
Üye
Mesajlar: 4740
Kayıt: 09 Ara 2003 08:13
Konum: İstanbul
İletişim:

Mesaj gönderen mrmarman »

Tekrar merhaba...

- @Abrak ve @coderlord son iki mesajında bu sorunu çok güzel cevaplamış... Örnekleme ve karşılaştırma, iki adım yani...

- Benim düşüncelerime gelince arkadaşlarla aynı. Ek olarak metodoloji olarak şu tip bir metod uygulandığını biliyorum.

- Bir dosya kağıdı uzunluğunda, konuşma diline dayalı, hemen hemen tüm hece ve bağlacı kapsayan metin hazırlanır ve bunun, sesi tanımlanacak kullanıcı tarafından okunması sağlanır ve kayda alınır. Bu klavuzdur.

- Anlayacağın sadece harflerle değil heceler ve kelime / kelime grupları da değerlendirmeye alınmalıdır...

- Sonra bir tane imla klavuzuna ihtiyacın olur. Bu klavuzdan kelime bankası olarak faydalanırsın. Bulunan kelimeler klavuzda yoksa benzerlerini arar en yakın sonucu bildirirsin...

- Kullanıcı, hatalı çevirileri düzelttikçe senin program da bunu öğrenir ve aynı hatayı tekrar yapmamaya gayret gösterir. Zamanla programa has kelime ve spektrum bankası oluşur.

- Bu böyle sürüp gider... Bu başlık altında yazılanları genel kültür bilgisi olarak kabul et.

- Kızabilirsin, lütfen kızma. Bu tip bir proje için sarfedeceğin vakit ve emeği daha faydalı demiyorum ama mantık ve yazılım dili hakimiyetine harcaman yönündeki samimi fikrimi kabul et... :)
Resim
Resim ....Resim
LazyCoder
Üye
Mesajlar: 13
Kayıt: 01 Eki 2003 01:27
İletişim:

Mesaj gönderen LazyCoder »

yaklaşık üç yıl önce konuşulmuş bu konu hakkında birkaç şey söylemek istiyorum.

Sanırım denildiği gibi en güzel yöntem karşılaştırmaktır. Fakat burada frekanstan bahsetmek yanlış olur. Karşılaştırma analog sinyallerin sayısal sinyallere dönüştürülmesiyle ve sonra işlenmesiyle yapılacaktır. Frekans değil ses dalgasının genlikleriyle alakalıdır. Çünkü insan sesinin belli bir frekans aralığı zaten vardır. Bir insanın konuşmasında sesinin frekansındaki değişmeden söz edilemez, ancak genlikleri değişir ve böylece bir titreşim oluşur. Oluşan titreşim hava moleküllerini zoruna salındırarak bir mikrofona ulaşır ve bu titreşim aynı yöntemle mikrofon alıcılarını zoruna titreştirir..
Bu konu Dalgalar ve Titreşimler başlığı altında incelenebilir.
Kullanıcı avatarı
mrmarman
Üye
Mesajlar: 4740
Kayıt: 09 Ara 2003 08:13
Konum: İstanbul
İletişim:

Mesaj gönderen mrmarman »

@LazyCoder

- Soru ve konu ilişkisi açısından frekans bahsi, müzik ve insan sesini ayrıştırmak adına filtre içindir. Bu operasyon için gereklidir. :idea:

- İnsan sesi tekil kalması başarıldığında o zaman ancak karşılaştırma yapılmaya başlanabilir.

- Başka bir başlıkta bahsettiğim genel metod ile basit çözümler üretilebilir. Karşılaştırma daha da zor bir işlemdir.

Ref : viewtopic.php?t=14681#86511
Resim
Resim ....Resim
Kullanıcı avatarı
nitro
Üye
Mesajlar: 1112
Kayıt: 23 Ağu 2004 01:18
Konum: Çanakkale
İletişim:

Mesaj gönderen nitro »

ya kardeş bu bana pek yapılabilir bişey gibi gelmedi, çünkü şarkıların sözlerini bir kaç kez dikkatli dinlememe rağmen ben bile anlayamıyorum bazen kaldı ki bilgisayar anlayacak :)
programın bazı karşılaştırmalar yapması lazım. mesela bir kelime bulduğu zaman o kelimenin anlamlı bişey olup olmadığını sorgulaması lazım.
Davut Güloğlu'nun "Güleyirum haluna katula katula, bi sözini geçüremedün karunaaaa" şarkısını bilgisayara verseniz, makine patlar :)
Kullanıcı avatarı
mrmarman
Üye
Mesajlar: 4740
Kayıt: 09 Ara 2003 08:13
Konum: İstanbul
İletişim:

Mesaj gönderen mrmarman »

@nitrokonat bu sözlerin bir kısmı bana ise, zaten yapılabileceğini söylemiyorum. Yapılmak istenirse gerekenlerden bahsediyorum. Örneğin karşıdan karşıya geçmek için Türkiye'de önce sola bakmak lazım diyorum ama kesintisiz akan bir otoyoldan bunu denersen tabii ki olmaz gibi.. Şartlar ve değerler yani... :idea:

- Diğer türlü ise bu mesajımı yok farzet. :lol: :lol: :lol:
Resim
Resim ....Resim
Kullanıcı avatarı
delphiibo
Üye
Mesajlar: 72
Kayıt: 27 Eki 2005 04:55
Konum: istanbul
İletişim:

Konuşmaları kaydetme?

Mesaj gönderen delphiibo »

Merhaba. Bir müzik dosyasından şarkı sözlerini almak çok zor. Eğer bulursan bizide unutma... :D
Onun tek dostu Allah
Kullanıcı avatarı
nitro
Üye
Mesajlar: 1112
Kayıt: 23 Ağu 2004 01:18
Konum: Çanakkale
İletişim:

Mesaj gönderen nitro »

yazdıklarım sadece olayı okurken neşem yerinde olduğu için öyleydi. Ama hakkaten bir çok şarkı var ki sözlerini hala anlaşım değilim :)
Muharrem abi, sözlerimin bir kısmı sna değil, daha doğrusu kimseye ithafen bir şey yazmadım.
Ayrıca sizin ve diğer forum üyelerimizin hangi mesajınız olursa olsun yok sayılmayacak kadar kıymetlidir. Sürç-ü lisan ettiysem affola.
AWCI
Üye
Mesajlar: 3
Kayıt: 17 Eki 2006 12:07

Microsoft

Mesaj gönderen AWCI »

Microsoft Senlerdir bir mikrofon aracılığı ile girilen bilgiyi Text olarak yazmaya çalışıyor ama bi türlü beceremedi yazıyı sese dönüştürdüler ama onu malesef beceremediler işin çok zor Kolay gelsin ama benim bi arkadaşın bitirme ödevi sonuç çıkarsa sana tekrar yazarım
@WCI®
aLonE CoDeR
Kıdemli Üye
Mesajlar: 1223
Kayıt: 26 Nis 2005 04:08

Re: Microsoft

Mesaj gönderen aLonE CoDeR »

AWCI yazdı:Microsoft Senlerdir bir mikrofon aracılığı ile girilen bilgiyi Text olarak yazmaya çalışıyor ama bi türlü beceremedi yazıyı sese dönüştürdüler ama onu malesef beceremediler işin çok zor
Güney Kore'de bir GSM üreticisi bunu çözdü ve mesaj yazmayı kolaylaştırmak için monte ettiler.Performansı tatmin edici değil ama yakın zamanda onu da aşacaklarını sanıyorum zira algoritma oturmuş vaziyette.Sorudaki asıl istenen ya da sorulan şey farklı :idea: Radyolar bilgisayarla yayın yapmaya başlamadan önce dec sistemiyle entegre çalışan büyük playerler vardı (hala da var gerçi..).Bu playerlerde örneğin 3.parçaya git dediğinde kasette 3.parçayı bulabiliyor.Her ne kadar sıradan bir karşılaştırma gibi görünse de esasında temel olarak bu teknik kullanılabilir.

Kolay gele..
Kullanıcı avatarı
sabanakman
Kıdemli Üye
Mesajlar: 3077
Kayıt: 17 Nis 2006 08:11
Konum: Ah bi Antalya olaydı keşke (Ankara)

Ses analizi

Mesaj gönderen sabanakman »

Ses frekansını müzikten ayıklamak fazla sorun sayılmaz. Çünkü insan sesi ile enstüman sesi birbirinden ayrışabilir. Asıl önemli olan ses bilgisinin analiz işlemi. Bu iş herhalde soğuk füzyonu bulmak kadar değerli olsa gerek. :) Zira yazılım sektörünün önde gelen firmaları yüzlerce kişilik kadrosuyla bu resim ve ses gibi bilgileri analiz etmek için uğraşmaktalar.

Önemli Not:Yazılım sektöründe imkansız diye bir şey yoktur.
Şaban Şahin AKMAN
_________________
Derin olan kuyu değil kısa olan iptir. - .
Kullanıcı avatarı
tuanna
Üye
Mesajlar: 582
Kayıt: 06 Ara 2004 05:01
Konum: Ankara
İletişim:

Re: Ses analizi

Mesaj gönderen tuanna »

sabanakman yazdı:Ses frekansını müzikten ayıklamak fazla sorun sayılmaz. Çünkü insan sesi ile enstüman sesi birbirinden ayrışabilir. Asıl önemli olan ses bilgisinin analiz işlemi. Bu iş herhalde soğuk füzyonu bulmak kadar değerli olsa gerek. :) Zira yazılım sektörünün önde gelen firmaları yüzlerce kişilik kadrosuyla bu resim ve ses gibi bilgileri analiz etmek için uğraşmaktalar.

Önemli Not:Yazılım sektöründe imkansız diye bir şey yoktur.
Bu insan sesi ile enstüman sesini bir birinden ayıran kücük bir uygulama ve code örneği yazmanız mümkünmü...
Siz hayal edin...Biz yapalım TuannaSoft...
doganzorlu
Kıdemli Üye
Mesajlar: 395
Kayıt: 22 Tem 2004 09:15
Konum: İzmir
İletişim:

Mesaj gönderen doganzorlu »

Selam,

Bu konuda OS/2 Warp 4.0 ın üstüne daha daha iyi birşey görmedim. Orada makinayı konuşarak pekala kontrol edebiliyordunuz. Birşeyleri karşılaştırmadan yaptığı da açık.

Misal;

"Open http://www.ibm.com"

dediğinizde browser açılıp o isteye bağlanabiliyordu. Buradan söylediğinizi bir şekilde harflere çevirdiğini anlayabilirsiniz. Bir notepad açıp içine dikte edebiliyordunuz bir metni.

Sonradan bir ara Windows ta da gördüm bunu. Word e bir kaç şey dikte edeyim dedim sanal bellek yetmedi hatası gelene kadar diskin ışığı yanık kaldı bir daha denemedim.

Bu konuda ibm daha iyi birşeyler ortaya koymuştu kişisel deneyimlerime göre. Sanırım onlar bu projelerini opensource yapmışlardı. IBM sitesinde yapılacak bir araştırmayla detaylı bilgiye ulaşılabilir sanırım.

Not: VR açıkken birisi size birşey sorarsa "sleep" demeyi unutursanız geri döndüğünüzde ekrana sizi dğişik sürprizler karşılıyordu :)
Doğan Zorlu, İzmir

------------------------
"Bu Kitap'ı sana yalnız şunun için indirdik: Hakkında ayrılığa düştükleri şeyi onlara iyice açıklayasın ve Kitap, iman eden bir topluluk için kılavuz ve rahmet olsun." (NAHL 64)
Kullanıcı avatarı
mucar
Kıdemli Üye
Mesajlar: 247
Kayıt: 17 May 2005 01:14

Mesaj gönderen mucar »

Konuyla ilgili zaten gereken pek çok şey söylenmiş, ilave olarak bu konu hakkında araştrma yapmak isteyenler için anahtar bir kaç kelime: "speech to text", "speech recognition", "voice recognition".

Bu konularla ilgili araştırma yaparsanız kullanılacak algoritmalar ve tekniklere ulaşabilirsiniz. Sonuç olarak da karşınıza çoğunlukla yapay sinir ağları (Neural Networks) çıkacak, bu da çok kapsamlı bir konu. Yani araştırdıkça konu derinleşecek, dallanıp budaklanacak. Pek çok firma zaten sesi yazıya çevirme konusunda ciddi çalışmalar yapmakta. Bu bile tam olarak çözüme kavuşmamışken bir de fon müziğiyle karışık ses işin içine giriyor :!:

Şarkı sözü arşivi hazırlayan bir program yapmak uğruna, böyle hengamelere girmek açıkçası pek mantıklı gelimiyor bana ama denirse ki: "Ben halen optimal ve yaygın çözüm bulunamamış bu konuda araştırmalar yapıp sesi yazıya çeviren bir program yazıp kullanıcıları klavye derdinden kurtaracağım" bu anlaşılabilir.

Imkansız diye bir şey tabi ki yoktur, fakat ne demiş Çin atasözü:

"Attığınız taş, ürküttüğünüz kurbağaya değsin"
"Evine bakmaktan aciz olan; ilerici, üç kıtaya hükmeden ecdadın mı gerici?"
Cevapla