resimleri birleştirip ocr lı pdf yapma ve kelime işaretleme

kazimates · Mesaj gönderen **kazimates** » 12 Şub 2019 01:47

Delphi ile bilgisayarda bulunan abc kalsörü altında ki resimleri birleştirip tek dosya pdf yapmam ve sonrasında bu pdf içinde vereceğim anahtar kelimelere göre ilgili kelimeleri bulup üzerini işaretlemem lazım. En sonunda ise hangi sayfa numaralarında işaretleme yapmışsam bunu ekranda göstermem gerekecek. Bu işlem için hangi komponente ihtiyacım olacak. Özellikle türkçe OCR konusunda hızlı ve mümkün olan en iyi ocr teknolojisini barındırması gerekecek.

Mesaj gönderen **sabanakman** » 13 Şub 2019 08:44

İyi günler. Resimleri pdf'e çevirirken sayfaların resim biçimiyle birleştirilmesinin farklı yolları olabilir. Debenu, SynPDF kütüphaneleri bunlardan bazısı olabilir veya pdf yazıcı üzerinden pdf dosyalara yazdırma (v.s...) işlemi de kullanılabilir. Fakat resimleri bir word belgesi gibi pdf ye çevirmek başlı başına ciddi bir iş olacaktır.

OCR meselesinde ise ister resimleri direkt olarak ister PDF içinden direkt sayfa seçerek karakter çözme işlemini Nicomsoft'un ücretsiz olarak yayınlanan API uygulamasını kullanabilirsiniz. Bu kütüphanede yanlış hatırlamıyorsam resimler üzerinden olduğu gibi PDF üzerinden de OCR işlemi yapabiliyordu.

OCR işleminin bir başka yöntemi ise Ghost Script veya XPdf gibi kütüphaneler kullanılarak istenen sayfanın (dosyaya çıkartarak) resmini çekip daha sonra o resim üzerinden OCR işleminin yapılmasıdır. Bu gibi kütüphaneler pdf belge içeriğinde bulunan yazıları text olarak çıkarma becerisine sahip olsalar bile PDF sayfaları word belgesi gibi olmayan resim biçimli belgelerden yazıları çıkartamazlar. Çünkü bilgiler resim formatındadır. Bu resimler ancak OCR işlemine tabi tutulduktan sonra yazıları elde edebilirsiniz ve bu da yukarıda belirttiğim Nicomsoft veya TTesseractOCR gibi kütüphaneler kullanılarak yapılabilir. İyi çalışmalar.

Delphi Forum

resimleri birleştirip ocr lı pdf yapma ve kelime işaretleme

resimleri birleştirip ocr lı pdf yapma ve kelime işaretleme

Re: resimleri birleştirip ocr lı pdf yapma ve kelime işaretleme