Buscar dentro de un Pdf.

hyrca — Tue, 17 Apr 2012 11:50:14 GMT

Hola a todos….Tengo una preguntilla …Se podría hacer una busqueda y extraer texto de dentro de un Pdf para luego insertarlo en un metadato? Mi intención es crear un script que se ejecute con una regla al subir un fichero para rellenar el campo observaciones de los metadatos mas o menos asi…documen

Re: Buscar dentro de un Pdf.

venzia — Mon, 11 Jun 2012 17:46:02 GMT

Hola Hyrca,
Lo que comentas es totalmente factible, si bien no es sencillo (nosotros implementamos algo similar para un cliente, si bien era mucho más complejo pues validaba la información en BBDDs externas).
Básicamente lo que buscas es un "ocr zonal" para el contenido del pdf. Lo complicado del proceso es declarar "objetos" para utilizar vía API javascript que te permitan trabajar con el contenido de dichos pdfs.
Otra opción es crear una regla de conversión de dicho pdf a texto plano y que el script busque en dicho contenido plano el valor que viene después de " RESULTADO: " .. toda esta parte es la que tendrías que afinar utilizando comandos tales como "indexOf" y "substring"..obviamente esta opción es menos elegante y eficiente que la primera.

Espero que sirva de ayuda.
Saludos, ánimo y suerte!

topic Buscar dentro de un Pdf. in Alfresco Archive

Buscar dentro de un Pdf.

Re: Buscar dentro de un Pdf.