<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" version="2.0">
  <channel>
    <title>topic Buscar dentro de un Pdf. in Alfresco Archive</title>
    <link>https://connect.hyland.com/t5/alfresco-archive/buscar-dentro-de-un-pdf/m-p/182327#M135457</link>
    <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Hola a todos….&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Tengo una preguntilla &lt;img id="smileyvery-happy" class="emoticon emoticon-smileyvery-happy" src="https://connect.hyland.com/i/smilies/16x16_smiley-very-happy.png" alt="Smiley Very Happy" title="Smiley Very Happy" /&gt;…&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Se podría hacer una busqueda y extraer texto de dentro de un Pdf para luego insertarlo en un metadato? Mi intención es crear un script que se ejecute con una regla al subir un fichero para rellenar el campo observaciones de los metadatos mas o menos asi…&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;document.properties.["cm:description"] = "resultado de la busqueda";&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;document.save();&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;El "resultado de la busqueda" sería una busqueda dentro del Pdf… Los documentos que se van a subir tienen todos la misma estructura y en una linea hay una frase que dice&amp;nbsp;&amp;nbsp; RESULTADO: XXXXXXXXXXXXX , pues esa frase es la que me gustaría extraer y copiar en los metadatos del documento una vez que se sube automaticamente.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;No se si me he explicado bien….&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Muchas gracias, madre mía como cuesta aprender esto, espero que poco a poco todos podamos adaptar nuestros alfrescos!!! &lt;img id="smileytongue" class="emoticon emoticon-smileytongue" src="https://connect.hyland.com/i/smilies/16x16_smiley-tongue.png" alt="Smiley Tongue" title="Smiley Tongue" /&gt;&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
    <pubDate>Tue, 17 Apr 2012 11:50:14 GMT</pubDate>
    <dc:creator>hyrca</dc:creator>
    <dc:date>2012-04-17T11:50:14Z</dc:date>
    <item>
      <title>Buscar dentro de un Pdf.</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/buscar-dentro-de-un-pdf/m-p/182327#M135457</link>
      <description>Hola a todos….Tengo una preguntilla &lt;IMG id="smileyvery-happy" class="emoticon emoticon-smileyvery-happy" src="https://migration33.stage.lithium.com/i/smilies/16x16_smiley-very-happy.png" alt="Smiley Very Happy" title="Smiley Very Happy" /&gt;…Se podría hacer una busqueda y extraer texto de dentro de un Pdf para luego insertarlo en un metadato? Mi intención es crear un script que se ejecute con una regla al subir un fichero para rellenar el campo observaciones de los metadatos mas o menos asi…documen</description>
      <pubDate>Tue, 17 Apr 2012 11:50:14 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/buscar-dentro-de-un-pdf/m-p/182327#M135457</guid>
      <dc:creator>hyrca</dc:creator>
      <dc:date>2012-04-17T11:50:14Z</dc:date>
    </item>
    <item>
      <title>Re: Buscar dentro de un Pdf.</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/buscar-dentro-de-un-pdf/m-p/182328#M135458</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Hola Hyrca,&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;Lo que comentas es totalmente factible, si bien no es sencillo (nosotros implementamos algo similar para un cliente, si bien era mucho más complejo pues validaba la información en BBDDs externas). &lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;Básicamente lo que buscas es un "ocr zonal" para el contenido del pdf. Lo&amp;nbsp; complicado del proceso es declarar "objetos" para utilizar vía API javascript que te permitan trabajar con el contenido de dichos pdfs.&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;Otra opción es crear una regla de conversión de dicho pdf a texto plano y que el script busque en dicho contenido plano el valor que viene después de " RESULTADO: " .. toda esta parte es la que tendrías que afinar utilizando comandos tales como "indexOf" y "substring"..obviamente esta opción es menos elegante y eficiente que la primera.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Espero que sirva de ayuda.&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;Saludos, ánimo y suerte!&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Mon, 11 Jun 2012 17:46:02 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/buscar-dentro-de-un-pdf/m-p/182328#M135458</guid>
      <dc:creator>venzia</dc:creator>
      <dc:date>2012-06-11T17:46:02Z</dc:date>
    </item>
  </channel>
</rss>

