<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" version="2.0">
  <channel>
    <title>topic Re: Alfresco no encuentra archivos PDF in Alfresco Archive</title>
    <link>https://connect.hyland.com/t5/alfresco-archive/alfresco-no-encuentra-archivos-pdf/m-p/150870#M105689</link>
    <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;BLOCKQUOTE class="jive-quote"&gt;Eso solo te pasa con el documento escaneado o con cualquier PDF ? Como estás haciendo el OCR ?&lt;/BLOCKQUOTE&gt;&lt;BR /&gt;&lt;SPAN&gt;Cualquier PDF, de hecho estoy aplicando OCR con Acrobat Professional al momento de generar el PDF despues de escanear el documento, y el texto se encuentra dentro del archivo PDF, para darle la característica de PDF buscable.&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
    <pubDate>Wed, 29 Jun 2011 14:39:09 GMT</pubDate>
    <dc:creator>fcamposmx2000</dc:creator>
    <dc:date>2011-06-29T14:39:09Z</dc:date>
    <item>
      <title>Alfresco no encuentra archivos PDF</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/alfresco-no-encuentra-archivos-pdf/m-p/150864#M105683</link>
      <description>Tengo un problema, recientemente mi alfresco ya no busca en archivos PDF con OCR, anteriormente si funcionaba.Ya opté por reindexar lucene al full, pero sigo sin encontrar ningún archivo cuando se realiza una búsqueda.</description>
      <pubDate>Thu, 23 Jun 2011 15:45:11 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/alfresco-no-encuentra-archivos-pdf/m-p/150864#M105683</guid>
      <dc:creator>fcamposmx2000</dc:creator>
      <dc:date>2011-06-23T15:45:11Z</dc:date>
    </item>
    <item>
      <title>Re: Alfresco no encuentra archivos PDF</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/alfresco-no-encuentra-archivos-pdf/m-p/150865#M105684</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;no me queda claro si es la busqueda dentro de el pdf o el archivo que te dice el log?&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Thu, 23 Jun 2011 18:39:57 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/alfresco-no-encuentra-archivos-pdf/m-p/150865#M105684</guid>
      <dc:creator>psantis</dc:creator>
      <dc:date>2011-06-23T18:39:57Z</dc:date>
    </item>
    <item>
      <title>Re: Alfresco no encuentra archivos PDF</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/alfresco-no-encuentra-archivos-pdf/m-p/150866#M105685</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;BLOCKQUOTE class="jive-quote"&gt;no me queda claro si es la busqueda dentro de el pdf o el archivo que te dice el log?&lt;/BLOCKQUOTE&gt;&lt;BR /&gt;&lt;SPAN&gt;Tengo repositorios conteniendo archivos pdf a los que se aplico ocr, y al ejecutar búsquedas de palabras sobre ese repositorio, alfresco no encuentra ningun archivo que contenga esa palabra o frase, cuando el archivo si la contiene.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Gracias.&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Thu, 23 Jun 2011 19:20:38 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/alfresco-no-encuentra-archivos-pdf/m-p/150866#M105685</guid>
      <dc:creator>fcamposmx2000</dc:creator>
      <dc:date>2011-06-23T19:20:38Z</dc:date>
    </item>
    <item>
      <title>Re: Alfresco no encuentra archivos PDF</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/alfresco-no-encuentra-archivos-pdf/m-p/150867#M105686</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Verifica que el proceso de OCR se está ejecutando. No se que OCR estarás pasando pero imagino que habrás definido el extractor. Activando en log4j los exctractores podrás ver si el OCR está dando algún problema:&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;log4j.logger.org.alfresco.util.exec.RuntimeExec=DEBUG&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;log4j.logger.org.alfresco.repo.content.transform.ContentTransformerRegistry=DEBUG&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;una manera de ver si esta funcionando bien es coger un documento PDF y mediante&amp;nbsp; las acciones convertirlo a texto plano.&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Fri, 24 Jun 2011 11:35:33 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/alfresco-no-encuentra-archivos-pdf/m-p/150867#M105686</guid>
      <dc:creator>rmacian</dc:creator>
      <dc:date>2011-06-24T11:35:33Z</dc:date>
    </item>
    <item>
      <title>Re: Alfresco no encuentra archivos PDF</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/alfresco-no-encuentra-archivos-pdf/m-p/150868#M105687</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Ya intenté hacer lo que me comentas y obtuve el siguiente error:&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;No se pudieron ejecutar acciones debido al error: 05270232 Content conversion failed: reader: ContentAccessor[ contentUrl=store://2011/5/26/12/53/219e4b38-44d7-4c2b-bd96-479d41910958.bin, mimetype=application/pdf, size=774902, encoding=utf-8, locale=es_ES] writer: ContentAccessor[ contentUrl=store://2011/6/27/13/0/99764264-b3dd-48c3-a9eb-0bb1aeff063f.bin, mimetype=text/plain, size=0, encoding=utf-8, locale=es_ES] options: org.alfresco.service.cmr.repository.TransformationOptions@90eb6c&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Mon, 27 Jun 2011 18:02:02 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/alfresco-no-encuentra-archivos-pdf/m-p/150868#M105687</guid>
      <dc:creator>fcamposmx2000</dc:creator>
      <dc:date>2011-06-27T18:02:02Z</dc:date>
    </item>
    <item>
      <title>Re: Alfresco no encuentra archivos PDF</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/alfresco-no-encuentra-archivos-pdf/m-p/150869#M105688</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Eso solo te pasa con el documento escaneado o con cualquier PDF ? Como estás haciendo el OCR ?&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Tue, 28 Jun 2011 06:36:01 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/alfresco-no-encuentra-archivos-pdf/m-p/150869#M105688</guid>
      <dc:creator>rmacian</dc:creator>
      <dc:date>2011-06-28T06:36:01Z</dc:date>
    </item>
    <item>
      <title>Re: Alfresco no encuentra archivos PDF</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/alfresco-no-encuentra-archivos-pdf/m-p/150870#M105689</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;BLOCKQUOTE class="jive-quote"&gt;Eso solo te pasa con el documento escaneado o con cualquier PDF ? Como estás haciendo el OCR ?&lt;/BLOCKQUOTE&gt;&lt;BR /&gt;&lt;SPAN&gt;Cualquier PDF, de hecho estoy aplicando OCR con Acrobat Professional al momento de generar el PDF despues de escanear el documento, y el texto se encuentra dentro del archivo PDF, para darle la característica de PDF buscable.&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Wed, 29 Jun 2011 14:39:09 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/alfresco-no-encuentra-archivos-pdf/m-p/150870#M105689</guid>
      <dc:creator>fcamposmx2000</dc:creator>
      <dc:date>2011-06-29T14:39:09Z</dc:date>
    </item>
    <item>
      <title>Re: Alfresco no encuentra archivos PDF</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/alfresco-no-encuentra-archivos-pdf/m-p/150871#M105690</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Ya encontré la raíz de mi problema:&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Los archivos PDF que estoy integrando al Alfresco poseen clave de protección, entonces PDFBox no puede extraer los textos que Lucene requiere para incluir en el índice, alguien sabe como pasarle la clave a PDFBox de tal forma que pueda abrir los archivos?&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Saludos.&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Wed, 29 Jun 2011 17:26:11 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/alfresco-no-encuentra-archivos-pdf/m-p/150871#M105690</guid>
      <dc:creator>fcamposmx2000</dc:creator>
      <dc:date>2011-06-29T17:26:11Z</dc:date>
    </item>
  </channel>
</rss>

