<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" version="2.0">
  <channel>
    <title>topic Duda feroz :-) in Alfresco Archive</title>
    <link>https://connect.hyland.com/t5/alfresco-archive/duda-feroz/m-p/167371#M120896</link>
    <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Hola amigos.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Tengo una duda que no me deja dormir. Alfresco realiza un OCR en los archivos PDF? Porque he subido un y me halla todas las palabras que contiene. El PDF es el producto de un escaneo gráfico. No comprendo cómo es posible. Si alguien quiere ver el PDF lo puedo subir a mi servidor.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Gracias&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
    <pubDate>Fri, 03 Dec 2010 06:11:14 GMT</pubDate>
    <dc:creator>normando</dc:creator>
    <dc:date>2010-12-03T06:11:14Z</dc:date>
    <item>
      <title>Duda feroz :-)</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/duda-feroz/m-p/167371#M120896</link>
      <description>Hola amigos.Tengo una duda que no me deja dormir. Alfresco realiza un OCR en los archivos PDF? Porque he subido un y me halla todas las palabras que contiene. El PDF es el producto de un escaneo gráfico. No comprendo cómo es posible. Si alguien quiere ver el PDF lo puedo subir a mi servidor.Gracias</description>
      <pubDate>Fri, 03 Dec 2010 06:11:14 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/duda-feroz/m-p/167371#M120896</guid>
      <dc:creator>normando</dc:creator>
      <dc:date>2010-12-03T06:11:14Z</dc:date>
    </item>
    <item>
      <title>Re: Duda feroz :-)</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/duda-feroz/m-p/167372#M120897</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Efectivamente, a través del api iText Alfresco convierte el contenido de los pdfs subidos en texto "plano". La parte fundamental para que este contenido extraido sea válido, es decir contenga las palabras correctas y bien escritas, es que el scanner pase ocr sobre el documento digitalizado (en la mayoría de los casos lo hace por defecto).&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;Saludos,&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Thu, 09 Dec 2010 09:44:37 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/duda-feroz/m-p/167372#M120897</guid>
      <dc:creator>venzia</dc:creator>
      <dc:date>2010-12-09T09:44:37Z</dc:date>
    </item>
    <item>
      <title>Re: Duda feroz :-)</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/duda-feroz/m-p/167373#M120898</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Gracias Javier por la explicación. Yo supuse lo mismo. Voy a revisar el PDF a ver si efectivamente fue realizado OCR por el scanner.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Saludos&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Thu, 09 Dec 2010 14:09:18 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/duda-feroz/m-p/167373#M120898</guid>
      <dc:creator>normando</dc:creator>
      <dc:date>2010-12-09T14:09:18Z</dc:date>
    </item>
  </channel>
</rss>

