<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" version="2.0">
  <channel>
    <title>topic Tesseract full integration in Alfresco Archive</title>
    <link>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172909#M126087</link>
    <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Hola a todos. Espero que lo siguiente les sea útil a quiénes deseen realizar búsquedas de texto en documento escaneados TIF, y en linux.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Antes debo hacer alguna aclaraciones.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Tesseract 2.x NO funciona con archicos con extensión .tiff , sólo funciona con archivos .tif . La versión 3.0 sí lo hace. A continuación pongo la versión para Tesseract 2.x, dado que Alfresco modifica los archivos TIF a TIFF en el proceso de transformación, y luego lo guarda nuevamente a .TIF (alguien sabe si este se puede cambiar y dejarlo sólo en .tif?). &lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Hay otro problema más, y es que Tesseract da siempre como archivo de salida uno finalizado en txt, por lo tanto si le agregamos la extensión, obtendremos un archivo.txt.txt. Por este motivo he realizado un wrapper para eviatr este problema, y que Alfresco pueda indexar correctamente.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;En primer lugar debemos probar Tesseract desde la consola:&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;PRE class="language-none line-numbers"&gt;&lt;CODE&gt;tesseract archivo.tif archivosalida -l spa&lt;SPAN class="line-numbers-rows"&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;/SPAN&gt;&lt;/CODE&gt;&lt;/PRE&gt;&lt;BR /&gt;&lt;SPAN&gt;archivosalida lo dejamos sin extensión. Si todo funciona correctamente.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Creamos un archivo ocrtiff-transform-context.xml en /tomcat/shared/classes/alfresco/extenssion con el siguiente contenido:&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;PRE class="language-none line-numbers"&gt;&lt;CODE&gt;&amp;lt;?xml version='1.0' encoding='UTF-8'?&amp;gt;&lt;BR /&gt;&amp;lt;!DOCTYPE beans PUBLIC '-//SPRING//DTD BEAN//EN' '&lt;A href="http://www.springframework.org/dtd/spring-beans.dtd" rel="nofollow noopener noreferrer"&gt;http://www.springframework.org/dtd/spring-beans.dtd&lt;/A&gt;'&amp;gt;&lt;BR /&gt;&lt;BR /&gt;&amp;lt;beans&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;bean id="transformer.worker.ocr.tiff" class="org.alfresco.repo.content.transform.RuntimeExecutableContentTransformerWorker"&amp;gt;&lt;BR /&gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;property name="mimetypeService"&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;ref bean="mimetypeService" /&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;/property&amp;gt;&lt;BR /&gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;property name="checkCommand"&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;bean class="org.alfresco.util.exec.RuntimeExec"&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;property name="commandsAndArguments"&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;map&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;entry key=".*"&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;list&amp;gt;&lt;BR /&gt;&amp;lt;!–&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;value&amp;gt;tesseract&amp;lt;/value&amp;gt; –&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;value&amp;gt;/opt/alfresco/ocr&amp;lt;/value&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;/list&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;/entry&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;/map&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;/property&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;property name="errorCodes"&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;value&amp;gt;2&amp;lt;/value&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;/property&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;/bean&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;/property&amp;gt;&lt;BR /&gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;property name="transformCommand"&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;bean class="org.alfresco.util.exec.RuntimeExec"&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;property name="commandsAndArguments"&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;map&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;entry key=".*"&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;list&amp;gt;&lt;BR /&gt;&amp;lt;!–&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;value&amp;gt;tesseract&amp;lt;/value&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;value&amp;gt;${source}&amp;lt;/value&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;value&amp;gt;${target}&amp;lt;/value&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;value&amp;gt;-l&amp;lt;/value&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;value&amp;gt;spa&amp;lt;/value&amp;gt; –&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;value&amp;gt;/opt/alfresco/ocr&amp;lt;/value&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;value&amp;gt;${source}&amp;lt;/value&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;value&amp;gt;${target}&amp;lt;/value&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;/list&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;/entry&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;/map&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;/property&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;property name="errorCodes"&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;value&amp;gt;1,2&amp;lt;/value&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;/property&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;/bean&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;/property&amp;gt;&lt;BR /&gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;property name="explicitTransformations"&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;list&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;bean class="org.alfresco.repo.content.transform.ExplictTransformationDetails"&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;property name="sourceMimetype"&amp;gt;&amp;lt;value&amp;gt;image/tiff&amp;lt;/value&amp;gt;&amp;lt;/property&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;property name="targetMimetype"&amp;gt;&amp;lt;value&amp;gt;text/plain&amp;lt;/value&amp;gt;&amp;lt;/property&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;/bean&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;/list&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;/property&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;/bean&amp;gt;&lt;BR /&gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;bean id="transformer.ocr.tiff" class="org.alfresco.repo.content.transform.ProxyContentTransformer" parent="baseContentTransformer"&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;property name="worker"&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;ref bean="transformer.worker.ocr.tiff" /&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;/property&amp;gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;/bean&amp;gt;&lt;BR /&gt;&amp;lt;/beans&amp;gt;&lt;BR /&gt;&lt;SPAN class="line-numbers-rows"&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;/SPAN&gt;&lt;/CODE&gt;&lt;/PRE&gt;&lt;BR /&gt;&lt;SPAN&gt;Luego, un pequeño wrapper para efectuar todas las modificaciones del caso y que Tesseract no muera en el intento. En la raíz de donde tengan instalado Alfresco (en mi caso /opt/alfresco) crean un archivo con permisos de ejecución (755) llamado 'ocr' con el siguiente contenido:&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;PRE class="language-none line-numbers"&gt;&lt;CODE&gt;#!/bin/bash&lt;BR /&gt;# save arguments to variables&lt;BR /&gt;SOURCE=$1&lt;BR /&gt;TARGET=$2&lt;BR /&gt;TMPDIR=/tmp&lt;BR /&gt;FILENAME=`basename $SOURCE`&lt;BR /&gt;OCRFILE=$FILENAME.tif&lt;BR /&gt;&lt;BR /&gt;# to see what happens&lt;BR /&gt;#echo "from $SOURCE to $TARGET" &amp;gt;&amp;gt;/tmp/ocrtransform.log&lt;BR /&gt;&lt;BR /&gt;cp -f $SOURCE $TMPDIR/$OCRFILE&lt;BR /&gt;&lt;BR /&gt;# call tesseract and redirect output to $TARGET&lt;BR /&gt;tesseract $TMPDIR/$OCRFILE ${TARGET%\.*} -l spa&lt;BR /&gt;rm -f $TMPDIR/$OCRFILE&lt;BR /&gt;&lt;SPAN class="line-numbers-rows"&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;/SPAN&gt;&lt;/CODE&gt;&lt;/PRE&gt;&lt;BR /&gt;&lt;SPAN&gt;Si quieren sabér qué ocurre cuando Alfresco hace las transformaciones, descomenten la línea del log.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Ahora solo resta reiniciar Alfresco, y subir cualquier archivo .tif para que éste sea indexado correcta. Es super veloz amigos&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Cualquier duda comenten. Para los que más sepan, les agradeceré cualquier mejora en el script y transformer. Gracias&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Happy ocring &lt;span class="lia-unicode-emoji" title=":slightly_smiling_face:"&gt;🙂&lt;/span&gt;&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
    <pubDate>Sat, 30 Oct 2010 22:52:15 GMT</pubDate>
    <dc:creator>normando</dc:creator>
    <dc:date>2010-10-30T22:52:15Z</dc:date>
    <item>
      <title>Tesseract full integration</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172909#M126087</link>
      <description>Hola a todos. Espero que lo siguiente les sea útil a quiénes deseen realizar búsquedas de texto en documento escaneados TIF, y en linux.Antes debo hacer alguna aclaraciones.Tesseract 2.x NO funciona con archicos con extensión .tiff , sólo funciona con archivos .tif . La versión 3.0 sí lo hace. A con</description>
      <pubDate>Sat, 30 Oct 2010 22:52:15 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172909#M126087</guid>
      <dc:creator>normando</dc:creator>
      <dc:date>2010-10-30T22:52:15Z</dc:date>
    </item>
    <item>
      <title>Re: Tesseract full integration</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172910#M126088</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;He olvidado decir que mi versión de Alfresco es la 3.4a&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Sat, 30 Oct 2010 22:53:15 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172910#M126088</guid>
      <dc:creator>normando</dc:creator>
      <dc:date>2010-10-30T22:53:15Z</dc:date>
    </item>
    <item>
      <title>Re: Tesseract full integration</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172911#M126089</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Hola Normando:&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Te dejamos una pequeña evolución del script:&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;A href="http://blyx.com/2010/11/30/integracion-de-ocr-en-alfresco" rel="nofollow noopener noreferrer"&gt;http://blyx.com/2010/11/30/integracion-de-ocr-en-alfresco&lt;/A&gt;&lt;BR /&gt;&lt;A href="http://www.zylk.net/web/guest/web-2-0/blog/-/blogs/integracion-de-ocr-en-alfresco" rel="nofollow noopener noreferrer"&gt;http://www.zylk.net/web/guest/web-2-0/blog/-/blogs/integracion-de-ocr-en-alfresco&lt;/A&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Un saludo.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;–C.&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Tue, 30 Nov 2010 20:54:05 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172911#M126089</guid>
      <dc:creator>cesarista</dc:creator>
      <dc:date>2010-11-30T20:54:05Z</dc:date>
    </item>
    <item>
      <title>Re: Tesseract full integration</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172912#M126090</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Muchas gracias César. Muy bueno el artículo.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Sólo agregaría, que según mi experiencia, se pueden subir archivos tif comprimidos. Un archivo que normalmente pesa 2mb, comprimido es de 50kb (blanco y negro), y tesseract perfectamente hace su trabajo.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;No he probado aún tu script, pero me ha gustado mucho la "limpieza" que haces de los caracteres reconocidos.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Saludos&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Tue, 30 Nov 2010 21:26:45 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172912#M126090</guid>
      <dc:creator>normando</dc:creator>
      <dc:date>2010-11-30T21:26:45Z</dc:date>
    </item>
    <item>
      <title>Re: Tesseract full integration</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172913#M126091</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;César, he probado implementar todo, y no me ha funcionado. Por supuesto que he ajustado los paths, y verificado que todo funciona por separado.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Es decir, no obtengo ningún error en los logs. Y en el archivo /tmp/ocr.log esto:&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;/opt/alfresco/tomcat/temp/Alfresco/RuntimeExecutableContentTransformerWorker_source_7788580097067181368.tiff&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;No se mucho de python, pero tesseract está intentado efectuar el ocr en un archivo con extensión .tiff o .tif?&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Detalles del bug en tesseract 2.x:&lt;/SPAN&gt;&lt;BR /&gt;&lt;A href="http://code.google.com/p/tesseract-ocr/issues/detail?id=163" rel="nofollow noopener noreferrer"&gt;http://code.google.com/p/tesseract-ocr/issues/detail?id=163&lt;/A&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Gracias&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Tue, 30 Nov 2010 23:31:44 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172913#M126091</guid>
      <dc:creator>normando</dc:creator>
      <dc:date>2010-11-30T23:31:44Z</dc:date>
    </item>
    <item>
      <title>Re: Tesseract full integration</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172914#M126092</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Hola Normando:&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Te mando unos consejos para la puesta a punto:&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt; - Lo primero de todo ejecuta el script de python con tu archivo tif o tiff en una consola y comprueba que funciona el script y el propio tesseract.&lt;/SPAN&gt;&lt;BR /&gt;&lt;PRE class="language-none line-numbers"&gt;&lt;CODE&gt;&lt;BR /&gt;ocr-simple.py imagen.tif &lt;BR /&gt;&lt;SPAN class="line-numbers-rows"&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;/SPAN&gt;&lt;/CODE&gt;&lt;/PRE&gt;&lt;BR /&gt;&lt;SPAN&gt; - Verifica que el archivo de python tiene permisos de ejecución en $ALF_BIN (chmod +x&amp;nbsp; ocr-simple.py).&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt; - No se decirte tesseract (pon extension .tif mejor, lei lo del bug ese hace tiempo), pero alfresco aplica el transformador con un mimetype que se aplica tanto a archivos tif o tiff.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt; - Por ultimo, configura el log4j para ver las trazas de los transformadores (esto esta detallado en el artículo).&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Un saludo y me cuentas.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;–C.&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Wed, 01 Dec 2010 10:38:28 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172914#M126092</guid>
      <dc:creator>cesarista</dc:creator>
      <dc:date>2010-12-01T10:38:28Z</dc:date>
    </item>
    <item>
      <title>Re: Tesseract full integration</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172915#M126093</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Hola César&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Bueno, he probado el comando que me indicas y funciona correctamente, generando el archivo de texto resultante.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;PRE class="language-none line-numbers"&gt;&lt;CODE&gt;ocr-simple.py imagen.tif archivosalida&lt;SPAN class="line-numbers-rows"&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;/SPAN&gt;&lt;/CODE&gt;&lt;/PRE&gt;&lt;BR /&gt;&lt;SPAN&gt;He añadido al comando la opción español, porque en mi caso me reconoce más palabras:&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;PRE class="language-none line-numbers"&gt;&lt;CODE&gt;command = popen('/usr/bin/tesseract '+sys.argv[1]+' /tmp/tesser-$$ -l spa 2&amp;gt; /dev/null; cat /tmp/tesser-$$.txt')&lt;SPAN class="line-numbers-rows"&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;/SPAN&gt;&lt;/CODE&gt;&lt;/PRE&gt;&lt;BR /&gt;&lt;SPAN&gt;No me funciona con alfresco por que alfresco genera archivos .tiff aunque los que haya subido sean .tif, y ése es el argumento que le pasa al script, un archivo .tiff en lugar de .tif&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Es muy interesante la depuración que haces de palabras, aunque creo que está muy restrictivo, puesto que no devuelve palabras con acentos, y las que son mayúsculas directamente las amputa de la salida. Al menos en mi caso.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Seguiré trabajando para mejorar el primer script que permite utilizar archivos .itff que no los reconoce tesseract 2.x. Y voy a tomar las muy buenas ideas del tuyo, y lo publicaré cuando lo tenga bien afinado &lt;img id="smileyhappy" class="emoticon emoticon-smileyhappy" src="https://connect.hyland.com/i/smilies/16x16_smiley-happy.png" alt="Smiley Happy" title="Smiley Happy" /&gt;&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Gracias nuevamente por compartir conocimientos.&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Fri, 03 Dec 2010 05:20:44 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172915#M126093</guid>
      <dc:creator>normando</dc:creator>
      <dc:date>2010-12-03T05:20:44Z</dc:date>
    </item>
    <item>
      <title>Re: Tesseract full integration</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172916#M126094</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Hola Normando:&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;No entiendo porque dices que&amp;nbsp; "alfresco genera archivos .tiff".&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Alfresco entiende un archivo tif o tiff con un mimetype "image/tiff" (Alfresco 3.3 Community). Si subes un archivo con la extensión tif, la extensión en alfresco tambien es tif y el script y el transformador funcionan convenientemente. ¿Has comprobado que se ejecuta el transformador con el log4j?&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;BLOCKQUOTE class="jive-quote"&gt;No me funciona con alfresco por que alfresco genera archivos .tiff aunque los que haya subido sean .tif, y ése es el argumento que le pasa al script, un archivo .tiff en lugar de .tif&lt;/BLOCKQUOTE&gt;&lt;BR /&gt;&lt;SPAN&gt;Un saludo.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;–C.&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Fri, 03 Dec 2010 08:26:55 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172916#M126094</guid>
      <dc:creator>cesarista</dc:creator>
      <dc:date>2010-12-03T08:26:55Z</dc:date>
    </item>
    <item>
      <title>Re: Tesseract full integration</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172917#M126095</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Hola:&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Te dejo unas pruebas pero esta vez en Alfresco Share:&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;A href="http://www.zylk.net/web/guest/web-2-0/blog/-/blogs/integracion-ocr-en-alfresco-share" rel="nofollow noopener noreferrer"&gt;http://www.zylk.net/web/guest/web-2-0/blog/-/blogs/integracion-ocr-en-alfresco-share&lt;/A&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Un saludo.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;–C.&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Mon, 06 Dec 2010 16:23:57 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172917#M126095</guid>
      <dc:creator>cesarista</dc:creator>
      <dc:date>2010-12-06T16:23:57Z</dc:date>
    </item>
    <item>
      <title>Re: Tesseract full integration</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172918#M126096</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Hola, estoy intentando realizar la integración de alfresco y tesseract, tengo instalada la versión 3.4b, a partir de la versión 3.2 instalada como paquete en ubuntu 9.04. He probado el script ocr-simple.py desde la linea de comandos y funciona correctamente, pero no consigo que funcione desde alfresco. Al tener alfresco instalado sobre tomcat no se en que ruta colocar el script. Aquí pongo la salida de alfresco.log.&lt;/SPAN&gt;&lt;BR /&gt;&lt;PRE class="language-none line-numbers"&gt;&lt;CODE&gt;14:50:55,459 INFO&amp;nbsp; [org.alfresco.config.JndiPropertiesFactoryBean] Loading properties file from class path resource [alfresco/repository.properties]&lt;BR /&gt;14:50:55,465 INFO&amp;nbsp; [org.alfresco.config.JndiPropertiesFactoryBean] Loading properties file from class path resource [alfresco/domain/transaction.properties]&lt;BR /&gt;14:50:55,478 INFO&amp;nbsp; [org.alfresco.config.JndiPropertiesFactoryBean] Loading properties file from file [/var/lib/tomcat6/webapps/alfresco/WEB-INF/classes/alfresco/module/test/alfresco-global.properties]&lt;BR /&gt;14:50:55,485 INFO&amp;nbsp; [org.alfresco.config.JndiPropertiesFactoryBean] Loading properties file from URL [file:/usr/share/tomcat6/shared/classes/alfresco-global.properties]&lt;BR /&gt;14:50:55,603 INFO&amp;nbsp; [org.alfresco.config.JndiPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/alfresco-shared.properties]&lt;BR /&gt;14:50:55,739 INFO&amp;nbsp; [org.alfresco.config.FixedPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/version.properties]&lt;BR /&gt;14:50:55,773 INFO&amp;nbsp; [org.alfresco.config.FixedPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/domain/cache-strategies.properties]&lt;BR /&gt;14:51:09,257 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Registered general transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformer: ProxyContentTransformer[ average=0ms]&lt;BR /&gt;14:51:13,206 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Registered general transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformer: StringExtractingContentTransformer[ average=0ms]&lt;BR /&gt;14:51:13,212 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Registered general transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformer: BinaryPassThroughContentTransformer[ average=0ms]&lt;BR /&gt;14:51:13,224 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Registered general transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformer: PdfBoxContentTransformer[ average=0ms]&lt;BR /&gt;14:51:13,232 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Registered general transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformer: FailoverContentTransformer[ average=0ms]&lt;BR /&gt;14:51:13,241 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Registered general transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformer: ComplexContentTransformer[ average=0ms]&lt;BR /&gt;14:51:13,242 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Registered general transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformer: ProxyContentTransformer[ average=0ms]&lt;BR /&gt;14:51:13,242 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Registered general transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformer: ComplexContentTransformer[ average=0ms]&lt;BR /&gt;14:51:13,515 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Registered general transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformer: TextToPdfContentTransformer[ average=0ms]&lt;BR /&gt;14:51:13,518 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Registered general transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformer: ComplexContentTransformer[ average=0ms]&lt;BR /&gt;14:51:13,588 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Registered general transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformer: TikaAutoContentTransformer[ average=0ms]&lt;BR /&gt;14:51:13,595 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Registered general transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformer: PoiHssfContentTransformer[ average=0ms]&lt;BR /&gt;14:51:13,602 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Registered general transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformer: PoiContentTransformer[ average=0ms]&lt;BR /&gt;14:51:13,609 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Registered general transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformer: PoiOOXMLContentTransformer[ average=0ms]&lt;BR /&gt;14:51:13,623 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Registered general transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformer: TextMiningContentTransformer[ average=0ms]&lt;BR /&gt;14:51:13,630 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Registered general transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformer: HtmlParserContentTransformer[ average=0ms]&lt;BR /&gt;14:51:13,636 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Registered general transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformer: MediaWikiContentTransformer[ average=0ms]&lt;BR /&gt;14:51:13,637 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Registered general transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformer: ComplexContentTransformer[ average=0ms]&lt;BR /&gt;14:51:13,643 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Registered general transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformer: MailContentTransformer[ average=0ms]&lt;BR /&gt;14:51:13,671 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Registered general transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformer: EMLTransformer[ average=0ms]&lt;BR /&gt;14:51:13,679 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Registered general transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformer: ArchiveContentTransformer[ average=0ms]&lt;BR /&gt;14:51:15,785 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Registered general transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformer: ProxyContentTransformer[ average=0ms]&lt;BR /&gt;14:51:15,786 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Registered general transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformer: ComplexContentTransformer[ average=0ms]&lt;BR /&gt;14:51:15,787 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Registered general transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformer: ComplexContentTransformer[ average=0ms]&lt;BR /&gt;14:51:15,787 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Registered general transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformer: ComplexContentTransformer[ average=0ms]&lt;BR /&gt;14:51:17,538 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Registered general transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformer: ProxyContentTransformer[ average=0ms]&lt;BR /&gt;14:51:17,597 INFO&amp;nbsp; [org.springframework.extensions.webscripts.TemplateProcessorRegistry] Registered template processor Repository Template Processor for extension ftl&lt;BR /&gt;14:51:17,601 INFO&amp;nbsp; [org.springframework.extensions.webscripts.ScriptProcessorRegistry] Registered script processor Repository Script Processor for extension js&lt;BR /&gt;14:51:27,254 INFO&amp;nbsp; [org.alfresco.repo.domain.schema.SchemaBootstrap] Esquema gestionado por el gestor de base de datos org.hibernate.dialect.MySQLInnoDBDialect.&lt;BR /&gt;14:51:27,695 INFO&amp;nbsp; [org.alfresco.repo.domain.schema.SchemaBootstrap] No se hicieron cambios en el esquema.&lt;BR /&gt;14:51:27,765 INFO&amp;nbsp; [org.alfresco.repo.management.subsystems.ChildApplicationContextFactory] Starting 'sysAdmin' subsystem, ID: [sysAdmin, default]&lt;BR /&gt;14:51:27,780 INFO&amp;nbsp; [org.alfresco.config.FixedPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/version.properties]&lt;BR /&gt;14:51:27,781 INFO&amp;nbsp; [org.alfresco.config.JndiPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/alfresco-shared.properties]&lt;BR /&gt;14:51:27,782 INFO&amp;nbsp; [org.alfresco.config.FixedPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/domain/cache-strategies.properties]&lt;BR /&gt;14:51:27,794 INFO&amp;nbsp; [org.alfresco.repo.management.subsystems.ChildApplicationContextFactory] Startup of 'sysAdmin' subsystem, ID: [sysAdmin, default] complete&lt;BR /&gt;14:51:30,802 INFO&amp;nbsp; [org.alfresco.repo.management.subsystems.ChildApplicationContextFactory] Starting 'thirdparty' subsystem, ID: [thirdparty, default]&lt;BR /&gt;14:51:30,861 INFO&amp;nbsp; [org.alfresco.config.FixedPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/version.properties]&lt;BR /&gt;14:51:30,862 INFO&amp;nbsp; [org.alfresco.config.JndiPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/alfresco-shared.properties]&lt;BR /&gt;14:51:30,864 INFO&amp;nbsp; [org.alfresco.config.FixedPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/domain/cache-strategies.properties]&lt;BR /&gt;14:51:30,870 WARN&amp;nbsp; [org.alfresco.util.exec.RuntimeExec] The bean RuntimeExec property 'commandMap' has been deprecated; use 'commandsAndArguments' instead.&amp;nbsp; See &lt;A href="https://issues.alfresco.com/jira/browse/ETHREEOH-579" rel="nofollow noopener noreferrer"&gt;https://issues.alfresco.com/jira/browse/ETHREEOH-579&lt;/A&gt;.&lt;BR /&gt;14:51:30,872 WARN&amp;nbsp; [org.alfresco.util.exec.RuntimeExec] The bean RuntimeExec property 'commandMap' has been deprecated; use 'commandsAndArguments' instead.&amp;nbsp; See &lt;A href="https://issues.alfresco.com/jira/browse/ETHREEOH-579" rel="nofollow noopener noreferrer"&gt;https://issues.alfresco.com/jira/browse/ETHREEOH-579&lt;/A&gt;.&lt;BR /&gt;14:51:31,177 DEBUG [org.alfresco.util.exec.RuntimeExec] Execution result: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; os:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; Linux&lt;BR /&gt;&amp;nbsp;&amp;nbsp; command:&amp;nbsp;&amp;nbsp;&amp;nbsp; [/usr/bin/alfresco-pdf2swf, -V]&lt;BR /&gt;&amp;nbsp;&amp;nbsp; succeeded:&amp;nbsp; true&lt;BR /&gt;&amp;nbsp;&amp;nbsp; exit code:&amp;nbsp; 0&lt;BR /&gt;&amp;nbsp;&amp;nbsp; out:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; pdf2swf - part of swftools 2009-03-15-1014&lt;BR /&gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp; err:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;BR /&gt;14:51:31,680 DEBUG [org.alfresco.util.exec.RuntimeExec] Execution result: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; os:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; Linux&lt;BR /&gt;&amp;nbsp;&amp;nbsp; command:&amp;nbsp;&amp;nbsp;&amp;nbsp; [/usr/bin/convert, /tmp/tomcat6-temp/Alfresco/ImageMagickContentTransformerWorker_init_source_1247669936733175951.gif[0], /tmp/tomcat6-temp/Alfresco/ImageMagickContentTransformerWorker_init_target_7357412200573451800.png]&lt;BR /&gt;&amp;nbsp;&amp;nbsp; succeeded:&amp;nbsp; true&lt;BR /&gt;&amp;nbsp;&amp;nbsp; exit code:&amp;nbsp; 0&lt;BR /&gt;&amp;nbsp;&amp;nbsp; out:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;BR /&gt;&amp;nbsp;&amp;nbsp; err:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;BR /&gt;14:51:31,810 DEBUG [org.alfresco.util.exec.RuntimeExec] Execution result: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; os:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; Linux&lt;BR /&gt;&amp;nbsp;&amp;nbsp; command:&amp;nbsp;&amp;nbsp;&amp;nbsp; [/usr/bin/convert, -version]&lt;BR /&gt;&amp;nbsp;&amp;nbsp; succeeded:&amp;nbsp; false&lt;BR /&gt;&amp;nbsp;&amp;nbsp; exit code:&amp;nbsp; 1&lt;BR /&gt;&amp;nbsp;&amp;nbsp; out:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; Version: ImageMagick 6.4.5 2009-06-04 Q16 OpenMP &lt;A href="http://www.imagemagick.org" rel="nofollow noopener noreferrer"&gt;http://www.imagemagick.org&lt;/A&gt;&lt;BR /&gt;Copyright: Copyright (C) 1999-2008 ImageMagick Studio LLC&lt;BR /&gt;&lt;BR /&gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp; err:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;BR /&gt;14:51:31,816 INFO&amp;nbsp; [org.alfresco.repo.management.subsystems.ChildApplicationContextFactory] Startup of 'thirdparty' subsystem, ID: [thirdparty, default] complete&lt;BR /&gt;14:51:31,816 INFO&amp;nbsp; [org.alfresco.repo.management.subsystems.ChildApplicationContextFactory] Starting 'OOoDirect' subsystem, ID: [OOoDirect, default]&lt;BR /&gt;14:51:31,854 INFO&amp;nbsp; [org.alfresco.config.FixedPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/version.properties]&lt;BR /&gt;14:51:31,855 INFO&amp;nbsp; [org.alfresco.config.JndiPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/alfresco-shared.properties]&lt;BR /&gt;14:51:31,855 INFO&amp;nbsp; [org.alfresco.config.FixedPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/domain/cache-strategies.properties]&lt;BR /&gt;14:51:32,308 DEBUG [org.alfresco.util.exec.RuntimeExec] Execution result: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; os:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; Linux&lt;BR /&gt;&amp;nbsp;&amp;nbsp; command:&amp;nbsp;&amp;nbsp;&amp;nbsp; [/usr/bin/soffice, -accept=socket,host=127.0.0.1,port=8100;urp;StarOffice.ServiceManager, -headless, -norestore]&lt;BR /&gt;&amp;nbsp;&amp;nbsp; succeeded:&amp;nbsp; true&lt;BR /&gt;&amp;nbsp;&amp;nbsp; exit code:&amp;nbsp; 0&lt;BR /&gt;&amp;nbsp;&amp;nbsp; out:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;BR /&gt;&amp;nbsp;&amp;nbsp; err:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;BR /&gt;14:51:32,481 WARN&amp;nbsp; [org.alfresco.util.OpenOfficeConnectionTester] No se pudo establecer la conexión a OpenOffice&lt;BR /&gt;14:51:32,497 INFO&amp;nbsp; [org.alfresco.repo.management.subsystems.ChildApplicationContextFactory] Startup of 'OOoDirect' subsystem, ID: [OOoDirect, default] complete&lt;BR /&gt;14:51:34,976 INFO&amp;nbsp; [org.alfresco.repo.admin.ConfigurationChecker] El directorio raíz de Alfresco ('dir.root') es: /var/lib/alfresco&lt;BR /&gt;14:51:35,414 INFO&amp;nbsp; [org.alfresco.repo.admin.patch.PatchExecuter] Comprobando si hay parches para aplicar …&lt;BR /&gt;14:51:36,256 INFO&amp;nbsp; [org.alfresco.repo.admin.patch.PatchExecuter] No se requieren parches.&lt;BR /&gt;14:51:36,271 INFO&amp;nbsp; [org.alfresco.repo.module.ModuleServiceImpl] Encontrado(s) 0 módulo(s).&lt;BR /&gt;14:51:36,351 INFO&amp;nbsp; [org.alfresco.repo.management.subsystems.ChildApplicationContextFactory] Starting 'fileServers' subsystem, ID: [fileServers, default]&lt;BR /&gt;14:51:36,419 INFO&amp;nbsp; [org.alfresco.config.FixedPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/version.properties]&lt;BR /&gt;14:51:36,421 INFO&amp;nbsp; [org.alfresco.config.JndiPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/alfresco-shared.properties]&lt;BR /&gt;14:51:36,426 INFO&amp;nbsp; [org.alfresco.config.FixedPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/domain/cache-strategies.properties]&lt;BR /&gt;14:51:36,824 INFO&amp;nbsp; [org.alfresco.repo.management.subsystems.ChildApplicationContextFactory] Starting 'Authentication' subsystem, ID: [Authentication, managed, passthru1]&lt;BR /&gt;14:51:36,845 INFO&amp;nbsp; [org.alfresco.config.FixedPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/version.properties]&lt;BR /&gt;14:51:36,848 INFO&amp;nbsp; [org.alfresco.config.JndiPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/alfresco-shared.properties]&lt;BR /&gt;14:51:36,848 INFO&amp;nbsp; [org.alfresco.config.FixedPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/domain/cache-strategies.properties]&lt;BR /&gt;14:51:48,505 INFO&amp;nbsp; [org.alfresco.repo.management.subsystems.ChildApplicationContextFactory] Startup of 'Authentication' subsystem, ID: [Authentication, managed, passthru1] complete&lt;BR /&gt;14:51:48,506 INFO&amp;nbsp; [org.alfresco.repo.management.subsystems.ChildApplicationContextFactory] Starting 'Authentication' subsystem, ID: [Authentication, managed, ldap-ad1]&lt;BR /&gt;14:51:48,528 INFO&amp;nbsp; [org.alfresco.config.FixedPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/version.properties]&lt;BR /&gt;14:51:48,529 INFO&amp;nbsp; [org.alfresco.config.JndiPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/alfresco-shared.properties]&lt;BR /&gt;14:51:48,530 INFO&amp;nbsp; [org.alfresco.config.FixedPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/domain/cache-strategies.properties]&lt;BR /&gt;14:51:48,950 INFO&amp;nbsp; [org.alfresco.repo.management.subsystems.ChildApplicationContextFactory] Startup of 'Authentication' subsystem, ID: [Authentication, managed, ldap-ad1] complete&lt;BR /&gt;14:51:53,956 ERROR [org.alfresco.fileserver] Failed to get local domain/workgroup name, using default of WORKGROUP&lt;BR /&gt;14:51:53,957 ERROR [org.alfresco.fileserver] (This may be due to firewall settings or incorrect &amp;lt;broadcast&amp;gt; setting)&lt;BR /&gt;14:51:54,085 ERROR [org.alfresco.fileserver] [FTP] FTP Socket error : java.net.BindException: Permission denied&lt;BR /&gt;14:51:54,095 ERROR [org.alfresco.fileserver] java.net.BindException: Permission denied&lt;BR /&gt;java.net.BindException: Permission denied&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;at java.net.PlainSocketImpl.socketBind(Native Method)&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;at java.net.PlainSocketImpl.bind(PlainSocketImpl.java:365)&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;at java.net.ServerSocket.bind(ServerSocket.java:319)&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;at java.net.ServerSocket.&amp;lt;init&amp;gt;(ServerSocket.java:185)&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;at java.net.ServerSocket.&amp;lt;init&amp;gt;(ServerSocket.java:141)&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;at org.alfresco.jlan.ftp.FTPServer.run(FTPServer.java:555)&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;at java.lang.Thread.run(Thread.java:662)&lt;BR /&gt;14:51:54,093 INFO&amp;nbsp; [org.alfresco.repo.management.subsystems.ChildApplicationContextFactory] Startup of 'fileServers' subsystem, ID: [fileServers, default] complete&lt;BR /&gt;14:51:54,098 INFO&amp;nbsp; [org.alfresco.repo.management.subsystems.ChildApplicationContextFactory] Starting 'imap' subsystem, ID: [imap, default]&lt;BR /&gt;14:51:54,132 INFO&amp;nbsp; [org.alfresco.config.FixedPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/version.properties]&lt;BR /&gt;14:51:54,132 INFO&amp;nbsp; [org.alfresco.config.JndiPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/alfresco-shared.properties]&lt;BR /&gt;14:51:54,133 INFO&amp;nbsp; [org.alfresco.config.FixedPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/domain/cache-strategies.properties]&lt;BR /&gt;14:51:54,201 INFO&amp;nbsp; [org.alfresco.repo.management.subsystems.ChildApplicationContextFactory] Startup of 'imap' subsystem, ID: [imap, default] complete&lt;BR /&gt;14:51:54,201 INFO&amp;nbsp; [org.alfresco.repo.management.subsystems.ChildApplicationContextFactory] Starting 'email' subsystem, ID: [email, outbound]&lt;BR /&gt;14:51:54,216 INFO&amp;nbsp; [org.alfresco.config.FixedPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/version.properties]&lt;BR /&gt;14:51:54,217 INFO&amp;nbsp; [org.alfresco.config.JndiPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/alfresco-shared.properties]&lt;BR /&gt;14:51:54,218 INFO&amp;nbsp; [org.alfresco.config.FixedPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/domain/cache-strategies.properties]&lt;BR /&gt;14:51:54,292 INFO&amp;nbsp; [org.alfresco.repo.management.subsystems.ChildApplicationContextFactory] Startup of 'email' subsystem, ID: [email, outbound] complete&lt;BR /&gt;14:51:54,293 INFO&amp;nbsp; [org.alfresco.repo.management.subsystems.ChildApplicationContextFactory] Starting 'email' subsystem, ID: [email, inbound]&lt;BR /&gt;14:51:54,307 INFO&amp;nbsp; [org.alfresco.config.FixedPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/version.properties]&lt;BR /&gt;14:51:54,307 INFO&amp;nbsp; [org.alfresco.config.JndiPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/alfresco-shared.properties]&lt;BR /&gt;14:51:54,308 INFO&amp;nbsp; [org.alfresco.config.FixedPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/domain/cache-strategies.properties]&lt;BR /&gt;14:51:54,375 WARN&amp;nbsp; [org.springframework.beans.GenericTypeAwarePropertyDescriptor] Invalid JavaBean property 'blockedSenders' being accessed! Ambiguous write methods found next to actually used [public void org.alfresco.email.server.EmailServer.setBlockedSenders(java.util.List)]: [public void org.alfresco.email.server.EmailServer.setBlockedSenders(java.lang.String)]&lt;BR /&gt;14:51:54,375 WARN&amp;nbsp; [org.springframework.beans.GenericTypeAwarePropertyDescriptor] Invalid JavaBean property 'allowedSenders' being accessed! Ambiguous write methods found next to actually used [public void org.alfresco.email.server.EmailServer.setAllowedSenders(java.util.List)]: [public void org.alfresco.email.server.EmailServer.setAllowedSenders(java.lang.String)]&lt;BR /&gt;14:51:54,440 INFO&amp;nbsp; [org.alfresco.repo.management.subsystems.ChildApplicationContextFactory] Startup of 'email' subsystem, ID: [email, inbound] complete&lt;BR /&gt;14:51:54,441 INFO&amp;nbsp; [org.alfresco.repo.management.subsystems.ChildApplicationContextFactory] Starting 'googledocs' subsystem, ID: [googledocs, default]&lt;BR /&gt;14:51:54,482 INFO&amp;nbsp; [org.alfresco.config.FixedPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/version.properties]&lt;BR /&gt;14:51:54,483 INFO&amp;nbsp; [org.alfresco.config.JndiPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/alfresco-shared.properties]&lt;BR /&gt;14:51:54,484 INFO&amp;nbsp; [org.alfresco.config.FixedPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/domain/cache-strategies.properties]&lt;BR /&gt;14:51:54,838 INFO&amp;nbsp; [org.alfresco.repo.management.subsystems.ChildApplicationContextFactory] Startup of 'googledocs' subsystem, ID: [googledocs, default] complete&lt;BR /&gt;14:51:54,863 INFO&amp;nbsp; [org.alfresco.repo.usage.UserUsageTrackingComponent] Enabled - calculate missing user usages …&lt;BR /&gt;14:51:54,878 INFO&amp;nbsp; [org.alfresco.repo.usage.UserUsageTrackingComponent] Found 0 users to recalculate&lt;BR /&gt;14:51:54,878 INFO&amp;nbsp; [org.alfresco.repo.usage.UserUsageTrackingComponent] … calculated missing usages for 0 users&lt;BR /&gt;14:51:54,878 INFO&amp;nbsp; [org.alfresco.repo.management.subsystems.ChildApplicationContextFactory] Starting 'Synchronization' subsystem, ID: [Synchronization, default]&lt;BR /&gt;14:51:54,893 INFO&amp;nbsp; [org.alfresco.config.FixedPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/version.properties]&lt;BR /&gt;14:51:54,894 INFO&amp;nbsp; [org.alfresco.config.JndiPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/alfresco-shared.properties]&lt;BR /&gt;14:51:54,894 INFO&amp;nbsp; [org.alfresco.config.FixedPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/domain/cache-strategies.properties]&lt;BR /&gt;14:51:54,934 INFO&amp;nbsp; [org.alfresco.repo.security.sync.ChainingUserRegistrySynchronizer] Synchronizing users and groups with user registry 'ldap-ad1'&lt;BR /&gt;14:51:54,967 INFO&amp;nbsp; [org.alfresco.repo.security.sync.ChainingUserRegistrySynchronizer] Retrieving groups changed since 14-dic-2010 14:56:54 from user registry 'ldap-ad1'&lt;BR /&gt;14:51:54,995 DEBUG [org.alfresco.repo.security.sync.ldap.LDAPUserRegistry] Found 0&lt;BR /&gt;14:51:55,008 INFO&amp;nbsp; [org.alfresco.repo.security.sync.ChainingUserRegistrySynchronizer] ldap-ad1 Group Analysis: Commencing batch of 0 entries&lt;BR /&gt;14:51:55,011 INFO&amp;nbsp; [org.alfresco.repo.security.sync.ChainingUserRegistrySynchronizer] ldap-ad1 Group Analysis: Completed batch of 0 entries&lt;BR /&gt;14:51:55,028 INFO&amp;nbsp; [org.alfresco.repo.security.sync.ChainingUserRegistrySynchronizer] Retrieving users changed since 14-dic-2010 14:56:01 from user registry 'ldap-ad1'&lt;BR /&gt;14:51:55,038 INFO&amp;nbsp; [org.alfresco.repo.security.sync.ChainingUserRegistrySynchronizer] ldap-ad1 User Creation and Association: Commencing batch of 0 entries&lt;BR /&gt;14:51:55,039 INFO&amp;nbsp; [org.alfresco.repo.security.sync.ChainingUserRegistrySynchronizer] ldap-ad1 User Creation and Association: Completed batch of 0 entries&lt;BR /&gt;14:51:55,094 INFO&amp;nbsp; [org.alfresco.repo.security.sync.ChainingUserRegistrySynchronizer] Finished synchronizing users and groups with user registry 'ldap-ad1'&lt;BR /&gt;14:51:55,094 INFO&amp;nbsp; [org.alfresco.repo.security.sync.ChainingUserRegistrySynchronizer] 0 user(s) and 0 group(s) processed&lt;BR /&gt;14:51:55,107 INFO&amp;nbsp; [org.alfresco.repo.management.subsystems.ChildApplicationContextFactory] Startup of 'Synchronization' subsystem, ID: [Synchronization, default] complete&lt;BR /&gt;14:51:55,181 INFO&amp;nbsp; [org.alfresco.service.descriptor.DescriptorService] Alfresco JVM - v1.6.0_22-b04; maximum heap size 989,875MB&lt;BR /&gt;14:51:55,182 INFO&amp;nbsp; [org.alfresco.service.descriptor.DescriptorService] Alfresco started (Community): Current version 3.4.0 (b 3262) schema 4111 - Originally installed version 3.2.0 (@build-number@) schema 2019&lt;BR /&gt;14:51:55,183 INFO&amp;nbsp; [org.alfresco.repo.management.subsystems.ChildApplicationContextFactory] Starting 'Replication' subsystem, ID: [Replication, default]&lt;BR /&gt;14:51:55,196 INFO&amp;nbsp; [org.alfresco.config.FixedPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/version.properties]&lt;BR /&gt;14:51:55,197 INFO&amp;nbsp; [org.alfresco.config.JndiPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/alfresco-shared.properties]&lt;BR /&gt;14:51:55,197 INFO&amp;nbsp; [org.alfresco.config.FixedPropertyPlaceholderConfigurer] Loading properties file from class path resource [alfresco/domain/cache-strategies.properties]&lt;BR /&gt;14:51:55,206 INFO&amp;nbsp; [org.alfresco.repo.management.subsystems.ChildApplicationContextFactory] Startup of 'Replication' subsystem, ID: [Replication, default] complete&lt;BR /&gt;14:52:07,756 INFO&amp;nbsp; [org.springframework.extensions.webscripts.DeclarativeRegistry] Registered 371 Web Scripts (+0 failed), 612 URLs&lt;BR /&gt;14:52:07,757 INFO&amp;nbsp; [org.springframework.extensions.webscripts.DeclarativeRegistry] Registered 2 Package Description Documents (+0 failed) &lt;BR /&gt;14:52:07,757 INFO&amp;nbsp; [org.springframework.extensions.webscripts.DeclarativeRegistry] Registered 1 Schema Description Documents (+0 failed) &lt;BR /&gt;14:52:07,759 INFO&amp;nbsp; [org.springframework.extensions.webscripts.AbstractRuntimeContainer] Initialised Repository Web Script Container (in 11349.13ms)&lt;BR /&gt;14:52:07,761 INFO&amp;nbsp; [org.springframework.extensions.webscripts.TemplateProcessorRegistry] Registered template processor freemarker for extension ftl&lt;BR /&gt;14:52:07,762 INFO&amp;nbsp; [org.springframework.extensions.webscripts.ScriptProcessorRegistry] Registered script processor javascript for extension js&lt;BR /&gt;14:52:18,642 INFO&amp;nbsp; [org.springframework.extensions.webscripts.DeclarativeRegistry] Registered 257 Web Scripts (+0 failed), 265 URLs&lt;BR /&gt;14:52:18,645 INFO&amp;nbsp; [org.springframework.extensions.webscripts.DeclarativeRegistry] Registered 8 Package Description Documents (+0 failed) &lt;BR /&gt;14:52:18,645 INFO&amp;nbsp; [org.springframework.extensions.webscripts.DeclarativeRegistry] Registered 0 Schema Description Documents (+0 failed) &lt;BR /&gt;14:52:18,796 INFO&amp;nbsp; [org.springframework.extensions.webscripts.AbstractRuntimeContainer] Initialised Spring Surf Container Web Script Container (in 2657.7637ms)&lt;BR /&gt;14:52:18,879 INFO&amp;nbsp; [org.springframework.extensions.webscripts.TemplateProcessorRegistry] Registered template processor freemarker for extension ftl&lt;BR /&gt;14:52:19,037 INFO&amp;nbsp; [org.springframework.extensions.webscripts.ScriptProcessorRegistry] Registered script processor javascript for extension js&lt;BR /&gt;14:52:19,164 INFO&amp;nbsp; [org.springframework.extensions.webscripts.TemplateProcessorRegistry] Registered template processor freemarker for extension ftl&lt;BR /&gt;14:52:19,170 INFO&amp;nbsp; [org.springframework.extensions.webscripts.ScriptProcessorRegistry] Registered script processor javascript for extension js&lt;BR /&gt;14:52:19,336 INFO&amp;nbsp; [org.springframework.extensions.webscripts.TemplateProcessorRegistry] Registered template processor freemarker for extension ftl&lt;BR /&gt;14:52:19,342 INFO&amp;nbsp; [org.springframework.extensions.webscripts.ScriptProcessorRegistry] Registered script processor javascript for extension js&lt;BR /&gt;14:57:13,230 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Searched for transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; source mimetype: image/tiff&lt;BR /&gt;&amp;nbsp;&amp;nbsp; target mimetype: text/plain&lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformers: [ProxyContentTransformer[ average=0ms]]&lt;BR /&gt;14:57:13,685 DEBUG [org.alfresco.util.exec.RuntimeExec] Execution result: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; os:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; Linux&lt;BR /&gt;&amp;nbsp;&amp;nbsp; command:&amp;nbsp;&amp;nbsp;&amp;nbsp; [/usr/bin/python, /home/urbano/Escritorio/ocr-simple.py, /tmp/tomcat6-temp/Alfresco/RuntimeExecutableContentTransformerWorker_source_1870219105233062900.tiff, /tmp/tomcat6-temp/Alfresco/RuntimeExecutableContentTransformerWorker_target_3626504261222258866.txt]&lt;BR /&gt;&amp;nbsp;&amp;nbsp; succeeded:&amp;nbsp; true&lt;BR /&gt;&amp;nbsp;&amp;nbsp; exit code:&amp;nbsp; 0&lt;BR /&gt;&amp;nbsp;&amp;nbsp; out:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;BR /&gt;&amp;nbsp;&amp;nbsp; err:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; cat: /tmp/tesser-6386.txt: No existe el fichero ó directorio&lt;BR /&gt;&lt;BR /&gt;14:57:16,909 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Searched for transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; source mimetype: image/tiff&lt;BR /&gt;&amp;nbsp;&amp;nbsp; target mimetype: text/plain&lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformers: [ProxyContentTransformer[ average=455ms]]&lt;BR /&gt;14:58:15,077 DEBUG [org.alfresco.repo.content.transform.ContentTransformerRegistry] Searched for transformer: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; source mimetype: image/tiff&lt;BR /&gt;&amp;nbsp;&amp;nbsp; target mimetype: text/plain&lt;BR /&gt;&amp;nbsp;&amp;nbsp; transformers: [ProxyContentTransformer[ average=455ms]]&lt;BR /&gt;14:58:15,377 DEBUG [org.alfresco.util.exec.RuntimeExec] Execution result: &lt;BR /&gt;&amp;nbsp;&amp;nbsp; os:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; Linux&lt;BR /&gt;&amp;nbsp;&amp;nbsp; command:&amp;nbsp;&amp;nbsp;&amp;nbsp; [/usr/bin/python, /home/urbano/Escritorio/ocr-simple.py, /tmp/tomcat6-temp/Alfresco/RuntimeExecutableContentTransformerWorker_source_4665339913640775042.tiff, /tmp/tomcat6-temp/Alfresco/RuntimeExecutableContentTransformerWorker_target_4203595087035328580.txt]&lt;BR /&gt;&amp;nbsp;&amp;nbsp; succeeded:&amp;nbsp; true&lt;BR /&gt;&amp;nbsp;&amp;nbsp; exit code:&amp;nbsp; 0&lt;BR /&gt;&amp;nbsp;&amp;nbsp; out:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;BR /&gt;&amp;nbsp;&amp;nbsp; err:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; cat: /tmp/tesser-6399.txt: No existe el fichero ó directorio&lt;BR /&gt;&lt;SPAN class="line-numbers-rows"&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;/SPAN&gt;&lt;/CODE&gt;&lt;/PRE&gt;&lt;SPAN&gt;Espero vuestra ayuda. Gracias de antemano&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;Urbano.&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Mon, 20 Dec 2010 14:15:06 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172918#M126096</guid>
      <dc:creator>urban</dc:creator>
      <dc:date>2010-12-20T14:15:06Z</dc:date>
    </item>
    <item>
      <title>Re: Tesseract full integration</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172919#M126097</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Hola Urbano:&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;El script se ejecuta según el log en /home/urbano/Escritorio/ocr-simple.py, y por el error parece que no genera el archivo /tmp/tesser-6399.txt donde el numero es el proceso del shell script que se ejecuta en el comando popen de python. Ten en cuenta, que tesseract esta en /usr/bin/tesseract&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Si me dices que te funciona el script en una terminal me descolocas un poco, porque hay dos posibles fuentes de error, o el comando tesseract no funciona correctamente (por ejemplo, las rutas no estan bien o no estan el path) y no da resultados en la salida estándar de modo que no se redirecciona al archivo temporal, o bien hay un problema de permisos. Y por lo que dices y veo, descarto el problema de permisos ya que el usuario que utilizas es tu usuario sin privilegios urbano, tanto en la terminal como en el proceso java de alfresco (por eso te da errores en el log con el ftp y con el cifs, porque no puedes abrir esos puertos sin privilegios) .&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Por otro lado, el path del script de python se declara en el transformador (yo lo he puesto en /opt/alfresco/bin/). Pon el resultado que te da el script ocr-python.py en la terminal al aplicarlo sobre la imagen y lo miramos.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Un saludo.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;–C.&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Mon, 20 Dec 2010 14:46:21 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172919#M126097</guid>
      <dc:creator>cesarista</dc:creator>
      <dc:date>2010-12-20T14:46:21Z</dc:date>
    </item>
    <item>
      <title>Re: Tesseract full integration</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172920#M126098</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Por cierto:&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Sin relación con el problema anterior os dejo un enlace con otros aspectos sobre la integración de tesseract con Alfresco.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;A href="http://tpeelen.wordpress.com/2010/12/17/alfresco-using-tesseract-ocr-on-ubuntu-linux/" rel="nofollow noopener noreferrer"&gt;http://tpeelen.wordpress.com/2010/12/17/alfresco-using-tesseract-ocr-on-ubuntu-linux/&lt;/A&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Un saludo.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;–C.&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Mon, 20 Dec 2010 14:49:05 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172920#M126098</guid>
      <dc:creator>cesarista</dc:creator>
      <dc:date>2010-12-20T14:49:05Z</dc:date>
    </item>
    <item>
      <title>Re: Tesseract full integration</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172921#M126099</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;BLOCKQUOTE class="jive-quote"&gt;Hola Urbano:&lt;BR /&gt;&lt;BR /&gt;El script se ejecuta según el log en /home/urbano/Escritorio/ocr-simple.py, y por el error parece que no genera el archivo /tmp/tesser-6399.txt donde el numero es el proceso del shell script que se ejecuta en el comando popen de python. Ten en cuenta, que tesseract esta en /usr/bin/tesseract&lt;BR /&gt;&lt;BR /&gt;Si me dices que te funciona el script en una terminal me descolocas un poco, porque hay dos posibles fuentes de error, o el comando tesseract no funciona correctamente (por ejemplo, las rutas no estan bien o no estan el path) y no da resultados en la salida estándar de modo que no se redirecciona al archivo temporal, o bien hay un problema de permisos. Y por lo que dices y veo, descarto el problema de permisos ya que el usuario que utilizas es tu usuario sin privilegios urbano, tanto en la terminal como en el proceso java de alfresco (por eso te da errores en el log con el ftp y con el cifs, porque no puedes abrir esos puertos sin privilegios) .&lt;BR /&gt;&lt;BR /&gt;Por otro lado, el path del script de python se declara en el transformador (yo lo he puesto en /opt/alfresco/bin/). Pon el resultado que te da el script ocr-python.py en la terminal al aplicarlo sobre la imagen y lo miramos.&lt;BR /&gt;&lt;BR /&gt;Un saludo.&lt;BR /&gt;&lt;BR /&gt;–C.&lt;/BLOCKQUOTE&gt;&lt;BR /&gt;&lt;SPAN&gt;Gracias por tu rápida respuesta Cesar, ahora he colocado el script en la ruta /usr/share/tomcat6/bin y también he especificado esta ruta en ocr-context.xml, he probado el script desde la linea de comandos de la siguiente forma: ./ocr-simple.py simple.tif salida y se ejecuta con exito, el fichero "salida" contiene el texto de la imagen. Después he reiniciado el servidor de alfresco y he subido la imagen simple.tif a este pero no me realiza la búsqueda. Como tu indicabas no se ha generado ningun fichero tesser-xxxx en /tmp, este es el contenido de /tmp/ocr.log&lt;/SPAN&gt;&lt;BR /&gt;&lt;PRE class="language-none line-numbers"&gt;&lt;CODE&gt;/tmp/tomcat6-temp/Alfresco/RuntimeExecutableContentTransformerWorker_source_3474341795967203523.tiff&lt;SPAN class="line-numbers-rows"&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;/SPAN&gt;&lt;/CODE&gt;&lt;/PRE&gt;&lt;BR /&gt;&lt;SPAN&gt;Un saludo, Urbano.&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Mon, 20 Dec 2010 15:20:42 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172921#M126099</guid>
      <dc:creator>urban</dc:creator>
      <dc:date>2010-12-20T15:20:42Z</dc:date>
    </item>
    <item>
      <title>Re: Tesseract full integration</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172922#M126100</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Un post estupendo!, estamos probando Alfresco en nuestra organización y contamos con una cantidad importante de documentos escaneados.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Voy a probar lo que ponéis por aquí aunque me gustaría si alguien sabe como tratar directamente con ficheros PDF ya que las máquinas modernas de escaneo ya generan PDF multipágina de manera predeterminada.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Un saludo y muchas gracias.&lt;/SPAN&gt;&lt;BR /&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Mon, 11 Aug 2014 08:07:00 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172922#M126100</guid>
      <dc:creator>dvillasevil</dc:creator>
      <dc:date>2014-08-11T08:07:00Z</dc:date>
    </item>
    <item>
      <title>Re: Tesseract full integration</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172923#M126101</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;hi,&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;&amp;nbsp; i am trying to integrate alfresco with tesseract in linux environment, i done in windows but i am facing problem in linux environment please help me.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;OCR.sh&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;echo "hello"&amp;gt;&amp;gt;tmp/ocrtransform.log&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;SOURCE=$1&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; TARGET=$2&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; TMPDIR=tmp/ocrtransform.log&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; FILENAME=`basename $SOURCE`&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; sudo OCRFILE=$FILENAME.tif&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; # to see what happens&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; sudo echo "from $SOURCE to $TARGET" &amp;gt;&amp;gt;tmp/ocrtransform.log&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; sudo cp -f $SOURCE $TMPDIR/$OCRFILE&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; # call tesseract and redirect output to $TARGET&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; sudo /root/tesseract-ocr/tesseract $TMPDIR/$OCRFILE ${TARGET%\.*} -l eng&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; sudo rm -f $TMPDIR/$OCRFILE&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;this is the errror i am getting.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;os:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; Linux&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;&amp;nbsp;&amp;nbsp; command:&amp;nbsp;&amp;nbsp;&amp;nbsp; tesseract /var/www/html/alfresco/ocr.sh&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;&amp;nbsp;&amp;nbsp; succeeded:&amp;nbsp; false&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;&amp;nbsp;&amp;nbsp; exit code:&amp;nbsp; 1&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;&amp;nbsp;&amp;nbsp; out:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;&amp;nbsp;&amp;nbsp; err:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; tesseract: /var/www/html/alfresco/common/lib/libstdc++.so.6: version `GLIBCXX_3.4.11' not found (required by /usr/local/lib/libtesseract.so.3)&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;&amp;nbsp;&amp;nbsp; tesseract: /var/www/html/alfresco/common/lib/libstdc++.so.6: version `GLIBCXX_3.4.9' not found (required by&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;23:48:32,570 INFO&amp;nbsp; [org.alfresco.repo.management.subsystems.ChildApplicationContextFactory] Starting 'Transformers' subsystem, ID: [Transformers, default]&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Thanks,&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;os:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; Linux&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;&amp;nbsp;&amp;nbsp; command:&amp;nbsp;&amp;nbsp;&amp;nbsp; tesseract /var/www/html/alfresco/ocr.sh&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;&amp;nbsp;&amp;nbsp; succeeded:&amp;nbsp; false&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;&amp;nbsp;&amp;nbsp; exit code:&amp;nbsp; 1&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;&amp;nbsp;&amp;nbsp; out:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;&amp;nbsp;&amp;nbsp; err:&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; tesseract: /var/www/html/alfresco/common/lib/libstdc++.so.6: version `GLIBCXX_3.4.11' not found (required by /usr/local/lib/libtesseract.so.3)&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;&amp;nbsp;&amp;nbsp; &lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;&amp;nbsp;&amp;nbsp; tesseract: /var/www/html/alfresco/common/lib/libstdc++.so.6: version `GLIBCXX_3.4.9' not found (required by&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;23:48:32,570 INFO&amp;nbsp; [org.alfresco.repo.management.subsystems.ChildApplicationContextFactory] Starting 'Transformers' subsystem, ID: [Transformers, default]&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;thanks,&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;Malleshwari.&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Thu, 04 Dec 2014 05:49:24 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172923#M126101</guid>
      <dc:creator>malleshwari</dc:creator>
      <dc:date>2014-12-04T05:49:24Z</dc:date>
    </item>
    <item>
      <title>Re: Tesseract full integration</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172924#M126102</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Intenté el script probarlo por sí sólo y funciona (el primer script de linux), pero al integrarlo en alfresco no funciona. Estoy usando Alfresco-5.0.a.&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;Gracias&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Thu, 11 Feb 2016 12:04:18 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/tesseract-full-integration/m-p/172924#M126102</guid>
      <dc:creator>miguelangel81</dc:creator>
      <dc:date>2016-02-11T12:04:18Z</dc:date>
    </item>
  </channel>
</rss>

