OCRmypdf
- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Permalink
- Report Inappropriate Content
‎07-27-2018 10:22 AM
Bonjour,
je viens d'installer le module OCRmypdf.
L'installation s'est fais correctement et lorsque je clique sur le bouton OCR, un message m'indique que le fichier est bien pris en compte.
Mais après ça, rien ne se passe. Dans les logs, il y a bien une erreur.
Execution result:
os: Linux
command: /usr/local/bin/ocrmypdf --verbose 1 --force-ocr -l eng+fra /opt/alfresco-community/tomcat/temp/Alfresco/OCRTransformWorker_source_7931939322038726826.pdf /opt/alfresco-community/tomcat/temp/Alfresco/OCRTransformWorker_source_7931939322038726826_ocr.pdf
succeeded: false
exit code: 1
out:
err: Traceback (most recent call last):
File "/usr/local/bin/ocrmypdf", line 7, in <module>
from ocrmypdf.__main__ import run_pipeline
File "/usr/local/lib/python3.5/dist-packages/ocrmypdf/__main__.py", line 70, in <module>
verify_python3_env(
at es.keensoft.alfresco.ocr.OCRTransformWorker.transform(OCRTransformWorker.java:86)
at es.keensoft.alfresco.ocr.OCRExtractAction.executeImplInternal(OCRExtractAction.java:181)
... 10 more
Caused by: org.alfresco.service.cmr.repository.ContentIOException: 06270103 Failed to perform OCR transformation:
Execution result:
os: Linux
command: /usr/local/bin/ocrmypdf --verbose 1 --force-ocr -l eng+fra /opt/alfresco-community/tomcat/temp/Alfresco/OCRTransformWorker_source_7931939322038726826.pdf /opt/alfresco-community/tomcat/temp/Alfresco/OCRTransformWorker_source_7931939322038726826_ocr.pdf
succeeded: false
exit code: 1
out:
err: Traceback (most recent call last):
File "/usr/local/bin/ocrmypdf", line 7, in <module>
from ocrmypdf.__main__ import run_pipeline
File "/usr/local/lib/python3.5/dist-packages/ocrmypdf/__main__.py", line 70, in <module>
verify_python3_env(
at es.keensoft.alfresco.ocr.OCRTransformWorker.transform(OCRTransformWorker.java:79)
... 11 more
Je lance donc la commande manuellement en ligne de commande et le documents océrisé fonctionne bien.
Avez vous déjà eu ce problème ?
- Labels:
-
Language Groups
- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Permalink
- Report Inappropriate Content
‎07-31-2018 03:06 AM
Bonjour,
L'execution de ocrmypdf semble échoué à cause d'une erreur lié à python. Je note que l'utilisateur faisant tourné tomcat utilise python3.
Lors de vos tests manuel avez-vous utilisé cette même version ?
Y.
- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Permalink
- Report Inappropriate Content
‎07-31-2018 03:16 AM
Bonjour,
Je viens de regarder la version de python installé, je suis en Python 2.7.12.
Pensé vous que je dois mettre a jour Python ?
En récupérant la ligne de commande qui est dans le log d'erreur :
/usr/local/bin/ocrmypdf --verbose 1 --force-ocr -l eng+fra /opt/alfresco-community/tomcat/temp/Alfresco/OCRTransformWorker_source_7931939322038726826.pdf /opt/alfresco-community/tomcat/temp/Alfresco/OCRTransformWorker_source_7931939322038726826_ocr.pdf
La commande se lance correctement et j'ai alors un document océrisé. Mais je suis obligé de récupérer la commande dans le log pour que cela fonctionne.
Merci pour votre réponse.
EDIT :
J'ai maintenant Python en 3.5.2
Le problème persiste. Un idée ?

- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Permalink
- Report Inappropriate Content
‎01-08-2020 04:52 AM
Bonjour @ycoulon
j'utilise ocrmypdf avec alfresco et l'action ocr ne fonctionne pas, sachant que ocrmypdf fonctionne bien avec la commande.
logs :
Caused by: java.lang.RuntimeException: org.alfresco.service.cmr.repository.ContentIOException: 000817996 Failed to perform OCR transformation:
Execution result:
os: Linux
command: /usr/local/bin/ocrmypdf --verbose 1 --force-ocr -l eng /opt/alfresco-community/tomcat/temp/Alfresco/OCRTransformWorker_source_4887267237326407155.pdf /opt/alfresco-community/tomcat/temp/Alfresco/OCRTransformWorker_source_4887267237326407155_ocr.pdf
succeeded: false
exit code: 1
out:
err: Traceback (most recent call last):
File "/usr/local/bin/ocrmypdf", line 5, in
from ocrmypdf.main import run
File "/root/.local/lib/python3.6/site-packages/ocrmypdf/init.py", line 20, in
from .api import Verbosity
at es.keensoft.alfresco.ocr.OCRExtractAction.executeImplInternal(OCRExtractAction.java:183)
at es.keensoft.alfresco.ocr.OCRExtractAction.access$200(OCRExtractAction.java:38)
at es.keensoft.alfresco.ocr.OCRExtractAction$1.execute(OCRExtractAction.java:164)
at es.keensoft.alfresco.ocr.OCRExtractAction$1.execute(OCRExtractAction.java:161)
at org.alfresco.repo.transaction.RetryingTransactionHelper.doInTransaction(RetryingTransactionHelper.java:464)
at es.keensoft.alfresco.ocr.OCRExtractAction.executeInNewTransaction(OCRExtractAction.java:169)
at es.keensoft.alfresco.ocr.OCRExtractAction.access$100(OCRExtractAction.java:38)
at es.keensoft.alfresco.ocr.OCRExtractAction$ExtractOCRTask.run(OCRExtractAction.java:151)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)
at java.lang.Thread.run(Thread.java:748)
- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Permalink
- Report Inappropriate Content
‎01-09-2020 05:02 AM
Bonjour,
L'exception semble indiqué un problème avec le contenu à transformer (ContentIOException).
Il faudrait se rapprocher des personnes ayant réaliser le développement de cette action afin d'investiguer plus en détail sur cette erreur.
Je n'ai pas mis en oeuvre cette action ne serait donc pas d'un grand secours sur ce sujet pour le moment. Si je trouve le temps de faire des tests je vous tiendrais au courant.
Y.

- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Permalink
- Report Inappropriate Content
‎01-13-2020 03:47 AM
Merci @ycoulon
