cancel
Showing results for 
Search instead for 
Did you mean: 

Es posible desactivar lucene temporalmente (cargas masivas)?

cesarista
World-Class Innovator
World-Class Innovator
Hola a todos:

Una de las preguntas que me suelo hacer en los procesos de carga masiva de documentos en Alfresco, normalmente con ficheros indexables PDF o DOC, es si puedo desactivar el indexador (Lucene) y programar la indexación (o reactivarla) mas tarde. ¿ Alguien tiene experiencia en estos procesos normalmente dolorosos en CPU/RAM para el servidor y como se puede hacer ? ¿ Se puede hacer a través de index.tracking.cronExpression ?

Un saludo.

–C.
4 REPLIES 4

antoniosoler
Champ in-the-making
Champ in-the-making
Hola,
No se si ya te sera de ayuda debido al tiempo que ha pasado desde que hiciste la pregunta.

Se puede hacer que la indexacion no se haga de manera sincrona con la transaccion , sino que se va haciendo a posteriori a su ritmo,
añade estos valores al fichero Global properties:

index.tracking.disableInTransactionIndexing=true
lucene.maxAtomicTransformationTime=0

(ojo, no dejes esto asi cuando tengas usuarios interactivos)

esto seguramente que los ultimos nodos que vayas añadiendo no esten indexados por lo que no apareceran inmediatamente en las busquedas.

En el siguiente reinicio si activas index.recovery.mode=AUTO se pondra al dia si le falta algo para dejarlo todo listo justo despues del arranque.

Otra cosa que podrias mirar para cargas masivas es el modulo que realizo Peter Monks para importaciones masivas:

http://code.google.com/p/alfresco-bulk-filesystem-import/

cesarista
World-Class Innovator
World-Class Innovator
Hola:

Muchas gracias por la respuesta, nunca viene mal. La idea era esa precisamente. Hacer una carga masiva de 2000000 documentos pdf o word con el modulo de peter monks, que puede durar muchas horas y que el sistema no sufra demasiado indexando durante la carga.

Según lo que dices, esos parámetros hacen que la indexación no sea síncrona, pero ¿ cuando empezaría a indexar el sistema ? ¿ solo cuando regenerases los índices ? ¿ o tras un cierto tiempo empezaría a indexar a su ritmo ? 

Un saludo.

–C.

antoniosoler
Champ in-the-making
Champ in-the-making
En teoria continua en background, pero si quieres ver como va o incluso echar un ojo a lo que esta haciendo puedes usar la utilidad que hay en tu propio sistema para ello:

http://localhost:8080/alfresco/service/enterprise/admin/indexcheck

(cambia los valores de host y puerto para tu sistema)

Incluso desde aqui puedes forzar lanzar una reindexacion parcial en background desde la hora a la que empezaste el import.

cesarista
World-Class Innovator
World-Class Innovator
Genial, esto no lo conocía.

Entiendo que la utilidad sólo es para enterprise.

Muchas gracias.

–C.
Getting started

Tags


Find what you came for

We want to make your experience in Hyland Connect as valuable as possible, so we put together some helpful links.