cancel
Showing results for 
Search instead for 
Did you mean: 

Funcionamiento de Lucene

yakon_8894
Champ in-the-making
Champ in-the-making
Buenas,

es mi primer post en este foro, aunque llevo tiempo leyéndolo y siempre me ha sido muy útil. Sin embargo esta vez no consigo encontrar respuesta a una duda.

Tengo un alfresco montado totalmente limpio, sin ninguna extensión ni modificación. Subo un documento pdf llamado CAS-Madrid-ARV.pdf y posteriormente realizo unas pruebas de búsqueda.

Cuando busco la palabra CAS alfresco me devuelve como resultado el pdf antes citado.
Cuando busco la palabra Madrid ocurre lo mismo.
Sin embargo cuando busco la palabra ARV no obtengo ningún resultado.

Realicé pruebas directamente sobre el explorador de nodos usando lucene y obtuve los mismos resultados. La única forma de que lucene me devuelva el pdf en la búsqueda es poniendo *ARV*

Me parece extraño que falle la búsqueda justamente con los últimos caracteres del nombre del documento, y tanto con la búsqueda simple, la avanzada y el explorador de nodos obtengo los mismos resultados. Activando los logs de lucene en el log4j tampoco observo nada raro en las query que alfresco compone, todas son iguales cambiando el texto de búsqueda.

Si alguien pudiera ayudarme explicando a qué se debe este comportamiento o si es un error os lo agradecería.

Un saludo y gracias.
13 REPLIES 13

yakon_8894
Champ in-the-making
Champ in-the-making
Si, he hecho un full reindex, comprobado las locale de los documentos y modificado los Analyser entre varias posibilidades que aparecen en la wiki (el standard, snowball…) pero el funcionamiento es igual. Si me logueo en español, solo consigo obetener el resultado esperado usando los *

diegoitaliait
Champ in-the-making
Champ in-the-making
hola, mira te consejo de hacer esta prueva:

Coloca a tu file la propriedad(aspect) –> app:inlineediting, en el webclient la enquentras en la pagina de modifica del nombre, y abilitala a "yes".


No se porque, pero a mi muchos files que antes me davan problemas con lucene, despues de hacer eso me lo encontro.

Y hasme saber si funciono,

ciao

yakon_8894
Champ in-the-making
Champ in-the-making
hola, mira te consejo de hacer esta prueva:

Coloca a tu file la propriedad(aspect) –> app:inlineediting, en el webclient la enquentras en la pagina de modifica del nombre, y abilitala a "yes".


No se porque, pero a mi muchos files que antes me davan problemas con lucene, despues de hacer eso me lo encontro.

Y hasme saber si funciono,

ciao

Gracias por la ayuda, pero no ha sido efectiva.

yakon_8894
Champ in-the-making
Champ in-the-making
Buenas de nuevo. Finalmente hemos encontrado la solución.

En parte tardamos más de los previsto por que hicimos mal algunos cambios inicialmente y eso nos llevó a desechar la solución inicial que se planteaba en este post http://forums.alfresco.com/en/viewtopic.php?f=3&t=19018&p=62728#p62728

El problema parece ser que cuando se indexan contenidos se usa un analyser distinto al que luego usa lucene para las búsquedas marcando un idioma distinto al inglés. En nuestro caso el cliente usa el español, por lo que editamos el archivo dataTypeAnalyzers_es.properties situado en <ruta_alfresco>/tomcat/webapps/alfresco/WEB-INF/classes/alfresco/model/ modificando:

# Data Type Index Analyzers

d_dictionary.datatype.d_text.analyzer=org.alfresco.repo.search.impl.lucene.analysis.SpanishSnowballAnalyser
d_dictionary.datatype.d_content.analyzer=org.alfresco.repo.search.impl.lucene.analysis.SpanishSnowballAnalyser

por:

# Data Type Index Analyzers

d_dictionary.datatype.d_text.analyzer=org.alfresco.repo.search.impl.lucene.analysis.AlfrescoStandardAnalyser
d_dictionary.datatype.d_content.analyzer=org.alfresco.repo.search.impl.lucene.analysis.AlfrescoStandardAnalyser

Una vez modificado reiniciamos alfresco e hicimos un fullreindex y el problema se solucionó. Incluso arreglamos algunos problemas más relacionados con las búsquedas, como que en algunos casos devolvía resultados distintos buscando palabras con y sin tilde.

Muchas gracias a todos por vuestra ayuda y espero que al menos si alguien se encuentra con un problema parecido pueda servirle este post de algo

Un saludo