<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" version="2.0">
  <channel>
    <title>topic Búsquedas por palabras exactas in Alfresco Archive</title>
    <link>https://connect.hyland.com/t5/alfresco-archive/b%C3%BAsquedas-por-palabras-exactas/m-p/173966#M127096</link>
    <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Hola a todos,&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;tengo un problema con la búsqueda en Alfresco Web Client Community 3.4.d.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;El objetivo que tenemos es realizar una búsqueda de la ocurrencia de la una palabra exacta dentro de varios documentos en pdf. Por ejemplo, si se busca accesibilidad, no se quiere que aparezcan resultados de otras palabras que puedan tener la misma tokenizacion, como accesible.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;En teoría la búsqueda exacta en alfresco está implementada anteponiendo el signo "=" a la palabra, por lo que he podido leer en este hilo en inglés, y en este reporte de bug:&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;A href="http://forums.alfresco.com/en/viewtopic.php?f=3&amp;amp;t=19701&amp;amp;start=0&amp;amp;hilit=exact+search" rel="nofollow noopener noreferrer"&gt;http://forums.alfresco.com/en/viewtopic.php?f=3&amp;amp;t=19701&amp;amp;start=0&amp;amp;hilit=exact+search&lt;/A&gt;&lt;BR /&gt;&lt;A href="http://issues.alfresco.com/jira/browse/ALF-3318" rel="nofollow noopener noreferrer"&gt;http://issues.alfresco.com/jira/browse/ALF-3318&lt;/A&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Sin embargo, a veces obtengo resultados, y a veces no, conocidas las palabras que van a aparecer en el conjunto de documentos.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Por lo que conozco de lucene (el motor de búsqueda de Alfresco), se que cuando se indexa un documento en PDF se tokeniza, es decir, sólo se queda con las raíces verbales y elimina las "stop words". Pero creo que se puede configurar para que en lugar de eso también almacene en el índice el texto completo.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Mi pregunta es, ¿es viable hacer búsquedas por palabras exactas en alfresco? ¿qué configuración hay que cambiar para conseguirlo?&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Muchas gracias, un saludo,&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
    <pubDate>Fri, 09 Sep 2011 11:01:57 GMT</pubDate>
    <dc:creator>apalazon</dc:creator>
    <dc:date>2011-09-09T11:01:57Z</dc:date>
    <item>
      <title>Búsquedas por palabras exactas</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/b%C3%BAsquedas-por-palabras-exactas/m-p/173966#M127096</link>
      <description>Hola a todos,tengo un problema con la búsqueda en Alfresco Web Client Community 3.4.d.El objetivo que tenemos es realizar una búsqueda de la ocurrencia de la una palabra exacta dentro de varios documentos en pdf. Por ejemplo, si se busca accesibilidad, no se quiere que aparezcan resultados de otras</description>
      <pubDate>Fri, 09 Sep 2011 11:01:57 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/b%C3%BAsquedas-por-palabras-exactas/m-p/173966#M127096</guid>
      <dc:creator>apalazon</dc:creator>
      <dc:date>2011-09-09T11:01:57Z</dc:date>
    </item>
    <item>
      <title>Re: Búsquedas por palabras exactas</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/b%C3%BAsquedas-por-palabras-exactas/m-p/173967#M127097</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Echale un vistazo a &lt;/SPAN&gt;&lt;A href="http://lucene.apache.org/java/2_4_0/api/org/apache/lucene/analysis/KeywordAnalyzer.html" rel="nofollow noopener noreferrer"&gt;esta clase de lucene&lt;/A&gt;&lt;SPAN&gt;, creo que te puede servir para lo que preguntas.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;(Gracias pjcaracuel &lt;img id="smileywink" class="emoticon emoticon-smileywink" src="https://connect.hyland.com/i/smilies/16x16_smiley-wink.png" alt="Smiley Wink" title="Smiley Wink" /&gt;)&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Mon, 12 Sep 2011 08:32:03 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/b%C3%BAsquedas-por-palabras-exactas/m-p/173967#M127097</guid>
      <dc:creator>cristinamr</dc:creator>
      <dc:date>2011-09-12T08:32:03Z</dc:date>
    </item>
    <item>
      <title>Re: Búsquedas por palabras exactas</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/b%C3%BAsquedas-por-palabras-exactas/m-p/173968#M127098</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Hola de nuevo,&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;gracias CristinaMR por la respuesta, ha estado cerca y ha sido una buena pista, pero no era la correcta. Ese analizador que mencionas devuelve el campo entero (el campo content del documento) como un sólo token.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;En cambio, usando &lt;/SPAN&gt;&lt;PRE class="language-none line-numbers"&gt;&lt;CODE&gt;org.apache.lucene.analysis.SimpleAnalyzer; &lt;SPAN class="line-numbers-rows"&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;/SPAN&gt;&lt;/CODE&gt;&lt;/PRE&gt;&lt;SPAN&gt; sí obtengo el resultado que busco, es decir, que tome como un token cada una de las palabras de forma literal, separadas por espacios. De esa forma pierdo toda la capacidad de hacer búsquedas semánticas, pero gano que las búsquedas sean exactas, que era lo que pretendía. Es una solución algo limitada, pero cumple los requisitos.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Para cambiar esta configuración, puede verse el tutorial que ponen en este hilo:&lt;/SPAN&gt;&lt;BR /&gt;&lt;A href="http://forums.alfresco.com/es/viewtopic.php?f=11&amp;amp;t=1916" rel="nofollow noopener noreferrer"&gt;http://forums.alfresco.com/es/viewtopic.php?f=11&amp;amp;t=1916&lt;/A&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Pero usando la clase &lt;/SPAN&gt;&lt;PRE class="language-none line-numbers"&gt;&lt;CODE&gt;org.apache.lucene.analysis.SimpleAnalyzer; &lt;SPAN class="line-numbers-rows"&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;/SPAN&gt;&lt;/CODE&gt;&lt;/PRE&gt;&lt;SPAN&gt; como analizador, en vez del analizador para español. &lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Un saludo,&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Mon, 12 Sep 2011 15:33:49 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/b%C3%BAsquedas-por-palabras-exactas/m-p/173968#M127098</guid>
      <dc:creator>apalazon</dc:creator>
      <dc:date>2011-09-12T15:33:49Z</dc:date>
    </item>
    <item>
      <title>Re: Búsquedas por palabras exactas</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/b%C3%BAsquedas-por-palabras-exactas/m-p/173969#M127099</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Perfecto. Gracias por compartir la respuesta &lt;img id="smileywink" class="emoticon emoticon-smileywink" src="https://connect.hyland.com/i/smilies/16x16_smiley-wink.png" alt="Smiley Wink" title="Smiley Wink" /&gt;&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;¡Un saludo!&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Mon, 12 Sep 2011 17:40:06 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/b%C3%BAsquedas-por-palabras-exactas/m-p/173969#M127099</guid>
      <dc:creator>cristinamr</dc:creator>
      <dc:date>2011-09-12T17:40:06Z</dc:date>
    </item>
    <item>
      <title>Re: Búsquedas por palabras exactas</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/b%C3%BAsquedas-por-palabras-exactas/m-p/173970#M127100</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Hola,&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;Esta es una pregunta frecuente, mucha gente esta acostumbrada al uso de búsquedas estrictas y las búsquedas "tokenizadas" les marean un poco, la solución es bien sencilla, en el caso de español es cambiar el contenido del fichero dataTypeAnalyzers_es.properties&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;d_dictionary.datatype.d_text.analyzer=org.alfresco.repo.search.impl.lucene.analysis.AlfrescoStandardAnalyser&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;d_dictionary.datatype.d_content.analyzer=org.alfresco.repo.search.impl.lucene.analysis.AlfrescoStandardAnalyser&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;el Standard analyzer no hace "stemming" y es perfectamente valido para cualquier lenguaje europeo (los asiáticos de izquierda a derecha o en vertical son otro cantar)&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Dejo aquí también un link a otro tutorial, si lo que deseas no es deshabilitar completamente snowball sino cambiar ligeramente el comportamiento echale un ojo a esto:&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;A href="http://java.dzone.com/news/modifying-lucene-snowball" rel="nofollow noopener noreferrer"&gt;http://java.dzone.com/news/modifying-lucene-snowball&lt;/A&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Wed, 21 Sep 2011 09:55:49 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/b%C3%BAsquedas-por-palabras-exactas/m-p/173970#M127100</guid>
      <dc:creator>antoniosoler</dc:creator>
      <dc:date>2011-09-21T09:55:49Z</dc:date>
    </item>
  </channel>
</rss>

