<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" version="2.0">
  <channel>
    <title>topic Lucene e Data Type Index Analyzers in Alfresco Archive</title>
    <link>https://connect.hyland.com/t5/alfresco-archive/lucene-e-data-type-index-analyzers/m-p/31520#M16287</link>
    <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Avevo un problema che ho risolto, anche se non ho capito perché si presentava…&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Utilizzando Lucene, la ricerca fulltext non funzionava bene. Soprattutto con wildcards.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Per fare un esempio: cercando la parola "assunto", mi ritornava anche documenti con "assunti", "assunta" ecc. Oppure cercando "trasformista", mi ritornava anche documenti con "trasformismo" (approssimando quindi due caratteri), ecc.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Ma soprattutto non funzionava la ricerca con caratteri jolly. Cercando "ass?nto" non usciva &lt;/SPAN&gt;&lt;STRONG&gt;niente&lt;/STRONG&gt;&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Alla fine ho capito che l'indicizzazione si "mangiava" l'ultimo carattere; infatti cercando "ass?nt", ecco che magicamente mi uscivano tutti i risultati corretti. Stesso discorso con il carattere *: per cercare la parola "determinazione", cercando per esempio "*termina*" o anche "*terminazio*" la trovavo, invece con "*terminazion*" no, perché la parola negli indici veniva evidentemente troncata a "determinazion".&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Cercando un po' su google, ho letto il consiglio di commentare, all'interno del file dataTypeAnalyzers_it.properties cioè il data analyzer italiano, le due righe che contiene:&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;# d_dictionary.datatype.d_text.analyzer=org.alfresco.repo.search.impl.lucene.analysis.ItalianSnowballAnalyser&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;# d_dictionary.datatype.d_content.analyzer=org.alfresco.repo.search.impl.lucene.analysis.ItalianSnowballAnalyser&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;In tal modo vengono utilizzati quello dello standard data analyzer, contenuti nel file dataTypeAnalyzers.properties, cioè:&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;d_dictionary.datatype.d_text.analyzer=org.alfresco.repo.search.impl.lucene.analysis.AlfrescoStandardAnalyser&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;d_dictionary.datatype.d_content.analyzer=org.alfresco.repo.search.impl.lucene.analysis.AlfrescoStandardAnalyser&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;La domanda è la seguente: come mai il data analyzer in italiano indicizza male i documenti in italiano, "mangiandosi" le lettere finali dei contenuti testuali?&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Ciao e grazie&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
    <pubDate>Thu, 23 Aug 2012 10:53:34 GMT</pubDate>
    <dc:creator>fable80_9340</dc:creator>
    <dc:date>2012-08-23T10:53:34Z</dc:date>
    <item>
      <title>Lucene e Data Type Index Analyzers</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/lucene-e-data-type-index-analyzers/m-p/31520#M16287</link>
      <description>Avevo un problema che ho risolto, anche se non ho capito perché si presentava…Utilizzando Lucene, la ricerca fulltext non funzionava bene. Soprattutto con wildcards.Per fare un esempio: cercando la parola "assunto", mi ritornava anche documenti con "assunti", "assunta" ecc. Oppure cercando "trasform</description>
      <pubDate>Thu, 23 Aug 2012 10:53:34 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/lucene-e-data-type-index-analyzers/m-p/31520#M16287</guid>
      <dc:creator>fable80_9340</dc:creator>
      <dc:date>2012-08-23T10:53:34Z</dc:date>
    </item>
    <item>
      <title>Re: Lucene e Data Type Index Analyzers</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/lucene-e-data-type-index-analyzers/m-p/31521#M16288</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Alfresco indicizza i contenuti utilizzando l'analyzer relativo al locale di sessione utente. &lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;Quindi se stai utilizzando un locale con una differente lingua ad esempio inglese, Alfresco indicizzerà utilizzando l'analyzer inglese.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Credo che questo sia il tuo caso&amp;nbsp; &lt;img id="smileywink" class="emoticon emoticon-smileywink" src="https://connect.hyland.com/i/smilies/16x16_smiley-wink.png" alt="Smiley Wink" title="Smiley Wink" /&gt;&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Fri, 24 Aug 2012 08:28:02 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/lucene-e-data-type-index-analyzers/m-p/31521#M16288</guid>
      <dc:creator>openpj</dc:creator>
      <dc:date>2012-08-24T08:28:02Z</dc:date>
    </item>
    <item>
      <title>Re: Lucene e Data Type Index Analyzers</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/lucene-e-data-type-index-analyzers/m-p/31522#M16289</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Però il problema l'ho risolto commentando le righe contenute nel dataTypeAnalyzers_it.properties italiano, quindi era l'analyzer italiano che faceva indicizzare male i documenti (che sono in italiano)…&amp;nbsp; :?&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Fri, 24 Aug 2012 10:35:01 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/lucene-e-data-type-index-analyzers/m-p/31522#M16289</guid>
      <dc:creator>fable80_9340</dc:creator>
      <dc:date>2012-08-24T10:35:01Z</dc:date>
    </item>
  </channel>
</rss>

