cancel
Showing results for 
Search instead for 
Did you mean: 

Synchronisation SOLR sous Alfresco 4.0d (community)

infsy
Champ in-the-making
Champ in-the-making
Bonjour à tous,

je termine l'installation d'Alfresco 4.0d et je suis confronté à un problème d'indexation avec SOLR.

J'ai installé mon serveur manuellement sur une Debian 6 avec Postgresql. A l'issue de l'installation, mon SOLR ne communiquait pas correctement avec mon Alfresco pour un problème de certificats.
Je n'ai pas traité ce problème dans un premier temps et ai commencé le chargement des docs via FTP. Lorsque mon entrepôt a été chargé, j'ai résolu le problème de certificats et désormais j'accède à ma console admin SOLR sans soucis. Je n'ai plus de messages d'erreurs au lancement d'alfresco dans alfresco.log.

Par contre, il se trouve que SOLR ne me ramène aucun résultat et qu'il n'indexe pas non plus les nouveaux contenus.
Dans catalina.out, je retrouve le message suivant :
Tracking failed
org.alfresco.error.AlfrescoRuntimeException: 07240171 Initial transaction not found with correct timestamp
….
SOLR has successfully connected to your repository however the SOLR indexes and repository database do not match.
24 août 2012 13:51:30 org.alfresco.solr.tracker.CoreTracker trackRepository
GRAVE: If this is a new or rebuilt database you SOLR indexes also need to be re-built to match the database.


J'ai essayé d'effacer les indexes Lucene et de restarter mon serveur avec le mode index.recovery.mode=FULL sans succès.

Comment faire pour synchroniser SOLR avec mon repository ?

Merci.
4 REPLIES 4

rguinot
Confirmed Champ
Confirmed Champ
a ma connaissance index.recovery.mode=FULL n'est pas utilisé par le serveur d'indexation.

qd vous dites :

J'ai essayé d'effacer les indexes Lucene

Quels repertoires exactement avez vous supprimé ?
Vous devez :
supprimer les données (repertoire data) d'index pour chaque core
supprimer les modèles pour chaque core (ex …/workspace-SpacesStore/alfrescoModels/*)

dranakan
Champ on-the-rise
Champ on-the-rise
Hello,

Essayer la marche à suivre http://wiki.alfresco.com/wiki/Alfresco_And_SOLR#FAQ

    How would I rebuild the index from scratch?
        Note: you could start a new Solr web app and switch to use this when the rebuild is done
        Note: the index.recovery.mode=FULL is not used by Solr - only Lucene
            Stop the Solr web app
            delete the index data directory for each core
            optionally, delete the models cached on the Solr side for each core (e.g. …\archive-SpacesStore\alfrescoModels\*)
            restart the Solr web app

Attention à l'expiration des certificats : https://forums.alfresco.com/fr/viewtopic.php?f=5&t=5727

infsy
Champ in-the-making
Champ in-the-making
Hello,

Essayer la marche à suivre http://wiki.alfresco.com/wiki/Alfresco_And_SOLR#FAQ

    How would I rebuild the index from scratch?
        Note: you could start a new Solr web app and switch to use this when the rebuild is done
        Note: the index.recovery.mode=FULL is not used by Solr - only Lucene
            Stop the Solr web app
            delete the index data directory for each core
            optionally, delete the models cached on the Solr side for each core (e.g. …\archive-SpacesStore\alfrescoModels\*)
            restart the Solr web app

Attention à l'expiration des certificats : https://forums.alfresco.com/fr/viewtopic.php?f=5&t=5727


Bonjour,

Merci pour vos réponses. J'avais supprimé des indexes Lucènes présent à l'installation qui ne servaient à rien et effectivement pas les indexes de Solr. Du coup, après les avoir supprimé comme vous me l'avez rappelé, ça fonctionne de suite beaucoup mieux 😉
Petite question subsidiaire : mon indexation est en train de s'effectuer et dans mon fichier de log catalina,out toujours je retrouve pas mal de messages de ce type :
2012-08-28 13:56:30,866  ERROR [pdfbox.filter.FlateFilter] [http-8080-71] Stop reading corrupt stream

Est ce du à des documents non conformes dans ma base, est ce inquiétant ?

Merci encore.

infsy
Champ in-the-making
Champ in-the-making
Bonjour,

juste pour information, j'ai rencontré des difficultés lors de la première indexation de ma base documentaire. En effet, les nombreuses erreurs rencontrées sur certains documents (sans doute issus de problèmes de format et peut être de version de pdfbook) flanquait mon serveur au tas pour des problèmes de mémoire.

En optimisant  ma JVM via les conseils donnés ici : http://wiki.alfresco.com/wiki/JVM_Tuning
et en rajoutant le paramètre content.transformer.Pdf2swf.maxSourceSizeKBytes=20480 (j'ai des gros documents…) les messages d'erreurs sont toujours présents mais cela n'empêche l'indexation de se dérouler en gros normalement et le serveur d'être disponible !

Merci de vos réponses, ce billet peut être clos.