<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" version="2.0">
  <channel>
    <title>topic Je souhaite extraire des métadonnées contenues dans... in Alfresco Archive</title>
    <link>https://connect.hyland.com/t5/alfresco-archive/je-souhaite-extraire-des-m%C3%A9tadonn%C3%A9es-contenues-dans/m-p/49169#M28289</link>
    <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Bonjour, &lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Je souhaite extraire des métadonnées contenues dans des fichiers Word par exemple (dans le contenu du document et/ou dans les propriétés). Je veux également que des métadonnées soient rajoutées au document (par exemple la version du document). Il est possible d'utiliser la librairie POI pour cela, mais je manque d'info sur l'implémentaion de la classe Java et sur la config pour enregistrer le bean. Je suis parti de la démarche présentée sur &lt;/SPAN&gt;&lt;A href="http://newton.typepad.com/content/2007/02/building_a_cont.html" rel="nofollow noopener noreferrer"&gt;http://newton.typepad.com/content/2007/02/building_a_cont.html&lt;/A&gt;&lt;SPAN&gt;(1), ainsi que sur le wiki &lt;/SPAN&gt;&lt;A href="http://wiki.alfresco.com/wiki/Step-By-Step:_Creating_A_Custom_Model" rel="nofollow noopener noreferrer"&gt;http://wiki.alfresco.com/wiki/Step-By-Step:_Creating_A_Custom_Model&lt;/A&gt;&lt;SPAN&gt;, &lt;/SPAN&gt;&lt;A href="http://wiki.alfresco.com/wiki/MAGE-ML_Metadata_Extractor" rel="nofollow noopener noreferrer"&gt;http://wiki.alfresco.com/wiki/MAGE-ML_Metadata_Extractor&lt;/A&gt;&lt;SPAN&gt;, ou &lt;/SPAN&gt;&lt;A href="http://forums.alfresco.com/viewtopic.php?p=21590&amp;amp;sid=97901c8fefa1d200582dbb4a9d7fa549" rel="nofollow noopener noreferrer"&gt;http://forums.alfresco.com/viewtopic.php?p=21590&amp;amp;sid=97901c8fefa1d200582dbb4a9d7fa549&lt;/A&gt;&lt;SPAN&gt;.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Les exemples (1) et (2) sont malheureusement incomplets, surtout sur la partie Java. Je voudrais savoir 1. si j'ai raté une doc et 2. si qqn aurait une classe Java qui pourrait servir de modèle…&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Merci pour votre aide, &lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;Stéphane&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
    <pubDate>Thu, 31 May 2007 09:06:09 GMT</pubDate>
    <dc:creator>stebans</dc:creator>
    <dc:date>2007-05-31T09:06:09Z</dc:date>
    <item>
      <title>Je souhaite extraire des métadonnées contenues dans...</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/je-souhaite-extraire-des-m%C3%A9tadonn%C3%A9es-contenues-dans/m-p/49169#M28289</link>
      <description>Bonjour, Je souhaite extraire des métadonnées contenues dans des fichiers Word par exemple (dans le contenu du document et/ou dans les propriétés). Je veux également que des métadonnées soient rajoutées au document (par exemple la version du document). Il est possible d'utiliser la librairie POI pou</description>
      <pubDate>Thu, 31 May 2007 09:06:09 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/je-souhaite-extraire-des-m%C3%A9tadonn%C3%A9es-contenues-dans/m-p/49169#M28289</guid>
      <dc:creator>stebans</dc:creator>
      <dc:date>2007-05-31T09:06:09Z</dc:date>
    </item>
    <item>
      <title>Re: Je souhaite extraire des métadonnées contenues dans...</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/je-souhaite-extraire-des-m%C3%A9tadonn%C3%A9es-contenues-dans/m-p/49170#M28290</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Bonjour,&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;En ce qui concerne des classes d'exemples, le plus simple serait peut-être de jeter un oeil aux classes Alfresco, situées dans le package &lt;/SPAN&gt;&lt;EM&gt;org.alfresco.repo.content.metadata&lt;/EM&gt;&lt;SPAN&gt; (archive repository.jar).&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Bertrand.&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Thu, 31 May 2007 14:26:20 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/je-souhaite-extraire-des-m%C3%A9tadonn%C3%A9es-contenues-dans/m-p/49170#M28290</guid>
      <dc:creator>bmagnier</dc:creator>
      <dc:date>2007-05-31T14:26:20Z</dc:date>
    </item>
    <item>
      <title>Re: Je souhaite extraire des métadonnées contenues dans...</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/je-souhaite-extraire-des-m%C3%A9tadonn%C3%A9es-contenues-dans/m-p/49171#M28291</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Bonjour, &lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Merci beaucoup pour votre aide. Je n'aurais pas cherché dans cette librairie.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Stéphane&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Fri, 01 Jun 2007 07:37:58 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/je-souhaite-extraire-des-m%C3%A9tadonn%C3%A9es-contenues-dans/m-p/49171#M28291</guid>
      <dc:creator>stebans</dc:creator>
      <dc:date>2007-06-01T07:37:58Z</dc:date>
    </item>
    <item>
      <title>Re: Je souhaite extraire des métadonnées contenues dans...</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/je-souhaite-extraire-des-m%C3%A9tadonn%C3%A9es-contenues-dans/m-p/49172#M28292</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Bonjour, &lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;j'ai pu utiliser l'extracteur de métadonnées pour Office (OfficeMetadataExtracter) présent dans repository.jar et le modifier pour extraire des métadonnées personnalisées (par exemple les "mots-clés" présents dans les propriétés des documents Word) avec Apache POI. &lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;J'arrive à afficher les champs de nouvelles métadonnées personnalisées dans l'interface web, mais pour l'instant, je n'arrive absolument pas à afficher sur la page web la métadonnée que j'ai extraite du document Word. Pourtant, j'arrive à modifier l'auteur qui est extrait par défaut :&lt;/SPAN&gt;&lt;BR /&gt;&lt;PRE class="language-none line-numbers"&gt;&lt;CODE&gt;public class MyOfficeMetadataExtracter extends AbstractMetadataExtracter {&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; //métadonnée présente dans le modèle par défaut&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; static final QName PROP_AUTHOR = QName.createQName("&lt;A href="http://www.alfresco.org/model/content/1.0" rel="nofollow noopener noreferrer"&gt;http://www.alfresco.org/model/content/1.0&lt;/A&gt;", "author");&lt;BR /&gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; //métadonnée rajoutée dans mon modèle et affichée sur la page web sans problème&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; static final QName PROP_KEYWORD = QName.createQName("&lt;A href="http://mon.model.perso/model/content/1.0" rel="nofollow noopener noreferrer"&gt;http://mon.model.perso/model/content/1.0&lt;/A&gt;", "keyword");&lt;BR /&gt;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; //… &lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; public void extractInternal(ContentReader reader, final Map&amp;lt;QName, Serializable&amp;gt; destination) throws Throwable {&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; //… plus simplement, je soumets une string quelconque :&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; trimPut(PROP_AUTHOR, "mon auteur", destination);&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; trimPut(PROP_KEYWORDS, "mon mot-cle", destination);&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; //…&lt;BR /&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; }&lt;BR /&gt;}&lt;SPAN class="line-numbers-rows"&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;SPAN&gt;‍&lt;/SPAN&gt;&lt;/SPAN&gt;&lt;/CODE&gt;&lt;/PRE&gt;&lt;SPAN&gt;Lors de la soumission d'un document, le champ "auteur" affiche bien "mon auteur", mais le champ "mot-clé" n'affiche rien du tout ! Je ne vois pas contourner ce problème pour afficher les métadonnées personnalisées et je ne vois pas ce que j'ai pu oublier !&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;J'espère un tuyau de la part de ceux qui ont écrit leurs propres extracteurs !&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;Merci&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;Stéphane&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Mon, 11 Jun 2007 08:35:40 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/je-souhaite-extraire-des-m%C3%A9tadonn%C3%A9es-contenues-dans/m-p/49172#M28292</guid>
      <dc:creator>stebans</dc:creator>
      <dc:date>2007-06-11T08:35:40Z</dc:date>
    </item>
  </channel>
</rss>

