<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" version="2.0">
  <channel>
    <title>topic Re: Word Vorlagen, Steuerelemente und OCR in Alfresco Archive</title>
    <link>https://connect.hyland.com/t5/alfresco-archive/word-vorlagen-steuerelemente-und-ocr/m-p/25098#M12358</link>
    <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Lieber Herr Faust&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Vielen Dank für die nützlichen Antworten, das hilft mir so weiter.&amp;nbsp; Tatsächlich habe ich die Formularfeldertests momentan nur auf Basis von Office2003 gemacht, werde mir aber mal eine neuere Datei zurecht basteln um zu schauen, ob das so funktionieren sollte. Hilft natürlich nicht, für all die alten, schon bestehenden Dokumente, aber wir leben ja nicht (nur) in der Vergangenheit &lt;img id="smileyhappy" class="emoticon emoticon-smileyhappy" src="https://connect.hyland.com/i/smilies/16x16_smiley-happy.png" alt="Smiley Happy" title="Smiley Happy" /&gt;.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Betreffend der OCR Erkennung herrschen hier noch geteilte Meinungen, gibt es doch bei einer automatisierten Erkennung ettwelche Bereiche, welche manuell korrigiert werden müssten, was infolge der Fülle der Dateien nicht machbar wäre. Ich vertrete allerdings die Meinung, dass - selbst wenn 10% nicht oder falsch erkannt wurden - 90% such- und findbarer Text immer noch besser sind als 0%…&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Nun denn, nochmals Danke für die Ausführungen und Gruss&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;Stephan Lipp&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
    <pubDate>Mon, 04 Jul 2011 06:43:36 GMT</pubDate>
    <dc:creator>stelipp</dc:creator>
    <dc:date>2011-07-04T06:43:36Z</dc:date>
    <item>
      <title>Word Vorlagen, Steuerelemente und OCR</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/word-vorlagen-steuerelemente-und-ocr/m-p/25096#M12356</link>
      <description>Hallo liebe ForumsgemeindeIch bin neu in der Alfresco Welt (und im Forum) und habe ein paar Fragen, zu denen ich keine befriedigenden oder für mich verständlichen Antworten gefunden habe. Ich "evaluere" momentan Alfresco für einen Kunden und möchte bestimmte Fragen im Vorfeld abklären, damit ich ein</description>
      <pubDate>Fri, 01 Jul 2011 08:55:38 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/word-vorlagen-steuerelemente-und-ocr/m-p/25096#M12356</guid>
      <dc:creator>stelipp</dc:creator>
      <dc:date>2011-07-01T08:55:38Z</dc:date>
    </item>
    <item>
      <title>Re: Word Vorlagen, Steuerelemente und OCR</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/word-vorlagen-steuerelemente-und-ocr/m-p/25097#M12357</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Hallo,&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;an sich für alle aufgeführten Punkte ist eine kurze Erklärung des Alfresco Ansatz zu Umwandlung / Indizierung von Dokumentinhalten sinnvoll, um ein besseres Verständnis und eine bessere Einschätzung zu erhalten.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;- Alfresco inidiziert nur die textuelle Repräsentation von Dateiinhalten.&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;- Liegt eine Datei nicht in einem Textformat vor (also nicht TXT / HTML / XML …), dann wird ein externes Tool (z.B. OpenOffice) oder eine 3rd Party Bibliothek zur Konvertierung herangezogen. Alfresco indiziert nur das textuelle Ergebnis dieses Tools.&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;- Alfresco kann derart konfiguriert werden, dass einer bestimmten Dateiendung bzw. einem konkreten Dateiformat ein bestimmtes Konvertierungsvorgehen zugeordnert wird. Für .dot ist z.B. meines Wissens keins definiert.&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;- Die verschiedenen Office Versionen nutzen tlw. Konstrukte für bestimmte Features, die aufgrund mangelnder Dokumentation bzw. Ressourcen/Priorität nicht von jedem Tool verwertet werden können.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Eine (konfigurierte) Behandlung und Suchbarkeit von Formularfeldern eines Office Dokuments von Office 2003 sehe ich als unwahrscheinlich bzw. aufwendig zu realisieren ein. Wurden denn evtl. schon Tests mit den neueren Office Formaten ab 2007 durchgeführt? Hier erwarte ich an sich mehr Support durch Tools wie OpenOffice.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;In Bezug auf OCR verhält es sich ähnlich wie mit Office Dokumenten - Alfresco selber kann Graphiken alleine mangels eingebauter OCR nicht indizieren, könnte aber durch Konfiguration ein ext. Tool oder eine zusätzlich installierte Komponente nutzen, um diese "Lücke" zu füllen. Dabei gibt es kommerzielle Produkte oder auch Open Source Lösungen. Wir haben - zwar für Liferay statt Alfresco - selber schon auf Basis von tesseract eine einfache OCR Komponente für eine Volltextindizierung bei einem Kunden entwickelt. Eine Integration dieser Lösung in ein Alfresco wäre nur noch ein geringer Aufwand.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Gruß&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;Axel Faust&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Fri, 01 Jul 2011 16:22:24 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/word-vorlagen-steuerelemente-und-ocr/m-p/25097#M12357</guid>
      <dc:creator>afaust</dc:creator>
      <dc:date>2011-07-01T16:22:24Z</dc:date>
    </item>
    <item>
      <title>Re: Word Vorlagen, Steuerelemente und OCR</title>
      <link>https://connect.hyland.com/t5/alfresco-archive/word-vorlagen-steuerelemente-und-ocr/m-p/25098#M12358</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;SPAN&gt;Lieber Herr Faust&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Vielen Dank für die nützlichen Antworten, das hilft mir so weiter.&amp;nbsp; Tatsächlich habe ich die Formularfeldertests momentan nur auf Basis von Office2003 gemacht, werde mir aber mal eine neuere Datei zurecht basteln um zu schauen, ob das so funktionieren sollte. Hilft natürlich nicht, für all die alten, schon bestehenden Dokumente, aber wir leben ja nicht (nur) in der Vergangenheit &lt;img id="smileyhappy" class="emoticon emoticon-smileyhappy" src="https://connect.hyland.com/i/smilies/16x16_smiley-happy.png" alt="Smiley Happy" title="Smiley Happy" /&gt;.&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Betreffend der OCR Erkennung herrschen hier noch geteilte Meinungen, gibt es doch bei einer automatisierten Erkennung ettwelche Bereiche, welche manuell korrigiert werden müssten, was infolge der Fülle der Dateien nicht machbar wäre. Ich vertrete allerdings die Meinung, dass - selbst wenn 10% nicht oder falsch erkannt wurden - 90% such- und findbarer Text immer noch besser sind als 0%…&lt;/SPAN&gt;&lt;BR /&gt;&lt;BR /&gt;&lt;SPAN&gt;Nun denn, nochmals Danke für die Ausführungen und Gruss&lt;/SPAN&gt;&lt;BR /&gt;&lt;SPAN&gt;Stephan Lipp&lt;/SPAN&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Mon, 04 Jul 2011 06:43:36 GMT</pubDate>
      <guid>https://connect.hyland.com/t5/alfresco-archive/word-vorlagen-steuerelemente-und-ocr/m-p/25098#M12358</guid>
      <dc:creator>stelipp</dc:creator>
      <dc:date>2011-07-04T06:43:36Z</dc:date>
    </item>
  </channel>
</rss>

