cancel
Showing results for 
Search instead for 
Did you mean: 

Verarbeitung von PDF-Dateien, Stichwort: OCR

quick-time
Champ in-the-making
Champ in-the-making
Hallo liebe Forumsmitglieder,

bin auf der Suche nach Informationen zu Alfresco hier im Forum gelandet und möchte mich schon jetzt für die vielen guten Info's und Ratschläge bei allen beantworten. Vieles hat mir bereits weitergeholfen.

Ich bräuchte jetzt eine Aussage darüber, ob ich mit meinen Vorstellungen richtig liege oder ob für meinen Anwendungsfall Alfresco nicht geeignet ist.

Alfreso soll in einer kleinen Firma eingesetzt werden. Hier fällt ein riesiger Berg an technischen Zeichnungen an. Zur Zeit wird mittels einem DIN A3 MFC jede Zeichnung in ein festgelegtes Verzeichnis auf dem internen Server (Windows) als PDF-Datei gescannt. Abends setzt sich ein Mitarbeiter hin und verschlagwortet die Datei dann im Dateinamen. Sprich > Zeichnung_Nr_Datum.pdf <. Da es aber immer mehr wird mit den Zeichnungen, soll ein DMS zum Einsatz kommen und hier habe ich an Alfresco gedacht.

Meine ausschlaggebende Frage ist nun:
Kann Alfresco die PDF-Dateien aus dem Scan-Verzeichnis automatisch Verschlagworten und kann man dabei einen Bereich auf der Zeichnung (Zeichnungsfeld) exklusiv bezeichnen (Z.B Alfresco soll nur einen Bereich unten rechts auf der Zeichnung in der größe 10 x 15 CM indizieren)?

Falls die Antwort hier positiv ist, was braucht es dazu oder reicht dafür Alfreso in der CE?

Viele Grüße und danke im voraus

Michael
1 REPLY 1

critter
Champ in-the-making
Champ in-the-making
Tach Michael,

Alfresco kann das nicht. Es muss irgendein OCR Engine dazwischen. Wir haben bereits gute erfharung mit Kofax gemacht. Es gibt ein Übergabe Script, womit die Daten direkt nach Alfresco übergeben werden können und die entsprechende Metadaten (soweit das Content Model vorbereitet ist) geschrieben. Mit den so extrahierten Metadaten lässt sich danach so zimelich alles einstellen. Manko ist hier: Kofax ist nicht umsonst. je nach Dokumentaufkommen kann's entsprechend teuerer oder biliger sein.
Ich meine allerdings zu wissen, dass Kofax Express Lizenztechnisch ziemlich unten anfängt,hat aber eine Restriktion bezüglich der übergebenen Metadaten Anzahl. Je nach dem wie viel Metadaten Ihr von den Zeichnungen extrahieren möchtet, kann esfür euch geeignet oder ungeeignet sein. In Kofax kannst du dann an einem beliebigen Bereich die OCR Erkennung einsetzen.

mfg

p.
Getting started

Tags


Find what you came for

We want to make your experience in Hyland Connect as valuable as possible, so we put together some helpful links.