docWorks

Als eine weltweit etablierte und führende Digitalisierungssoftware überzeugt docWorks mit einem komfortablen, nahtlosen Workflow. Mit docWorks werden die Seiten gescannter Zeitungsarchive und Bibliotheksbestände konvertiert, mit nachhaltigen METS/ALTO Metadaten angereichert, langfristig gesichert und für eine flexible Weiterverwendung bereitgestellt.

Nahtloser Workflow

Vom Import der Scans bis zum Export der METS/ALTO- bzw. IIIF-Dateien, werden mit docWorks alle Konvertierungsschritte (Cropping, Deskew, Zoning, Layoutanalyse und OCR) in einem nahtlosen Workflow durchlaufen. Mit diesem kontinuierlich optimierten Prozess, vereint in einer Applikation, realisieren Sie Ihre Projekte sowohl kosten- als auch zeiteffizient.

Artificial Intelligence

Die bewährte Layoutanalyse in docWorks kann optional auch Machine-Learning-gestützt durchgeführt werden. Mit diesem automatisierten Arbeitsschritt erhalten Sie sichtbar präzisere Ergebnisse, die den Aufwand der manuellen Nacharbeit deutlich verringern. Für eine noch genauere Layoutanalyse kann auf Wunsch auch mit individuellen, projektspezifischen Trainingsdaten gearbeitet werden.

Universell einsetzbar

Mit der flexiblen, Machine-Learning-gestützten Layoutanalyse unterstützt docWorks die Verarbeitung beliebiger Publikationstypen und Layoutformate. Eine große Auswahl an OCR-Engines ermöglicht die Konvertierung in einer Vielzahl von Sprachen und Schriftsystemen. docWorks skaliert problemlos zwischen Projekten von wenigen Tausend bis zu vielen Millionen Seiten.

Multiple Dateiformate

Unterstützt werden vielfältige Import-, Export- und Metadatenformate. Importformate sind TIF, JPG, JP2, GIF, PNG, BMP, CR2 und PDF. Im Export erhalten Sie METS (mit sowohl METS physical structural maps als auch METS logical structural maps) und ALTO XML, Bilddateien, IIIF, PDF, PDF/A, benutzerdefinierte XML-Formate (full-text und andere), RTF und EPUB. Metadatenformate sind MIX, MARC21, MODS, DC.

Premium Support

Mit über 40 Jahren Erfolg in der Umsetzung von großen und Massen-Digitalisierungsprojekten renommierter Bibliotheken und Serviceprovider, wie u.a. The British Library und Digital Divide Data (DDD), bietet unser CCS Team erstklassigen Service und professionellen Support, weltweit.

Dank der effizienten und soliden Konvertierung mit docWorks erhalten Sie Daten mit hohem Informationsgehalt für Ihr nachhaltiges, durchsuchbares digitales Archiv.

1. Import

Nach dem Import der gescannten Print- oder Mikroform-Dokumentseiten durchlaufen diese Cropping und Deskew.

2. Zoning/ Layoutanalyse

Es folgen das Zoning und die Layoutanalyse, d.h. die Identifizierung der Bestandteile einer Seite, wie z. B. Artikelüberschriften, Fotos, Paragraphen, Bildunterschriften.

3. Strukturanalyse

Die Strukturanalyse umfasst die Identifizierung der Bestandteile der gesamten Publikation, wie z.B. Inhaltsverzeichnis, Artikel, Kapitel und Anhang.

4. Texterkennung (OCR)

Anschließend kann die Texterkennung (OCR) stattfinden. Aus den unterstützten OCR-Systemen wählt docWorks auf Grundlage von Sprach-, Schrift- und Zoneninformationen automatisch die beste Engine aus.

5. Export

Abschließend werden die Daten in dem für Bibliotheken Metadaten-Standardformat METS/ALTO ausgegeben, gesichert und stehen zur Weiterverwendung bereit.

docWorks wird weltweit von innovativen, namenhaften Kunden genutzt und ist die Software der Wahl vieler Serviceprovider. Bis heute wurden bereits rund 200 Millionen Dokumentseiten erfolgreich mit docWorks verarbeitet, darunter Sammlungen von 15 Nationalbibliotheken.