docWorks
Als eine weltweit etablierte und führende Digitalisierungssoftware überzeugt docWorks mit einem komfortablen, nahtlosen Workflow. Mit docWorks werden die Seiten gescannter Zeitungsarchive und Bibliotheksbestände konvertiert, mit nachhaltigen METS/ALTO Metadaten angereichert, langfristig gesichert und für eine flexible Weiterverwendung bereitgestellt.
Nahtloser Workflow
Vom Import der Scans bis zum Export der METS/ALTO- bzw. IIIF-Dateien, werden mit docWorks alle Konvertierungsschritte (Cropping, Deskew, Zoning, Layoutanalyse und OCR) in einem nahtlosen Workflow durchlaufen. Mit diesem kontinuierlich optimierten Prozess, vereint in einer Applikation, realisieren Sie Ihre Projekte sowohl kosten- als auch zeiteffizient.
Artificial Intelligence
Die bewährte Layoutanalyse in docWorks kann optional auch Machine-Learning-gestützt durchgeführt werden. Mit diesem automatisierten Arbeitsschritt erhalten Sie sichtbar präzisere Ergebnisse, die den Aufwand der manuellen Nacharbeit deutlich verringern. Für eine noch genauere Layoutanalyse kann auf Wunsch auch mit individuellen, projektspezifischen Trainingsdaten gearbeitet werden.
Universell einsetzbar
Multiple Dateiformate
Unterstützt werden vielfältige Import-, Export- und Metadatenformate. Importformate sind TIF, JPG, JP2, GIF, PNG, BMP, CR2 und PDF. Im Export erhalten Sie METS (mit sowohl METS physical structural maps als auch METS logical structural maps) und ALTO XML, Bilddateien, IIIF, PDF, PDF/A, benutzerdefinierte XML-Formate (full-text und andere), RTF und EPUB. Metadatenformate sind MIX, MARC21, MODS, DC.
Premium Support
Mit über 40 Jahren Erfolg in der Umsetzung von großen und Massen-Digitalisierungsprojekten renommierter Bibliotheken und Serviceprovider, wie u.a. The British Library und Digital Divide Data (DDD), bietet unser CCS Team erstklassigen Service und professionellen Support, weltweit.
Dank der effizienten und soliden Konvertierung mit docWorks erhalten Sie Daten mit hohem Informationsgehalt für Ihr nachhaltiges, durchsuchbares digitales Archiv.

1. Import
Nach dem Import der gescannten Print- oder Mikroform-Dokumentseiten durchlaufen diese Cropping und Deskew.
2. Zoning/ Layoutanalyse
Es folgen das Zoning und die Layoutanalyse, d.h. die Identifizierung der Bestandteile einer Seite, wie z. B. Artikelüberschriften, Fotos, Paragraphen, Bildunterschriften.
3. Strukturanalyse
Die Strukturanalyse umfasst die Identifizierung der Bestandteile der gesamten Publikation, wie z.B. Inhaltsverzeichnis, Artikel, Kapitel und Anhang.
4. Texterkennung (OCR)
5. Export
Abschließend werden die Daten in dem für Bibliotheken Metadaten-Standardformat METS/ALTO ausgegeben, gesichert und stehen zur Weiterverwendung bereit.
docWorks wird weltweit von innovativen, namenhaften Kunden genutzt und ist die Software der Wahl vieler Serviceprovider. Bis heute wurden bereits rund 200 Millionen Dokumentseiten erfolgreich mit docWorks verarbeitet, darunter Sammlungen von 15 Nationalbibliotheken.