docWorks

من خلال مرونة وسلاسة سير عملها، أثبتت docWorks نفسها كبرمجية رائدة عالمياً في مجال الرقمنة: صفحات من أرشيف الجرائد ومقتنيات المكاتب تم مسحها ضوئياً وتحويلها وإغنائها عن طريق تقنية METS/ALTO (معيار ترميز البيانات الوصفية ونقلها / عناصر النص والنماذج المُحلّلة) المستدامة، كما أنها محمية على المدى الطويل ومصمّمة لتكون متوفرة لإعادة الاستخدام بشكل مرن.

الذكاء الاصطناعي

يمكن إجراء تحليل التصميم المُعتمد في docWorks اختيارياً أيضاً بدعم التعلم الآلي. تُعطي هذه الخطوة المؤتمتة نتائج أكثر دقة بشكل ملحوظ، والتي تقلل بدورها من كمية أي عمل يدوي إضافي، بشكل كبير. ولتحليل أكثر دقة أيضاً، يمكن استخدام بيانات تدريب ذاتية وذلك للقيام بتكييف التحليل مع مواد مشروع محدّد.

سير عمل سلس

من استيراد المواد التي تم مسحها ضوئياً إلى تصديرها كملفات METS/ALTO أو IIIF (الإطار الدولي لقابلية التشغيل البيني للصور International Image Interoperability Framework) تعمل docWorks  عبر جميع مراحل التحويل (القص، التعديل والتسوية، التقسيم، تحليل التصميم والتعرف الضوئي على الحروف) من خلال سياق منظم يتّسم بالسلاسة. ينتج عن هذا التطبيق الشامل متعدد المهام، إلى جانب العمليات المحسنة بشكل مستمر، مشاريع فعّالة في التكلفة والوقت.

سير عمل سلس

من استيراد المواد التي تم مسحها ضوئياً إلى تصديرها كملفات METS/ALTO أو IIIF (الإطار الدولي لقابلية التشغيل البيني للصور International Image Interoperability Framework) تعمل docWorks  عبر جميع مراحل التحويل (القص، التعديل والتسوية، التقسيم، تحليل التصميم والتعرف الضوئي على الحروف) من خلال سياق منظم يتّسم بالسلاسة. ينتج عن هذا التطبيق الشامل متعدد المهام، إلى جانب العمليات المحسنة بشكل مستمر، مشاريع فعّالة في التكلفة والوقت.

الذكاء الاصطناعي

يمكن إجراء تحليل التصميم المُعتمد في docWorks اختيارياً أيضاً بدعم التعلم الآلي. تُعطي هذه الخطوة المؤتمتة نتائج أكثر دقة بشكل ملحوظ، والتي تقلل بدورها من كمية أي عمل يدوي إضافي، بشكل كبير. ولتحليل أكثر دقة أيضاً، يمكن استخدام بيانات تدريب ذاتية وذلك للقيام بتكييف التحليل مع مواد مشروع محدّد.

دعم مميز

بنجاح استمر لأكثر من أربعين عاماً من تنفيذ مشاريع رقمية هائلة لأشهر المكتبات ومزودي الخدمات، كالمكتبة البريطانية ومؤسسة Digital Divide Data، يقدّم فريق عمل CCS خدمة عالمية من الدرجة الأولى إضافة للدعم الاحترافي.

صيغ ملفات متعددة

إن صيغ الاستيراد والتصدير والبيانات الصورية مدعومة على اختلافها. تكون الملفات التي يتم استيرادها بالصيغ: TIF / JPG / JP2 / GIF / PNG / BMP / CR2 / PDF. ويتم تصديرها لتصبح: METS (متضمنة خرائط METS الهيكلية، المادية منها والمنطقية) و ALTO XML، ملفات صور، تنسيقات IIIF  / PDF / PDF/A وتنسيقات XML المخصصة (نصوص، أخرى)، RTF  (وهو نوع من الملفات النصية التي تقبل أنماط التنسيق)، EPUB (أحد صيغ الكتب الإلكترونية، مشتقة من العبارة Electronic Publication وتعني النشر الالكتروني). وتكون مخططات البيانات الوصفية على شكل ملفات من نوع MIX / MARC21 / MODS / DC.

قابل للتطبيق عالمياً

من خلال تحليل التصميم المرن المدعوم بتعلم الآلة، تدعم docWorks معالجة كل نوع من أنواع المنشورات والتصاميم. كما تتيح مجموعة كبيرة من محركات OCR التحويل بعدة لغات وأنظمة كتابة مختلفة. تتعامل docWorks بسهولة مع المشاريع التي تحتوي بضعة آلاف إلى أخرى مكونة من عدة ملايين من الصفحات.

قابل للتطبيق عالمياً

من خلال تحليل التصميم المرن المدعوم بتعلم الآلة، تدعم docWorks معالجة كل نوع من أنواع المنشورات والتصاميم. كما تتيح مجموعة كبيرة من محركات OCR التحويل بعدة لغات وأنظمة كتابة مختلفة. تتعامل docWorks بسهولة مع المشاريع التي تحتوي بضعة آلاف إلى أخرى مكونة من عدة ملايين من الصفحات.

صيغ ملفات متعددة

إن صيغ الاستيراد والتصدير والبيانات الصورية مدعومة على اختلافها. تكون الملفات التي يتم استيرادها بالصيغ: TIF / JPG / JP2 / GIF / PNG / BMP / PDF. ويتم تصديرها لتصبح: METS (متضمنة خرائط METS الهيكلية، المادية منها والمنطقية) و ALTO XML، ملفات صور، تنسيقات IIIF  / PDF / PDF/A وتنسيقات XML المخصصة (نصوص، أخرى)، RTF  (وهو نوع من الملفات النصية التي تقبل أنماط التنسيق)، EPUB (أحد صيغ الكتب الإلكترونية، مشتقة من العبارة Electronic Publication وتعني النشر الالكتروني). وتكون مخططات البيانات الوصفية على شكل ملفات من نوع MIX / MARC21 / MODS / DC.

دعم مميز

بنجاح استمر لأكثر من أربعين عاماً من تنفيذ مشاريع رقمية هائلة لأشهر المكتبات ومزودي الخدمات، كالمكتبة البريطانية ومؤسسة Digital Divide Data، يقدّم فريق عمل CCS خدمة عالمية من الدرجة الأولى إضافة للدعم الاحترافي.

يمكّنكم التحويل الفعّال والمتين عبر docWorks من إنتاج البيانات بمحتوى معلومات عالٍ لأرشيفكم الرقمي المستدام القابل للبحث.

1. الاستيراد

بعد القيام باستيراد صفحات المستندات المطبوعة أو الممسوحة ضوئياً، تخضع المواد للاقتصاص والتعديل (قصها إلى أحجام معينة، تصحيح الزوايا وتسويتها).

2. التقسيم / تحليل التصميم

بعد الاستيراد تأتي مرحلة تقسيم المناطق وتحليل التصميم، ما يعني تعريف مكونات الصفحة مثل عناوين المقالات والصور والفقرات والشروحات التوضيحية المرفقة.

3. تحليل البنية

ويتضمن تحليل البنية تعريف مكونات كامل المنشور مثل جدول المحتويات، المقالات، الأقسام والملحق.

4. التعرف على النصوص (OCR)

بعد ذلك، يمكن لعملية التعرف على النصوص أن تتم. من أنظمة OCR المتعددة تختار docWorks تلقائياً أفضل محرك استناداً إلى معلومات اللغة، الخط والمنطقة.

5. التصدير

في الخطوة الأخيرة يتم إخراج البيانات بتنسيق البيانات الوصفية القياسية METS/ALTO للمكتبات، يتم حفظها لتصبح فيما بعد متاحة للاستخدام.

يُستخدم docWorks من قبل عملاء مبتكرين ومعروفين عالمياً وهو البرنامج المفضل للعديد من مزودي الخدمات. حتى الآن، تمت معالجة حوالي مئتي مليون صفحة من المستندات بنجاح من خلال docWorks بما في ذلك مجموعات من 15 مكتبة وطنية.