التقنيات التي يقوم عليها المشروع

 

1 - تقنيات المسح الضوئي:

خضعت الصحف الواردة في الموقع إلى المسح الضوئي استنادًا إلى أحد المصدرين التاليين المتاحين: النسخ الورقية (الأصل) أو نسخ مصوّرة في أشرطة أفلام مصغّرة، وقد فضّلنا دومًا الاعتماد على النسخ الأفضل التي تتمتّع بجودة عالية وبأكبر كمية من أعداد الصحيفة. وبالحقيقة، فإنها ليست بالمهمة السهلة، وذلك لأن الصحف التاريخية تعاني دومًا من عمليات تآكل وتفتت، وغالبًا ما تكون المجموعات غير متوفرة بصورة كاملة. لهذا، فإن الجهود المبذولة في المسح الضوئي للمواد الأرشيفية بصورة عامة، والصحف التاريخية بصورة خاصة، تعتبر جزءًا بالغ الأهمية في عمليات إنقاذ المواد التي لولا هذه الجهود لكانت اندثرت إلى الأبد. من هنا، فإن اختيار المصدر الذي نقوم بمسحه ضوئيًا - المصدر الورقي أو أشرطة الأفلام المصغّرة - يتغيّر دومًا بحسب وضع كل عدد وتوافر كمية أكبر من الأعداد، وقد فضّلنا دومًا التصوير من المصدر الورقي طالما أن حالته جيدة وكان بالإمكان فعل ذلك.

لقد مُسحت جميع المواد الواردة في الموقع ضوئيًا في مركز المسح الضوئي القائم في المكتبة الوطنية الإسرائيلية لأغراض هذا المشروع تحديدًا. أما المواد التي مُسحت من أشرطة الأفلام المصغّرة، فقد مُسحت بالأبيض والأسود أو بأحد أطياف اللون الرمادي. وفي حال كون المصدر الورقي ملوّنًا، فقد حاولنا مسحها مع الحفاظ على ألوانها بغية الحفاظ على الأمانة في مسحها الضوئي.

تتمتّع المواد الممسوحة ضوئيًا المشمولة في المشروع بجودة DPI 300 (وبعضها يفوق ذلك: DPI 400).

لقد خضعت المواد الورقية إلى مسح ضوئي بالاستعانة بآلة التصوير من صنف PENTAX Z645، وجهاز التصوير الضوئي من صنف PANASONIC KV-S5055C، وآلة التصوير CANON 5D.

أما المواد التي مصدرها أشرطة الأفلام المصغّرة فقد مسحت ضوئيًا بالاستعانة بالماسح الضوئي Eclipse by NextScan.

بعد المسح/التصوير تخضع جميع المواد لعملية صارمة لضمان الجودة QA ولعملية معالجة الرسومات بالحد الأدنى وفق ما تقتضيه الحاجة.

 

2 – أرضية توفير المواد والطباعة اليدوية للعناوين وأسماء الكتّاب:

تعتمد مشاريع الصحافة التاريخية عادة إلى إخضاع جميع الصحف التاريخية، وتلك الصحف (غير العربية) المتوافرة في موقعنا، لعملية مسح النصوص استنادًا إلى تقنية التعرّف الضوئي على الحروف OCR  (Optical Character Recognition). وقد تقرّر في المشروع الحالي عدم الاستناد إلى هذه التقنية بكل ما يتعلّق بالصحافة العربية، وذلك بعد فشل جميع المحاولات عبر استخدام مختلف برامج هذه التقنية. أما سبب ذلك فيتلخّص في أن النتائج التي حصلنا عليها في اللغة العربية كانت متدنية جدًا (20-30% نسبة النجاح). لهذا السبب فلن تساعدنا هذه التقنية في التعرّف على الحروف وبالتالي لن تساعدنا في البحث في مضامين النصوص. وللتعامل مع هذه المشكلة، فقد اخترنا اعتماد دمج عدة تقنيات وأساليب سوية: طباعة يدوية لعناوين المقالات وأسماء الكتّاب لإتاحة فرصة البحث فيها. وبالطبع لا يعتبر هذا الأسلوب مثاليًا قياسًا بتقنية التعرّف الضوئي على الحروفOCR  التي تتيح لنا البحث في جميع النص، ولكن يبقى هذا الأسلوب جيدًا للتعامل مع الصعوبات القائمة في اعتماد تقنية التعرّف الضوئي على الحروف OCR باللغة العربية.

إن الطباعة اليدوية لعناوين المقالات وأسماء الكتّاب تفرض علينا ضرورة التعامل مع إشكالية أخرى وهي: كيف نتصرّف حين تظهر "أخطاء" بالأصل - التي ربما لا تكون أخطاء بل هي أساليب مختلفة للكتابة كانت معتمدة قديمًا. وقد توصلنا إلى قرار مبدئي مفاده أننا لا نقوم بتصويب "الأخطاء" وإنما طباعة ما يظهر في الأصل بصورة دقيقة. وسوف يؤثّر هذا بالطبع على نتائج بحثنا، ولهذا نوصي بضرورة التلاعب بشكل الكتابة في حال عدم الحصول على نتائج مرضية، وخاصة بكل ما يتعلّق بكلمات ليست عربية بالأصل (مثل كتابة "ايتالية" بدل "ايطالية").

وبعد الانتهاء من المسح الضوئي، تتم عملية جمع الصور التي تتحوّل جميعها إلى أعداد إلكترونية استنادًا إلى تقنية برنامج خاص بشركة Olive Software (وفي هذه المرحلة تتم كذلك عملية الطباعة اليدوية). يقوم هذا البرنامج بتحضير أعداد من الصحف ومعالجتها وفق منظومة OLIVE APA، وهي منظومة تمنحنا إمكانية سهلة لمعاينة الصحف عبر جهاز الحاسوب أو عبر الأجهزة النقالة، إضافة إلى إمكانية التصفّح والبحث المتقدّم (للحصول على المساعدة وكيفية استخدام منظومة البحث يرجى الانتقال إلى "دليل المستخدم")