مشروع مليون كتاب
بالرغم من حداثة تأسيس المعهد الدولي للعلوم المعلوماتية (ISIS) فإنه ينسب إليه عدة مشاريع رقمية في طريقها للاستكمال. أما مشروع المليون كتاب فهو يمثل مخططا مشتركا بين مكتبة الإسكندرية وما يزيد عن عشرين مؤسسة دولية ما بين جامعات و مؤسسات معلوماتية إلى شركات تنموية من الولايات المتحدة وحتى الصين والهند. وهذا المخطط يحقق أهداف مكتبة الإسكندرية في استعمال التقنية الرقمية لجعل إبداع الفكر الإنساني في متناول ملايين من الأشخاص في العالم على الدوام. كما يمكن هذا المشروع من خلال عناصره المتعددة من جعل القراءة المجانية و مليون نسخة من الكتب البحثية متاحة عبر الإنترنت إن تحقيق هدف مكتبة الإسكندرية لأن تصبح مكتبة رقمية علمية مع إفادة المجتمع الدولي من خلال إتاحة مقدار ضخم من المعرفة.
فيما يخص هدف المكتبة على المدى الطويل، فإن مشروع المليون كتاب يطمح إلى تحويل جميع الكتب المنشورة إلى كتب رقمية على أن يستهدف في المدى القصير مليون كتاب تحول إلى كتب رقمية (وهذه الكمية من الكتب تمثل ١% من كافة الكتب المنشورة بمختلف اللغات حتى عام ٢٠٠٥) ويتضمن المشروع عملية طويلة ومعقدة في تحديد واختيار الكتب التي سيتم نقلها بالماسح الضوئي. ويتم اختيار هذه الكتب حسب معيار دقيق وتشمل الكتب النادرة التي نفدت طبعتها أو تلك التي ليس لها حقوق نشر أو المستندات الحكومية. وأيضا كتب الأطفال والرسائل العلمية. ويلي مرحلة الاختيار عملية المسح الضوئي الفعلي والمسح الضوئي للصور ومراقبة الجودة وعملية التعرف على الرموز ضوئيا وبصريا.
ويمثل المليون كتاب ما يقرب من ٢٠٠ إلى ٣٠٠ مليون صفحة، بينما يقوم كل ماسح ضوئي بمسح ما بين ٤٠٠٠ إلى ٦٠٠٠ صفحة أثناء ثلاث دوريات عمل في اليوم. وهكذا فإن المسح الضوئي لمليون كتاب سوف يستغرق ٥٠٠ يوم عمل (أي ٣ ورديات عمل لمدة عاميين).
وتلي عملية المسح الضوئي لنقل الكتب، عملية المسح الضوئي للصور ومراقبة جودة هذه الصور حيث يتم استخدام في هذه المرحلة مجموعة من الأدوات اليدوية والآلية. ثم تأتي عملية تنقية الصور وتصغير حجم الملف المنقول إلى الحجم المناسب ثم إزالة أية فراغات زائدة ومراعاة حجم الهوامش مع تعديل الزوايا.
والمرحلة الثالثة هي التعرف على الرموز الضوئية والبصرية OCR الذي يسهل الفهرسة الكاملة للنص من خلال التعرف على الحروف التي تم إدخالها على البحث واسترجاع النص من المواد التي سبق مسحها ضوئيا. أما المرحلة النهائية للمشروع فهي مرحلة النشر التي يشرف عليها المعهد الدولي للمعلومات التقنية (IIIT). وتعمل مراكز البحث الضوئي على الاتصال بالمؤلفين بغية الحصول على موافقاتهم على نشر كتبهم على الإنترنت.
|