تکنولوژی

OCR: آموزش الفباى فارسى به رايانه

نام نویسنده: محمد رضا رئيسى

– ماهنامه دانشگر – رايانه تنها يك ابزار است، و ما انسان‌ها مى‌بايد شيوة كار كردن را به او بياموزيم، و امكانات كار را هم برايش فراهم آوريم، نرم‌افزارهاى مختلف به همين منظور طراحى مى‌شوند. يكى از آنها نرم‌افزار OCR است كه براى تشخيص و بازيابى الفبا (نوشته‌هاى دست‌نويس يا تايپ‌شده) توسط كامپيوتر طراحى مى‌شوند.

اگر هر يك از ما به طور متوسط 70 تا 80 سال عمر كنيم مجموع روزهاى زندگيمان بين 25هزار تا 29هزار روز مى‌شود. حال اگر به ما بگويند نرم‌افزارى توليد مى‌شود كه مى‌تواند بسيار بيشتر از عمر چندين و چند انسان در وقت صرفه‌جويى كند حتماً از آن استقبال مى‌كنيم، مگر آنكه براى چند صدبرابر روزهاى عمرمان ارزشى قائل نباشيم!

نرم‌افزار OCR قادر است چنين تحولى را در استفاده وقت بشر به وجود آورد. اين نرم‌افزار مى‌تواند متن‌هاى دست‌نويس يا متونى را كه قبلاً تايپ شده‌اند و اكنون فايل تايپى آنها موجود نيست، خود به تنهايى و بدون دخالت انگشتان هيچ تايپيستى تايپ كند. فرض كنيد كه مثلاً مى‌خواهيم متن مقالات روزنامه اطلاعات سال 1340 شمسى را (كه اكنون نه تنها فايل تايپى‌اش موجود نيست ــ چون آن زمان اصلاً تايپ كامپيوترى در كار نبود! ــ بلكه خود نسخه‌هاى روزنامه را هم به زحمت مى‌توان پيدا كرد) تايپ ديجيتالى كنيم، و اين متن‌ها را داخل بسته‌هاى نرم‌افزارى يا اينترنت قرار دهيم. اگر هر شماره از روزنامه را 24 صفحه فرض كنيم، و هر تايپيست بتواند در هر روز حداكثر يك صفحه از آن صفحات كاهى و كهنه شدة قديمى را دوباره تايپ كند، مجموعاً 24 روز لازم است تا تنها مقالات يك شماره از روزنامه تايپ شود. بنابراين در عرض يك سال يك نفر مى‌تواند تنها 15 شماره از روزنامه را تايپ كند. حال اگر نرم‌افزارى باشيم كه بتواند با اسكن كردن هر صفحة روزنامه، به طور خودكار مقالات آن را تايپ كند، تحولى عظيم رخ مى‌دهد، يعنى مطالب و مقالات هزاران شماره از روزنامه‌هاى قديمى به سرعت وارد فايل‌هاى رايانه‌اى مى‌شود. حال اين امكان را تعميم بدهيد به هزاران كتاب و دستنويس‌هاى قديمى يا جديد، كه هر كس بخواهد تنها يك صفحه از آنها را تايپ كند، بايد كلى وقت صرف كند. مى‌بنيد كه نرم‌افزار OCR براستى مى‌تواند هزاران هزار روز در وقت ما صرفه‌جويى كند، و البته هزينه‌ها را هم كاهش دهد. البته فقط يك مشكل كوچك به وجود مى‌آيد و آن بيكار شدن تايپيست‌هاست!

OCR در ايران چگونه آغاز شد؟
امان از دست اين تيزهوشان! ماجرا از ثبت‌نام داوطلبان آزمون «سازمان ملى پرورش استعدادهاى درخشان (تيزهوشان)» در سال 1380 ‎آغاز شد. ثبت‌نام از روى فرم‌هايى كه توسط دانش‌آموزان تكميل مى‌شد انجام مى‌گرفت. دانش‌آموزان شركت‌كننده در آزمون ــ مانند آزمون‌هاى سراسرى ــ بايد نام، نام خانوادگى، نام پدر، نام شهرستان محل تولد و سكونت، نام مدرسه و دين خود را در اخل كادرهاى مربعى شكل و به صورت حروف مقطع (يعنى هر حرف داخل يك كادر) مى‌نوشتند. وقتى كه همة فرم‌ها از طريق پست به سازمان مركزى برگزاركننده آزمون مى‌رسيد، عدة زيادى تايپيست متن آنها را دوباره وارد رايانه مى‌كردند. در واقع همان حرف‌هاى داخل كادر را دوباره تايپ مى‌كردند تا اطلاعات شناسنامه‌اى هر دانش‌آموز به صورت ديجيتالى درآيد. اين روش هم بسيار زمان‌بُر بود و هم نياز به تعداد زيادى تايپيست داشت. احتمال داشت كه تايپيست‌ها هم هنگام تايپ اشتباه كنند و با ثبت نادرست يك نام، مشخصات فردى در رايانه مركزى وارد شود كه اصلاً متولد نشده است! مثلاً فرض كنيد تايپيست محتم نام «جواد» را، كه داخل كادرها به صورت «ج.و.ا.د» نوشته شده بود، «فؤاد» تايپ مى‌كرد؛ در آن صورت در كارت شناسايى جواد سابق، فؤاد فعلى ثبت مى‌شد! (جوادِ موجود حذف مى‌شد و فؤاد ناموجود وارد فهرست داوطلبان مى‌شد!) افزون بر اين، هزينة كار نيز بسيار زياد بود.
به علت همين مشكلات، در بهمن‌ماه 1380، نخستين طرح OCR براى بازشناسى حروف فارسى توسط كامپيوتر ارائه شد و در سال‌هاى 1381 و 1382 نيز ثبت‌نام آزمون تيزهوشان به يارى اين نرم‌افزار انجام شد.

OCR چيست؟
OCR سرنام اصطلاحى است كه صورت كامل آن در واژه‌نامه‌هاى انگليسى به دو صورت آمده است:
1. Optical Character Recognition
2. Optical Character Reader
فرض كنيد كه ما متنى را روى كاغذ داريم و مى‌خواهيم آن را وارد رايانه كنيم. اولين روشى كه به ذهن مى‌رسد اين است كه متن را به تايپيست بدهيم تا با كامپيوتر تايپ كند. اما آيا مى‌شود عين همان متن را وارد رايانه بكنيم تا نيازى به تايپ نباشد؟ البته دستگاه «اسكنر» مى‌تواند تصويرى از آن متن را وارد رايانه كند، تا اينجا بخشى از مشكل ما حل شده است. اما رايانه كه نه عقلى دارد و نه «زبان» مى‌فهمد، نمى‌تواند حروف و كلمات را از هم تشخيص دهد. مثلاً اگر از كامپيوتر بخواهيم به ما بگويد كه در متن اسكن‌شده كلمة «على» چند بار آمده است، بى‌آنكه شرمنده شود، مى‌گويد: «error»، يعنى: «نمى‌توانم تشخيص بدهم!» در واقع اين «تصوير ديجيتال‌شده» بايد به «تصوير قابل پردازش» تبديل شود. موضوع اصلى OCR همين است.

انواع OCR
در زبان‌هاى ديگر، به ويژه زبان‌هايى كه با حروف لاتينى نوشته مى‌شوند، سال‌هاست كه از OCR استفاده مى‌شود. اما در ايران تازه دو سه سالى است كه به فكر استفاده از OCR در زبان فارسى افتاده‌ايم.
و اما OCR چند نوع است: يا تايپى است يا دست‌نويس. يعنى يا بايد يك متن قبلاً تايپ شده را (مثل كتاب‌ها و روزنامه‌هاى چندين سال قبل، يا حتى متنى را كه فايل تايپى آن موجود نيست و فقط پرينت آن را داريم) وارد رايانه كنيم، يا متن دست‌نويس را. متن‌هى دست‌نويس هم به دو صورت «گسسته» و «پيوسته» وجود دارند: متن «دست‌نويس پيوسته» مثل همان چيزهايى است كه ما هرازگاهى كه دلمان تنگ مى‌شود روى كاغذ مى‌نويسيم، يا يك نامه، يا يك قطعه شعر و … اما متن «دست‌نويس گسسته» همان نوشته‌‌هايى است كه حروف آن جدا از هم و به صورت گسسته نوشته شده‌اند، مثل نام و نام‌خانوادگى كه در فرم‌هاى آزمون ثبت‌نام، به صورت هر حرف داخل يك كادر، نوشته مى‌شوند. طراحى OCR گسستة فارسى تقريباً در مراحل پايانى كار قرار دارد ولى، OCR پيوسته ظاهراً سال‌هاى زيادى كار مى‌برد.
«رضا صديق» و «پرويز رزازى»، كه در رشتة مخابرات تحصيل كرده‌اند و مسئولن يك شركت كامپيوترى به نام «انديشه نرم‌افزار پايا» هستند، براى اولين بار به طور جدى پروژة OCR فارسى را دنبال كرده‌اند. رزازى كه دانشجوى مخابرات و مسئول بخش پردازش سيگنال شركت «پايا» و مدير پروژة OCR در اين شركت است، مى‌گويد : « OCR در دنيا موضوعى ناشناخته نيست، و بر روى آن زياد كار شده است، ولى در ايران با آنكه مدت‌هاست روى آن كار شده، اما بسيارى از اين كارها در حد كارهاى دانشگاهى و مقاله‌هاى علمى باقى‌مانده بود و تبديل به يك محصول كاربردى در ابعاد وسيع (مثل ثبت‌نام آزمون‌هاى بزرگ) نشده بود. ما بر روى اين طرح كار كرديم و هدفمان هم اين بود كه محصول را به شكل صنعتى آن توليد كنيم.»
البته غير از شركت «پايا»، دو شركت ديگر نيز با حمايت دبيرخانه طرح «تكفا» (توسعه كاربرد فناورى اطلاعات و ارتباطات) مشغول پژوهش و آزمايش بر روى OCR فارسى هستند. يكى از اين شركت‌ها «داده‌پردازان دوران نوين» نام دارد كه مديريت آن را دكتر «حسام فيلى» بر عهده دارد. دكتر فيلى متخصص در رشتة هوش مصنوعى، از دانشگاه صنعتى شريف، است و شركت «دوران نوين» را از سال 1381، با هدف كار تخصصى بر روى پروژه‌هاى هوش مصنوعى تأسيس كرده است. او دربارة چگونگى پيوستن شركتش به اين طرح مى‌گويد: «از تيرماه سال 82 با شروع فعاليت طرح «تكفا» و حمايت‌هاى مالى آنها، اين شركت تصميم گرف كه در زمينة طراحى OCR فارسى پژوهش و فعاليت كند. اين پروژه در شركت «دوران نوين» با همكارى آقاى «دكتر ابراهيمى مقدم» كه او هم از دانشجويان دورة دكترى هوش مصنوعى دانشگاه صنعتى شريف است، انجام مى‌گيرد.

فارسى ما و مشكلات آن
قبل از اينكه به مراحل ديگر OCR بپردازيم، لازم است اندكى هم به مشكلات خط فارسى ــ يا در واقع ويژگى‌هاى اين خط ــ بپردازيم. اول اينكه ما در فارسى حروف را به صورت چسبيده و پيوسته مى‌نويسيم و اين كار براى تشخيص حرف به حرف نوشته از سوى رايانه (كه قرار است در مراحل بعدى آن را تايپ كند) بسيار مشكل است. تصور كنيد كه همين كلمه ساده «است» را به حالت‌هاى مختلف مى‌شود نوشت: يكى براى «س» دندانه مى‌گذارد، يكى نمى‌گذارد، يكى آن را مى‌كشد و يكى نمى‌كشد و… حالا اگر همين صورت‌هاى مختلف «س» به «ت» هم بچسبند، تشخيص حروف براى ما انسان‌ها هم سخت مى‌شود، چه رسد به رايانه.

شباهت حروف
مشكل ديگر خط ما اين است كه حرف‌هاى فارسى بسيار به هم شبيه‌اند. مثلاً در نظر بگيريد كه تفاوت «ر» با «ز» با «ذ» يا «ب» با «ت» تنها در يك نقطه است، و چون نقطه جزء بسيار كوچكى است، اگر يك خط يا حتى يك لك كوچك روى كاغذ بيفتد، تشخيص حروف از هم بسيار دشوار مى‌شود و دردسر جدى براى بازشناسى حروف توسط رايانه ايجاد مى‌كند. اينها تازه مشكلات خط فارسى است. دربارة اعداد فارسى هم اين مشكل وجود دارد: صفر ما يك نقطه كوچك است كه مى‌تواند رايانه را به اشتباه بيندازد؛ اعداد 4، 3، 2، 1 هم بسيار به هم شبيه هستند و تنها تفاوتشان يك دندانه كوچك است.
به دلايل گفته شده OCR درمرحلة كنونى در كشور ما مربوط به «دست‌نويس‌هاى گسسته» يا متن‌هاى تايپى پيوسته است، و تا بازشناسى متن‌هاى دست‌نويس پيوسته توسط كامپيوتر راه زيادى در پيش است، چون در دست‌نويس‌هاى گسسته، اگرچه حروف به هم شباهت دارند، حداقل جداجدا نوشته شده‌اند. در متن‌هاى پيوسته تايپى هم مشكل كشيده شدن يك حرف يا شكسته نوشته شدن حروف را نداريم. البته به گفته مسئولا شركت «پايا» در حال حاضر هم نرم‌افزارهايى وجود دارد كه متن دست‌نويس پيوسته را تبديل به حروف جدا ازهم و گسسته مى‌كنند، ولى ضريب خطاى اين نرم‌افزارها زياد است و به شكل صنعتى درنيامده‌اند.

بازشناسى حروف و الگو
تا اينجا گفتيم تصوير صفحه‌اى كه در آن حروف به طور جداجدا (هر حرف داخل يك كادر) نوشته شده است، به وسيلة اسكن وارد رايانه مى‌شود. مرحلة بعدى اين است كه حروف بازشناسى شوند، يعنى مكان آنها از ديگر خطوط (مثل خطوط كادرى كه داخل آن نوشته شده) بازشناسى شود، و اگر متن پيوسته تايپى است، حروف جدا شوند و زوايد تصوير حذف شود. مثلاً اگر دانش‌آموزى «س» را به گونه‌ى نوشت كه بيرون از كادر بود، به رايانه بفهمانيم كه بى‌دقتى شده است او بايد همان حرف داخل كادر را بخواند. در مرحلة بعدى كه «بازشناسى الگو» نام دارد، با تعدادى شرط مى‌شود فهميد كه مثلاً حرفى «الف» است يا نه، و رايانه تشخيص مى‌دهد كه حرف «پ» است يا «ب». براى اين تشخيص لازم است كه تصوير حرف «الف» با الف‌هاى نمونه ــ كه قبلاً به رايانه داده شده است ــ منطبق شود. الفباى نمونه قبلاً از روى يك مجموعه بزرگ آموزشى تهيه شده و ويژگى‌هاى مشترك از آن استخراج شده است. اما از آنجا كه تنوع صورت‌ها نوشتارى يك حرف به صورت دست‌‌نويس بسيار زياد است، مدلى آمارى استخراج مى‌شود كه در آن شباهت ويژگى‌هاى استخراج‌ شدة قبلى با نمونه ورودى به رايانه بررسى مى‌شود. در اينجا «بازشناسى الگو» با روش‌هاى آمارى انجام مى‌شود كه روش معمول در سيستم‌هاى OCR است.
اگر فكر مى‌كنيد كه كار تمام شده است در اشتباهيد، چون تازه مى‌رسيم به دنبالة حروف. مثلاً اگر كسى همان حرف «س» را با دنباله بنويسد، رايانه بايد تشخيص دهد كه اين حرف فقط «س» است، يا مثلاً «ى» هم به آن چسبيده است.

مدل‌سازى يا پردازش زبانى
مرحله بعدى «مدل‌سازى زبانى» يا «پردازش زبانى» نام دارد. حروف به هم چسبيده، كه كلمه را درست مى‌كنند، بايد معنى‌دار يا شناخته‌شده باشند. در اين مرحله برسى مى‌شود كه چه كلماتى در زبان وجود دارد؟ چه تركيب‌هايى از كلمات مجاز است؟ و… البته در مراحل پيشرفته‌تر، مدل‌سازى گرامرى (دستور زبان) و مدل‌سازى معنايى هم وجود دارد كه تشخيص مى‌دهد جمله از لحاظ دستورى و معنايى درست است يا بى‌مفهوم است. اما در OCR گسسته ــ كه بيشتر براى ثبت‌نام استفاده شده ــ شباهت يك كلمه به نام، نام خانوادگى، شهر و … كافى است.
براى تشخيص تركيب‌هاى مجاز يك كلمه يا معنى‌دار بودن يك كلمه نيز به تهية بانك‌هاى اطلاعاتى (Data base) نياز داريم. در اين بانك‌ها مثلاً تمام نام‌هاى كوچك و بزرگ ايرانيان قبلاً جمع‌آورى شده است و هنگام تطبيق يك كلمه با ن مشخص مى‌شود كه رايانه حروف آن را دست تشخيص داده يا نه. بنابراين نقش اين بانك اطلاعاتى بسيار مهم است، چون اگر نامى در آن ثبت نشده باشد، كلمه‌اى كه آن نام را شامل شود، به طور خودكار از برنامه OCR حذف مى‌شود يا پيغام مى‌آيد كه: «اين كلمه اشتباه است» در صورتى كه ممكن است مثلاً نام «هشام» در بين نام‌هاى ايرانى وجود داشته باشد، ولى قبلاً در بانك اطلاعاتى ثبت نشده باشد.

بانك‌هاى ما و ديگران
مهندس «رزازى» دربارة مشكل بانك‌هاى اطلاعاتى در زبان فارسى مى‌گويد: «در دنيا براى توسعة OCR و ارزيابى آن، بانك‌هاى اطلاعاتى استاندارد ساخته شده است كه در آنها همة كلمات وجد دارند، يعنى بانك هم مشكل ديجيتال كلمه را دارد، و هم تصويرش را. اما براى زبان فارسى، اين بانك‌هاى اطلاعاتى چه براى ارزيابى و چه براى توسعه، استاندارد شده نيست. در واقع هر كسى براى خودش يك بانك اطلاعاتى مى‌سازد، و اين نمونه‌هاى متفاوت مشكلاتى را ايجاد مى‌كند. مثلاً براى ثبت‌نام دانش‌آموزانى كه در آزمون مدارس تيزهوشان شركت كرده بودند، يك بانك اطلاعاتى حاوى نام‌هاى فارسى، از روى اطلاعات فرم‌هاى سال‌هاى قبل، تهيه شد كه از روى آن كلماتى كه خيلى شبيه به نام‌هاى فارسى بودند تشخيص داده مى‌شد. مثلاً اگر رايانه كلمه‌اى را «مصيبت» تشخيص داد، براساس بانك اطلاعات معلوم مى‌شود كه «مصيب» بوده است كه يك نام ايرانى است.

على، ولى، قلى … و سيب
نكتة ديگر اين است كه يك بانك اطلاعاتى بايد شامل تعدادى كلمات خام باشد، بلكه «بسامد» آن واژگان، يعنى ميزان استعمال و تكرار كلمات در زبان و مشخصات آمارى آن‌ها هم بايد ثبت شده باشد، والا كارايى زيادى ندارد. مثلاً «على» نامى است كه شباهت زيادى به «ولى» و «قلى» دارد. كارهاى آمارى در بانك اطلاعاتى بايد طورى انجام شده باشد كه تعداد «على» بيشتر باشد، تا و بعد نوبت «ولى» و «قلى» برسد، چون درصد بسامدى «على» به لحاظ آمارى و كاربرد در ميان نام‌هاى بيشتر است.
در OCR فارسى گسسته، اگر فقط مربط به نام‌ها و نام‌خانوادگى باشد، كار ساده‌تر است از حالتى كه در OCR پيوسته وجود دارد. چون در OCR پيوسته هر كلمه‌اى ممكن است وجود داشته باشد مثل «سيب»، اما در بانك اطلاعاتى نام‌ها همه مى‌دانيم كه سيب نام يك شخص نيست بلكه نام يك ميوه است! بنابراين در OCR همواره سعى مى‌شود كه درصد خطا كاهش يابد، تا كلمات در حد ممكن درست تشخيص داده شوند. اگرچه طراحان هنوز به صددرصد صحت نرسيده‌اند، ولى نگران نتايج آزمون خود نباشيد، چون تمامى اطلاعات مربوط به شما چندين بار كنترل مى‌شوند و از سازوكار reject (يا مردودى) در رايانه هم استفاده مى‌شود. در اين روش اگر رايانه نتوانست كلمه‌اى را شخيص دهد، مى‌فهمد كه نفهميده است و در خروجى‌‌اش مى‌آورد كه: «من اين كلمه را نفهميده‌ام» و كار به سيستم دستى مى‌رود و در آنجا تصحيح مى‌شود. اين فرايند در پست خيلى كارايى دارد. در هر جاى دنيا كه تفكيك نامه‌ها و ديگر مرسولات پستى به وسيلة OCR انجام مى‌شود، بعضى از نامه‌ها در سيستم كامپيوترى وارد سازوكار «مردودى» مى‌شوند و به طور دستى مورد بررسى مجدد قرار مى‌گيرند. هم‌اكنون در سطح محدودى از OCR در پست كشور ما نيز استفاده مى‌شود، چون در پست هم كد پستى چندرقمى و ديگر اطلاعات به صورت گسسته و داخل كادرهايى نوشته مى‌شود، و كار آسان‌تر است.
در مورد خطاى OCR در تشخيص كلمات، مسئولان شركت «پايا» نظر جالبى دارند:
«حتى با تعبية سيستم مردودى (reject) هم ممكن است خطايى در تشخيص كلمات وجود داشته باشد. بايد در نظر داشته باشيم كه هيچ سيستم پردازشگرى (از جمله انسان) بدون خطا نيست. نكته مهم اين است كه يك سيستم ماشينى درصد خطاى كمترى نسبت به انسان داشته باشد تا جايگزين خوبى براى انسان باشد. مسئله اين نيست كه خطا را به صفر برسانيم. هر قدر كه فناورى جلوتر مى‌رود، ميزان خطا هم بيشتر كاهش مى‌يابد.»
مدير شركت «دوران نوين» هم به گونه‌اى ديگر به همين موضوع اشاره مى‌كند: «انتظار ما از مسئولان طرح «تكفا» آن است كه با موضوع OCR واقع‌بينانه‌تر برخورد شود، و در بحث مربوط به هزينه‌هاى پروژه و انتظاراتى كه از OCR مى‌رود، واقعيت‌ها در نظر گرفته شود. ديدگاه كنونى مسئولان تكفا آن است كه كل مشكل «خطا» تا 100درصد حل شود، در حالى كه فكر مى‌كنم حل مسائل مربوط به هوش مصنوعى نياز به روش تدريجى دارد. مثلاً در زبان عربى هم، نرم‌افزار «صخر» در نسخة اول خود فقط تا حدود 40درصد دقت داشت، در حالى كه اكنون پس از گذشت 13 سال از اولين نسخه آن دقت به مرز 98 درصد رسيده است.»
همان‌طور كه اشاره شد از OCR در ثبت‌نام آزمون «سازمان ملى استعدادهاى درخشان» در سال‌هاى 81 و 82 استفاده شد كه از طريق آن 000,440 نفر به طور ماشينى ثبت‌نام شدند. اين روش باعث شد كه در سال 81 (نمونه اول) 45 درصد در هزينه‌ها و 25 درصد در زمان ثبت‌نام صرفه‌جويى شود. در سال بعد (82) اين رقم به 50 درصد رسيد. نرم‌افزارى كه در اين آزمون‌ها مورد استفاده قرار گرفت براى هر كدام از موارد صحت بازشناسى متفاوتى داشت و در مجموع كار آن خوب بود (به جدول توجه كنيد):

به نظر مى‌آيد كه در چند سال آينده و با پيشرفت OCR فارسى و كاهش هر چه بيشتر خطاى آن، در آزمون‌هاى بزرگ‌ترى مانند آزمون سراسرى دانشگاه‌ها نيز بتوان از آن استفاده كرد.

سرنوشت OCR دست‌نويس
در مورد OCR پيوسته دست‌نويس نيز روند كار به همان صورتى است كه شرح داديم، اما آنچه كار را دشوارتر مى‌كند، قطعه‌بندى و جداجدا كردن حروف به هم چسبيده و تشخيص آنهاست. اگر اين روند طى شود، اين اميد وجود دارد كه روزى از OCR پيوسته دست‌نويس فارسى هم در سطح گسترده‌اى استفاده شود. البته OCR پيوسته دست‌نويس حتى در زبان انگليسى هم هنوز به كاربرد وسيع و عملى نرسيده است. مهندس «رزازى» دراين مورد مى‌گويد: « OCRانگليسى در سيستم عامل windows وجود دارد كه همراه با office فروخته مى‌شود، ولى فكر نكنيد كه نامه‌هاى ادارى انگليسى كه با دست‌نويس نوشته شده‌اند همه با OCR تايپ مى‌شوند. اين كار براى به نتيجه رسيدن به حداقل يك رون 10 ساله را بايد طى كند. OCR فارسى يك مرحله عقب‌تر است، پس زمان بيشترى مى‌برد.»
مهندس «صديق»، مديرعامل شركت «پايا» هم مى‌گويد: «همين OCR فارسى گسسته هم تا چند سال پيش يك رؤيا بود، ولى ديديم كه محقق شده است و به مرور پيشرفته‌تر هم خواهد شد. بنابراين طراحى OCR پيوسته فارسى هم، اگرچه سال‌ها طول مى‌كشد، ولى مطمئناً به نتيجه خواهد رسيد. اين طرح يك طرح تحقيقاتى است كه در دانشگاه‌ها دنبال مى‌شود و هنوز به يك محصول صنعتى قابل استفاده در سطح كلان و كاربردى براى عموم نرسيده است. ولى در حال حاضر نمونه‌هاى دانشگاهى و آزمايشگاهى آن در داخل كشور وجود دارد و موضوع رساله دكترى برخى از دانشجويان است.»
بنابراين بين 10 تا 20 سال آينده، آن‌گونه كه مسئولان شركت «پايا» مى‌گويند، OCR پيوسته دست‌نويس فارسى هم وارد بازار خواهد شد.
دكتر فيلى هم در پاسخ به اين سؤال كه «آيا طراحى OCR پيوستة فارسى روزى تحقق خواهد يافت؟» پاسخ مى‌دهد: «بله ولى به تدريج.»
به هر حال براساس قرارداد «تكفا» با شركت‌هاى ايرانى، تا كمتر از يك ماه ديگر، نسخه‌نهايى (البته نه صددرصد تكميل‌شده) OCR فارسى دست‌نويس گسسته و تايپى پيوسته ارائه خواهد شد. مدير شركت «دوران نوين» در اين مورد مى‌گويد: «پروژة OCR گسسته در مراحل پايانى خود قرار دارد ولى داراى مشكلاتى در تشخيص انوا اسكنرها و انواع فونت‌هاست كه در حال رفع آن هستيم. اين نرم‌افزار در حال حاضر امكان تشخيص فونت‌هاى تايپى فارسى با دقت زياد را دارد، ولى مشكل جدى آن است كه با اسكنرهاى مختلف نتايج نامناسبى مى‌دهد.» وى از اهميت اين طرح در بعد كلان ملى هم مى‌گويد: «با توجه به اين كه مشكل OCR براى بسيارى از زبان‌هاى دنيا مانند انگليسى عملاً حل شده است، اگر در كشور ما هم به نتيجة نهايى برسد در افزايش سطح اطلاعات فارسى در دنياى ديجيتالى امروز (از جمله در اينترنت) بسيار اهميت خواهد داشت.

نوشته های مشابه

دیدگاهتان را بنویسید

دکمه بازگشت به بالا