OCR: آموزش الفباى فارسى به رايانه
نام نویسنده: محمد رضا رئيسى
– ماهنامه دانشگر – رايانه تنها يك ابزار است، و ما انسانها مىبايد شيوة كار كردن را به او بياموزيم، و امكانات كار را هم برايش فراهم آوريم، نرمافزارهاى مختلف به همين منظور طراحى مىشوند. يكى از آنها نرمافزار OCR است كه براى تشخيص و بازيابى الفبا (نوشتههاى دستنويس يا تايپشده) توسط كامپيوتر طراحى مىشوند.
اگر هر يك از ما به طور متوسط 70 تا 80 سال عمر كنيم مجموع روزهاى زندگيمان بين 25هزار تا 29هزار روز مىشود. حال اگر به ما بگويند نرمافزارى توليد مىشود كه مىتواند بسيار بيشتر از عمر چندين و چند انسان در وقت صرفهجويى كند حتماً از آن استقبال مىكنيم، مگر آنكه براى چند صدبرابر روزهاى عمرمان ارزشى قائل نباشيم!
نرمافزار OCR قادر است چنين تحولى را در استفاده وقت بشر به وجود آورد. اين نرمافزار مىتواند متنهاى دستنويس يا متونى را كه قبلاً تايپ شدهاند و اكنون فايل تايپى آنها موجود نيست، خود به تنهايى و بدون دخالت انگشتان هيچ تايپيستى تايپ كند. فرض كنيد كه مثلاً مىخواهيم متن مقالات روزنامه اطلاعات سال 1340 شمسى را (كه اكنون نه تنها فايل تايپىاش موجود نيست ــ چون آن زمان اصلاً تايپ كامپيوترى در كار نبود! ــ بلكه خود نسخههاى روزنامه را هم به زحمت مىتوان پيدا كرد) تايپ ديجيتالى كنيم، و اين متنها را داخل بستههاى نرمافزارى يا اينترنت قرار دهيم. اگر هر شماره از روزنامه را 24 صفحه فرض كنيم، و هر تايپيست بتواند در هر روز حداكثر يك صفحه از آن صفحات كاهى و كهنه شدة قديمى را دوباره تايپ كند، مجموعاً 24 روز لازم است تا تنها مقالات يك شماره از روزنامه تايپ شود. بنابراين در عرض يك سال يك نفر مىتواند تنها 15 شماره از روزنامه را تايپ كند. حال اگر نرمافزارى باشيم كه بتواند با اسكن كردن هر صفحة روزنامه، به طور خودكار مقالات آن را تايپ كند، تحولى عظيم رخ مىدهد، يعنى مطالب و مقالات هزاران شماره از روزنامههاى قديمى به سرعت وارد فايلهاى رايانهاى مىشود. حال اين امكان را تعميم بدهيد به هزاران كتاب و دستنويسهاى قديمى يا جديد، كه هر كس بخواهد تنها يك صفحه از آنها را تايپ كند، بايد كلى وقت صرف كند. مىبنيد كه نرمافزار OCR براستى مىتواند هزاران هزار روز در وقت ما صرفهجويى كند، و البته هزينهها را هم كاهش دهد. البته فقط يك مشكل كوچك به وجود مىآيد و آن بيكار شدن تايپيستهاست!
OCR در ايران چگونه آغاز شد؟
امان از دست اين تيزهوشان! ماجرا از ثبتنام داوطلبان آزمون «سازمان ملى پرورش استعدادهاى درخشان (تيزهوشان)» در سال 1380 آغاز شد. ثبتنام از روى فرمهايى كه توسط دانشآموزان تكميل مىشد انجام مىگرفت. دانشآموزان شركتكننده در آزمون ــ مانند آزمونهاى سراسرى ــ بايد نام، نام خانوادگى، نام پدر، نام شهرستان محل تولد و سكونت، نام مدرسه و دين خود را در اخل كادرهاى مربعى شكل و به صورت حروف مقطع (يعنى هر حرف داخل يك كادر) مىنوشتند. وقتى كه همة فرمها از طريق پست به سازمان مركزى برگزاركننده آزمون مىرسيد، عدة زيادى تايپيست متن آنها را دوباره وارد رايانه مىكردند. در واقع همان حرفهاى داخل كادر را دوباره تايپ مىكردند تا اطلاعات شناسنامهاى هر دانشآموز به صورت ديجيتالى درآيد. اين روش هم بسيار زمانبُر بود و هم نياز به تعداد زيادى تايپيست داشت. احتمال داشت كه تايپيستها هم هنگام تايپ اشتباه كنند و با ثبت نادرست يك نام، مشخصات فردى در رايانه مركزى وارد شود كه اصلاً متولد نشده است! مثلاً فرض كنيد تايپيست محتم نام «جواد» را، كه داخل كادرها به صورت «ج.و.ا.د» نوشته شده بود، «فؤاد» تايپ مىكرد؛ در آن صورت در كارت شناسايى جواد سابق، فؤاد فعلى ثبت مىشد! (جوادِ موجود حذف مىشد و فؤاد ناموجود وارد فهرست داوطلبان مىشد!) افزون بر اين، هزينة كار نيز بسيار زياد بود.
به علت همين مشكلات، در بهمنماه 1380، نخستين طرح OCR براى بازشناسى حروف فارسى توسط كامپيوتر ارائه شد و در سالهاى 1381 و 1382 نيز ثبتنام آزمون تيزهوشان به يارى اين نرمافزار انجام شد.
OCR چيست؟
OCR سرنام اصطلاحى است كه صورت كامل آن در واژهنامههاى انگليسى به دو صورت آمده است:
1. Optical Character Recognition
2. Optical Character Reader
فرض كنيد كه ما متنى را روى كاغذ داريم و مىخواهيم آن را وارد رايانه كنيم. اولين روشى كه به ذهن مىرسد اين است كه متن را به تايپيست بدهيم تا با كامپيوتر تايپ كند. اما آيا مىشود عين همان متن را وارد رايانه بكنيم تا نيازى به تايپ نباشد؟ البته دستگاه «اسكنر» مىتواند تصويرى از آن متن را وارد رايانه كند، تا اينجا بخشى از مشكل ما حل شده است. اما رايانه كه نه عقلى دارد و نه «زبان» مىفهمد، نمىتواند حروف و كلمات را از هم تشخيص دهد. مثلاً اگر از كامپيوتر بخواهيم به ما بگويد كه در متن اسكنشده كلمة «على» چند بار آمده است، بىآنكه شرمنده شود، مىگويد: «error»، يعنى: «نمىتوانم تشخيص بدهم!» در واقع اين «تصوير ديجيتالشده» بايد به «تصوير قابل پردازش» تبديل شود. موضوع اصلى OCR همين است.
انواع OCR
در زبانهاى ديگر، به ويژه زبانهايى كه با حروف لاتينى نوشته مىشوند، سالهاست كه از OCR استفاده مىشود. اما در ايران تازه دو سه سالى است كه به فكر استفاده از OCR در زبان فارسى افتادهايم.
و اما OCR چند نوع است: يا تايپى است يا دستنويس. يعنى يا بايد يك متن قبلاً تايپ شده را (مثل كتابها و روزنامههاى چندين سال قبل، يا حتى متنى را كه فايل تايپى آن موجود نيست و فقط پرينت آن را داريم) وارد رايانه كنيم، يا متن دستنويس را. متنهى دستنويس هم به دو صورت «گسسته» و «پيوسته» وجود دارند: متن «دستنويس پيوسته» مثل همان چيزهايى است كه ما هرازگاهى كه دلمان تنگ مىشود روى كاغذ مىنويسيم، يا يك نامه، يا يك قطعه شعر و … اما متن «دستنويس گسسته» همان نوشتههايى است كه حروف آن جدا از هم و به صورت گسسته نوشته شدهاند، مثل نام و نامخانوادگى كه در فرمهاى آزمون ثبتنام، به صورت هر حرف داخل يك كادر، نوشته مىشوند. طراحى OCR گسستة فارسى تقريباً در مراحل پايانى كار قرار دارد ولى، OCR پيوسته ظاهراً سالهاى زيادى كار مىبرد.
«رضا صديق» و «پرويز رزازى»، كه در رشتة مخابرات تحصيل كردهاند و مسئولن يك شركت كامپيوترى به نام «انديشه نرمافزار پايا» هستند، براى اولين بار به طور جدى پروژة OCR فارسى را دنبال كردهاند. رزازى كه دانشجوى مخابرات و مسئول بخش پردازش سيگنال شركت «پايا» و مدير پروژة OCR در اين شركت است، مىگويد : « OCR در دنيا موضوعى ناشناخته نيست، و بر روى آن زياد كار شده است، ولى در ايران با آنكه مدتهاست روى آن كار شده، اما بسيارى از اين كارها در حد كارهاى دانشگاهى و مقالههاى علمى باقىمانده بود و تبديل به يك محصول كاربردى در ابعاد وسيع (مثل ثبتنام آزمونهاى بزرگ) نشده بود. ما بر روى اين طرح كار كرديم و هدفمان هم اين بود كه محصول را به شكل صنعتى آن توليد كنيم.»
البته غير از شركت «پايا»، دو شركت ديگر نيز با حمايت دبيرخانه طرح «تكفا» (توسعه كاربرد فناورى اطلاعات و ارتباطات) مشغول پژوهش و آزمايش بر روى OCR فارسى هستند. يكى از اين شركتها «دادهپردازان دوران نوين» نام دارد كه مديريت آن را دكتر «حسام فيلى» بر عهده دارد. دكتر فيلى متخصص در رشتة هوش مصنوعى، از دانشگاه صنعتى شريف، است و شركت «دوران نوين» را از سال 1381، با هدف كار تخصصى بر روى پروژههاى هوش مصنوعى تأسيس كرده است. او دربارة چگونگى پيوستن شركتش به اين طرح مىگويد: «از تيرماه سال 82 با شروع فعاليت طرح «تكفا» و حمايتهاى مالى آنها، اين شركت تصميم گرف كه در زمينة طراحى OCR فارسى پژوهش و فعاليت كند. اين پروژه در شركت «دوران نوين» با همكارى آقاى «دكتر ابراهيمى مقدم» كه او هم از دانشجويان دورة دكترى هوش مصنوعى دانشگاه صنعتى شريف است، انجام مىگيرد.
فارسى ما و مشكلات آن
قبل از اينكه به مراحل ديگر OCR بپردازيم، لازم است اندكى هم به مشكلات خط فارسى ــ يا در واقع ويژگىهاى اين خط ــ بپردازيم. اول اينكه ما در فارسى حروف را به صورت چسبيده و پيوسته مىنويسيم و اين كار براى تشخيص حرف به حرف نوشته از سوى رايانه (كه قرار است در مراحل بعدى آن را تايپ كند) بسيار مشكل است. تصور كنيد كه همين كلمه ساده «است» را به حالتهاى مختلف مىشود نوشت: يكى براى «س» دندانه مىگذارد، يكى نمىگذارد، يكى آن را مىكشد و يكى نمىكشد و… حالا اگر همين صورتهاى مختلف «س» به «ت» هم بچسبند، تشخيص حروف براى ما انسانها هم سخت مىشود، چه رسد به رايانه.
شباهت حروف
مشكل ديگر خط ما اين است كه حرفهاى فارسى بسيار به هم شبيهاند. مثلاً در نظر بگيريد كه تفاوت «ر» با «ز» با «ذ» يا «ب» با «ت» تنها در يك نقطه است، و چون نقطه جزء بسيار كوچكى است، اگر يك خط يا حتى يك لك كوچك روى كاغذ بيفتد، تشخيص حروف از هم بسيار دشوار مىشود و دردسر جدى براى بازشناسى حروف توسط رايانه ايجاد مىكند. اينها تازه مشكلات خط فارسى است. دربارة اعداد فارسى هم اين مشكل وجود دارد: صفر ما يك نقطه كوچك است كه مىتواند رايانه را به اشتباه بيندازد؛ اعداد 4، 3، 2، 1 هم بسيار به هم شبيه هستند و تنها تفاوتشان يك دندانه كوچك است.
به دلايل گفته شده OCR درمرحلة كنونى در كشور ما مربوط به «دستنويسهاى گسسته» يا متنهاى تايپى پيوسته است، و تا بازشناسى متنهاى دستنويس پيوسته توسط كامپيوتر راه زيادى در پيش است، چون در دستنويسهاى گسسته، اگرچه حروف به هم شباهت دارند، حداقل جداجدا نوشته شدهاند. در متنهاى پيوسته تايپى هم مشكل كشيده شدن يك حرف يا شكسته نوشته شدن حروف را نداريم. البته به گفته مسئولا شركت «پايا» در حال حاضر هم نرمافزارهايى وجود دارد كه متن دستنويس پيوسته را تبديل به حروف جدا ازهم و گسسته مىكنند، ولى ضريب خطاى اين نرمافزارها زياد است و به شكل صنعتى درنيامدهاند.
بازشناسى حروف و الگو
تا اينجا گفتيم تصوير صفحهاى كه در آن حروف به طور جداجدا (هر حرف داخل يك كادر) نوشته شده است، به وسيلة اسكن وارد رايانه مىشود. مرحلة بعدى اين است كه حروف بازشناسى شوند، يعنى مكان آنها از ديگر خطوط (مثل خطوط كادرى كه داخل آن نوشته شده) بازشناسى شود، و اگر متن پيوسته تايپى است، حروف جدا شوند و زوايد تصوير حذف شود. مثلاً اگر دانشآموزى «س» را به گونهى نوشت كه بيرون از كادر بود، به رايانه بفهمانيم كه بىدقتى شده است او بايد همان حرف داخل كادر را بخواند. در مرحلة بعدى كه «بازشناسى الگو» نام دارد، با تعدادى شرط مىشود فهميد كه مثلاً حرفى «الف» است يا نه، و رايانه تشخيص مىدهد كه حرف «پ» است يا «ب». براى اين تشخيص لازم است كه تصوير حرف «الف» با الفهاى نمونه ــ كه قبلاً به رايانه داده شده است ــ منطبق شود. الفباى نمونه قبلاً از روى يك مجموعه بزرگ آموزشى تهيه شده و ويژگىهاى مشترك از آن استخراج شده است. اما از آنجا كه تنوع صورتها نوشتارى يك حرف به صورت دستنويس بسيار زياد است، مدلى آمارى استخراج مىشود كه در آن شباهت ويژگىهاى استخراج شدة قبلى با نمونه ورودى به رايانه بررسى مىشود. در اينجا «بازشناسى الگو» با روشهاى آمارى انجام مىشود كه روش معمول در سيستمهاى OCR است.
اگر فكر مىكنيد كه كار تمام شده است در اشتباهيد، چون تازه مىرسيم به دنبالة حروف. مثلاً اگر كسى همان حرف «س» را با دنباله بنويسد، رايانه بايد تشخيص دهد كه اين حرف فقط «س» است، يا مثلاً «ى» هم به آن چسبيده است.
مدلسازى يا پردازش زبانى
مرحله بعدى «مدلسازى زبانى» يا «پردازش زبانى» نام دارد. حروف به هم چسبيده، كه كلمه را درست مىكنند، بايد معنىدار يا شناختهشده باشند. در اين مرحله برسى مىشود كه چه كلماتى در زبان وجود دارد؟ چه تركيبهايى از كلمات مجاز است؟ و… البته در مراحل پيشرفتهتر، مدلسازى گرامرى (دستور زبان) و مدلسازى معنايى هم وجود دارد كه تشخيص مىدهد جمله از لحاظ دستورى و معنايى درست است يا بىمفهوم است. اما در OCR گسسته ــ كه بيشتر براى ثبتنام استفاده شده ــ شباهت يك كلمه به نام، نام خانوادگى، شهر و … كافى است.
براى تشخيص تركيبهاى مجاز يك كلمه يا معنىدار بودن يك كلمه نيز به تهية بانكهاى اطلاعاتى (Data base) نياز داريم. در اين بانكها مثلاً تمام نامهاى كوچك و بزرگ ايرانيان قبلاً جمعآورى شده است و هنگام تطبيق يك كلمه با ن مشخص مىشود كه رايانه حروف آن را دست تشخيص داده يا نه. بنابراين نقش اين بانك اطلاعاتى بسيار مهم است، چون اگر نامى در آن ثبت نشده باشد، كلمهاى كه آن نام را شامل شود، به طور خودكار از برنامه OCR حذف مىشود يا پيغام مىآيد كه: «اين كلمه اشتباه است» در صورتى كه ممكن است مثلاً نام «هشام» در بين نامهاى ايرانى وجود داشته باشد، ولى قبلاً در بانك اطلاعاتى ثبت نشده باشد.
بانكهاى ما و ديگران
مهندس «رزازى» دربارة مشكل بانكهاى اطلاعاتى در زبان فارسى مىگويد: «در دنيا براى توسعة OCR و ارزيابى آن، بانكهاى اطلاعاتى استاندارد ساخته شده است كه در آنها همة كلمات وجد دارند، يعنى بانك هم مشكل ديجيتال كلمه را دارد، و هم تصويرش را. اما براى زبان فارسى، اين بانكهاى اطلاعاتى چه براى ارزيابى و چه براى توسعه، استاندارد شده نيست. در واقع هر كسى براى خودش يك بانك اطلاعاتى مىسازد، و اين نمونههاى متفاوت مشكلاتى را ايجاد مىكند. مثلاً براى ثبتنام دانشآموزانى كه در آزمون مدارس تيزهوشان شركت كرده بودند، يك بانك اطلاعاتى حاوى نامهاى فارسى، از روى اطلاعات فرمهاى سالهاى قبل، تهيه شد كه از روى آن كلماتى كه خيلى شبيه به نامهاى فارسى بودند تشخيص داده مىشد. مثلاً اگر رايانه كلمهاى را «مصيبت» تشخيص داد، براساس بانك اطلاعات معلوم مىشود كه «مصيب» بوده است كه يك نام ايرانى است.
على، ولى، قلى … و سيب
نكتة ديگر اين است كه يك بانك اطلاعاتى بايد شامل تعدادى كلمات خام باشد، بلكه «بسامد» آن واژگان، يعنى ميزان استعمال و تكرار كلمات در زبان و مشخصات آمارى آنها هم بايد ثبت شده باشد، والا كارايى زيادى ندارد. مثلاً «على» نامى است كه شباهت زيادى به «ولى» و «قلى» دارد. كارهاى آمارى در بانك اطلاعاتى بايد طورى انجام شده باشد كه تعداد «على» بيشتر باشد، تا و بعد نوبت «ولى» و «قلى» برسد، چون درصد بسامدى «على» به لحاظ آمارى و كاربرد در ميان نامهاى بيشتر است.
در OCR فارسى گسسته، اگر فقط مربط به نامها و نامخانوادگى باشد، كار سادهتر است از حالتى كه در OCR پيوسته وجود دارد. چون در OCR پيوسته هر كلمهاى ممكن است وجود داشته باشد مثل «سيب»، اما در بانك اطلاعاتى نامها همه مىدانيم كه سيب نام يك شخص نيست بلكه نام يك ميوه است! بنابراين در OCR همواره سعى مىشود كه درصد خطا كاهش يابد، تا كلمات در حد ممكن درست تشخيص داده شوند. اگرچه طراحان هنوز به صددرصد صحت نرسيدهاند، ولى نگران نتايج آزمون خود نباشيد، چون تمامى اطلاعات مربوط به شما چندين بار كنترل مىشوند و از سازوكار reject (يا مردودى) در رايانه هم استفاده مىشود. در اين روش اگر رايانه نتوانست كلمهاى را شخيص دهد، مىفهمد كه نفهميده است و در خروجىاش مىآورد كه: «من اين كلمه را نفهميدهام» و كار به سيستم دستى مىرود و در آنجا تصحيح مىشود. اين فرايند در پست خيلى كارايى دارد. در هر جاى دنيا كه تفكيك نامهها و ديگر مرسولات پستى به وسيلة OCR انجام مىشود، بعضى از نامهها در سيستم كامپيوترى وارد سازوكار «مردودى» مىشوند و به طور دستى مورد بررسى مجدد قرار مىگيرند. هماكنون در سطح محدودى از OCR در پست كشور ما نيز استفاده مىشود، چون در پست هم كد پستى چندرقمى و ديگر اطلاعات به صورت گسسته و داخل كادرهايى نوشته مىشود، و كار آسانتر است.
در مورد خطاى OCR در تشخيص كلمات، مسئولان شركت «پايا» نظر جالبى دارند:
«حتى با تعبية سيستم مردودى (reject) هم ممكن است خطايى در تشخيص كلمات وجود داشته باشد. بايد در نظر داشته باشيم كه هيچ سيستم پردازشگرى (از جمله انسان) بدون خطا نيست. نكته مهم اين است كه يك سيستم ماشينى درصد خطاى كمترى نسبت به انسان داشته باشد تا جايگزين خوبى براى انسان باشد. مسئله اين نيست كه خطا را به صفر برسانيم. هر قدر كه فناورى جلوتر مىرود، ميزان خطا هم بيشتر كاهش مىيابد.»
مدير شركت «دوران نوين» هم به گونهاى ديگر به همين موضوع اشاره مىكند: «انتظار ما از مسئولان طرح «تكفا» آن است كه با موضوع OCR واقعبينانهتر برخورد شود، و در بحث مربوط به هزينههاى پروژه و انتظاراتى كه از OCR مىرود، واقعيتها در نظر گرفته شود. ديدگاه كنونى مسئولان تكفا آن است كه كل مشكل «خطا» تا 100درصد حل شود، در حالى كه فكر مىكنم حل مسائل مربوط به هوش مصنوعى نياز به روش تدريجى دارد. مثلاً در زبان عربى هم، نرمافزار «صخر» در نسخة اول خود فقط تا حدود 40درصد دقت داشت، در حالى كه اكنون پس از گذشت 13 سال از اولين نسخه آن دقت به مرز 98 درصد رسيده است.»
همانطور كه اشاره شد از OCR در ثبتنام آزمون «سازمان ملى استعدادهاى درخشان» در سالهاى 81 و 82 استفاده شد كه از طريق آن 000,440 نفر به طور ماشينى ثبتنام شدند. اين روش باعث شد كه در سال 81 (نمونه اول) 45 درصد در هزينهها و 25 درصد در زمان ثبتنام صرفهجويى شود. در سال بعد (82) اين رقم به 50 درصد رسيد. نرمافزارى كه در اين آزمونها مورد استفاده قرار گرفت براى هر كدام از موارد صحت بازشناسى متفاوتى داشت و در مجموع كار آن خوب بود (به جدول توجه كنيد):
به نظر مىآيد كه در چند سال آينده و با پيشرفت OCR فارسى و كاهش هر چه بيشتر خطاى آن، در آزمونهاى بزرگترى مانند آزمون سراسرى دانشگاهها نيز بتوان از آن استفاده كرد.
سرنوشت OCR دستنويس
در مورد OCR پيوسته دستنويس نيز روند كار به همان صورتى است كه شرح داديم، اما آنچه كار را دشوارتر مىكند، قطعهبندى و جداجدا كردن حروف به هم چسبيده و تشخيص آنهاست. اگر اين روند طى شود، اين اميد وجود دارد كه روزى از OCR پيوسته دستنويس فارسى هم در سطح گستردهاى استفاده شود. البته OCR پيوسته دستنويس حتى در زبان انگليسى هم هنوز به كاربرد وسيع و عملى نرسيده است. مهندس «رزازى» دراين مورد مىگويد: « OCRانگليسى در سيستم عامل windows وجود دارد كه همراه با office فروخته مىشود، ولى فكر نكنيد كه نامههاى ادارى انگليسى كه با دستنويس نوشته شدهاند همه با OCR تايپ مىشوند. اين كار براى به نتيجه رسيدن به حداقل يك رون 10 ساله را بايد طى كند. OCR فارسى يك مرحله عقبتر است، پس زمان بيشترى مىبرد.»
مهندس «صديق»، مديرعامل شركت «پايا» هم مىگويد: «همين OCR فارسى گسسته هم تا چند سال پيش يك رؤيا بود، ولى ديديم كه محقق شده است و به مرور پيشرفتهتر هم خواهد شد. بنابراين طراحى OCR پيوسته فارسى هم، اگرچه سالها طول مىكشد، ولى مطمئناً به نتيجه خواهد رسيد. اين طرح يك طرح تحقيقاتى است كه در دانشگاهها دنبال مىشود و هنوز به يك محصول صنعتى قابل استفاده در سطح كلان و كاربردى براى عموم نرسيده است. ولى در حال حاضر نمونههاى دانشگاهى و آزمايشگاهى آن در داخل كشور وجود دارد و موضوع رساله دكترى برخى از دانشجويان است.»
بنابراين بين 10 تا 20 سال آينده، آنگونه كه مسئولان شركت «پايا» مىگويند، OCR پيوسته دستنويس فارسى هم وارد بازار خواهد شد.
دكتر فيلى هم در پاسخ به اين سؤال كه «آيا طراحى OCR پيوستة فارسى روزى تحقق خواهد يافت؟» پاسخ مىدهد: «بله ولى به تدريج.»
به هر حال براساس قرارداد «تكفا» با شركتهاى ايرانى، تا كمتر از يك ماه ديگر، نسخهنهايى (البته نه صددرصد تكميلشده) OCR فارسى دستنويس گسسته و تايپى پيوسته ارائه خواهد شد. مدير شركت «دوران نوين» در اين مورد مىگويد: «پروژة OCR گسسته در مراحل پايانى خود قرار دارد ولى داراى مشكلاتى در تشخيص انوا اسكنرها و انواع فونتهاست كه در حال رفع آن هستيم. اين نرمافزار در حال حاضر امكان تشخيص فونتهاى تايپى فارسى با دقت زياد را دارد، ولى مشكل جدى آن است كه با اسكنرهاى مختلف نتايج نامناسبى مىدهد.» وى از اهميت اين طرح در بعد كلان ملى هم مىگويد: «با توجه به اين كه مشكل OCR براى بسيارى از زبانهاى دنيا مانند انگليسى عملاً حل شده است، اگر در كشور ما هم به نتيجة نهايى برسد در افزايش سطح اطلاعات فارسى در دنياى ديجيتالى امروز (از جمله در اينترنت) بسيار اهميت خواهد داشت.