گوگل و يک گام بزرگ به طرف هوشمندسازى جستجو
نام نویسنده: احمد عزيزی -http://cyrex.blogspot.com
آی تی ایران – متخصصان گوگل همواره به خلاقيت و هوشمندى در کارهايشان شهرت يافته اند و اگر نگاهى به روند تکامل و پيشرفت اين جستجوگر قدرتمند و خدمات جديدى که همواره به دنياى اينترنت معرفى مى کنند بيندازيم قطعا نتيجه اى غير از اين نمى گيريم.
گوگلى ها که همواره در فکر بهبود و دقيقتر کردن نتايج جستجوى خود هستند مدتهاست که متوجه يک نقص بزرگ در جستجوگر خود شده اند که البته حل آن به اين آسانى ها هم نبود و در واقع شايد براى آنها بسيار وقت گير يا غيرممکن بود.
چندى پيش شاهد خبرى مبنى بر به خدمت گرفتن يکى از طراحان اصلى مرورگر فايرفاکس توسط گوگل بوديم که عده اى از آن اين طور برداشت کردند که گوگل قصد دارد در آينده مرورگرى شبيه به فايرفاکس و در رقابت با مايکروسافت ارائه کند. اما در واقع با وجود مرورگر بازمتنى مثل فايرفاکس چرا گوگل بايد چنين کارى انجام دهد و در شرايطى که درگير رابت بسيار سنگينى با ديگر رقباى خود است به فکر سرمايه گذارى در پروژهاى طولانى مدت که انتظار سود چندانى هم از آن نمى رود باشد؟
همان طور که مى دانيد صفحات وب حاوى مطالب، نوشته ها، تصاوير و اجزاى ديگرى هستند که همه آنها توسط تگهاى HTML در کنار هم قرار مى گيرند و يک صفحه وب را مى سازند. در واقع اين تگهاى HTML هستند که صفحات وب را آذين بندى مى کنند. نحوه نمايش متون مانند نوع فونت، اندازه، ضخامت و رنگ، محل قرار گيرى تصاوير و نوشته ها، پيوند به صفحات ديگر و … همه از طريق اين تگها انجام مى گيرد.
وقتى که شما آدرس يک صفحه اينترنتى را در مرورگر خود وارد مى کنيد، مرورگر شا تگهاى موجود در آن صفحه را خوانده و با پردازش آنها صفحه را آنطور که بايد نمايش مى دهد. اما وقتى که يک موتور جستجو يک صفحه اينترنتى را باز مى کند چه اتفاقى مى افتد؟ مطمئنا يک برنامه کامپيوترى قصد نگاه کردن به يک صفحه و اجزاى بصرى آن را ندارد و تنها مى خواهد لغات کليدى و مطالب و موضوع آن صفحه را استخراج کند تا بتواند آن را رتبه بندى کرده و در نتايج جستجوى خود نشان دهد.
((گوگل مى خواهد صفحات وب را از دريچه ديد يک کاربر اينترنت ببيند))
اما اين کار به اين آسانى ها هم نيست. بيشتر صفحات وب داراى مطالب و نوشته هاى فرعى زيادى هستند که هيچ ربطى هم به مطلب اصلى ندارند و حتى گاهى مطلب اصلى در ميان آنها گم مى شود. به عنوان مثال بسيارى از صفحات وب داراى ستونهايى در سمت چپ و راست صفحه هستند که حاوى لينک به صفحات ديگر، عبارتهاى تبليغاتى، اخبار و … هستند که همه اينها مى تواند جستجوگر را گمراه کند.
براى تشخيص مطلب اصلى يک صفحه وب از مطالب ديگر تنها يک راه مطمئن وجود دارد و آن اين است که از دريچه ديد يک کاربر به صفحه نگاه کرد و از طريق آن در يک صفحه شلوغ بتوان به عنوان مثال عنوان و متن مقاله موجود در صفحه را تشخيص داده و آن را ملاک جستجو براى آن صفحه قرار داد.
گوگل هم در واقع دارد به همين سمت پيش مى رود و مى خواهد از اين طريق نتايج خود را قيق کند. از طرفى همواره در حال مبارزه با اسپمرها بوده است. بسيارى از طراحان وب عبارتهاى تبليغاتى را طورى در درون صفحات خود قرار مى دهند که در مرورگر قابل مشاهده نباشد و تنها موتورهاى جستجو آن را فهرست کنند که تشخيص اين حقه هم تنها از اين طريق امکان پذير مى باشد.
البته به نظر مى رسد که مايکروسافت هم در جستجوگر جديد MSN از روش مشابهى استفاده کرده است.
به اميد روزى که همه ما بتوانيم با پرسيدن سوال خود از موتورهاى جستجو، جواب آن را مستقيما بگيريم.