تکنولوژی

وب پنهان؛ وراى جستجو گرها!

نام نویسنده: مهدى رودکى

هفته نامه سروش، – حقيقت آن است که چالش عمده ما در عصر حاضر، فقدان اطلاعات در وب نيست، بلکه دسترسى به اطلاعات مهمتر شده است. آنهم دسترسى به آخرين
اطلاعات در سريعترين زمان ممکن.

وب اطلاعات بى شمارى دارد، که در آن مى توانيم درباره موضوعاتى از \”پرورش لاک پشت\” تا \”طراحى موشک\” مطالبى بيابيم. اما کجا؟ به عبارت ديگر در کدام سايت؟

وب راهنمايى دارد که به کاربران براى يافتن اطلاعات کمک مى کند. سايتهايى وجود دارند که
کاربران وب با مراجعه به آنها پاسخ سوالات خود را مى يابند. ما اينگونه سايتها را با عنوان
\”موتورهاى جستجوگر\” مى شناسيم.

در حقيقت موتور جستجوگر سايتى است که کاربر وب با مراجعه به آن و نوشتن چند کلمه مى تواند هزاران پاسخ براى سوال خود بيابد.

علاوه بر مراجعه به موتورهاى جستجوگر يکى از راههاى ديگر جستجوى اطلاعات، استفاده از \”وب پنهان\” است. اما به راستى وب پنهان چيست؟

اطلاعات موجود در اينترنت را مى توان به سه دسته زير تقسيم بندى کرد:

1. اطلاعات رايگان و پيدا
2. اطلاعات رايگان و ناپيدا
3. اطلاعات تجارى

اطلاعات رايگان و پيدا اطلاعاتى هستند که در دسترس همگان قرار داده شده اند و با جستجو در
موتورهاى جستجوگر مى توانيم آنها را بيابيم.
موتور جستجوگر هر چقدر هم از پايگاه داده بزرگى برخوردار باشد، نمى تواند تمام اطلاعات وب را در خود داشته باشد.
اطلاعات تجارى اطلاعاتى هستند که براى استفاده از آن ها بايد پولى معادل ارزش آن، پرداخت شود. و در آخر اطلاعات رايگان و ناپيدا اطلاعاى اند که هر چند دسترسى به آنان مستلزم هزينه اى نمى باشد، اما نمى توانيم از طريق موتورهاى جستجوگر به آنها دسترسى داشته باشيم.

وب پنهان چيست؟

در حقيقت بخش اعظم وب از دسترسى موتورهاى جستجوگر دور است که به آن وب پنهان گفته مى شود، و در بردارنده اطلاعات رايگان و ناپيداست. در مقابل مى توانيد وب نمايان را بخشى از وب بدانيد که موتورهاى جستجوگر مى توانند به آن دسترسى داشته باشند و در نتايج جستجو به مراجعه کنندگان خود نمايش دهند.

وب پنهان شامل موارد ذيل است:

1. پايگاههاى داده قابل جستجو
بخش اعظم وب پنهان همين پايگاههاى داده هستند.
براى استفاده از اطلاعات موجود در آنها ابتدا بايد کاربر فرمى را پر کند. چون موتور جستجوگر
توانايى انجام اين کار را ندارد بنابراين نمى تواند به اطلاعات آن دسترسى داشته باشد.

در اين پايگاههاى داده متناسب با نياز کاربر صفحه ساخته مى شود و با توجه به حجم بالاى
اطلاعات عملا نمى توان تمام حالتهاى مورد نياز کاربر را شناسايى کرد و از قبل براى آن صفحه اى ساخت. اگر کاربرى لينک مستقيمى به يکى از اين صفحات توليد شده ايجاد کند آنگاه موتور جستجوگر شايد بتواند به آن اطلاعات دسترسى پيدا کند.

2. صفحات منفک شده
پاره اى از صفحات نيز به دلايلى از تيررس موتورهاى جستجوگر دور نگاه داشته شده اند. سياست کارى صاحبان سايتها و ضعف طراحان سايتها مهم ترين اين دلايل هستند. فايلهاى پنهان، اسناد نيازمند رمز عبور براى خواندن و پايگاههاى داده تجارى ( که استفاده از اطلاعات به شرط پرداخت حق عضويت در سايت است)، را مى توان در اين گروه قرار داد.

آخرين مطالعه آکادميک صورت گرفته نشان مى دهد که وب نمايان 11.5 ميليارد سند دارد. در حالى که موتورهاى جستجوگر 85 درصد آنرا مى شناسند.
اين مطالعه همچنين حجم \”وب پنهان\” را 500 ميليارد سند برآورد کرده است.
در اين مطالعه گوگل با بايگانى کردن 8.1 ميليارد سند رتبه اول را دارد (69.6 درصد) و پس از آن ياهو با 6.6 ميليرد صفحه (57.4 درصد) در جايگاه دوم قرار گرفته است.
با اين که مطالعه انجام شده بر اساس تخمينهاى بسيار بوده است اما در نوع خود يکى از آخرين تلاشها براى برآورد حجم واقعى وب و ميزان پوشش آن توسط موتورهاى جستجوگر است.
چگونه وب نامريى را مريى کنيم؟

براى استفاده از وب پنهان ابتدا بايد آدرس يکى از آنها را به کمک موتورهاى جستجوگر بيابيد. به
عنوان مثال اگر موضوع پزشکى مد نظر شماست، کافيست که در گوگل اينگونه جستجو کنيد: پايگاه داده پزشکى يا پايگاه داده علوم پزشکي. در هر صورت کلمه \”پايگاه داده\” يا \”Database\” يک کلمه کليدى است.
به هر حال اولين نکته در استفاده از و پنهان اين است که فراموش نکنيد که \”وب پنهانى\” وجود دارد و صرف کمى وقت براى استفاده از آنها مى تواند مکمل مناسبى باشد براى آنچه که از طريق موتورهاى جستجوگرى نظير ياهو و گوگل مى يابيد.برخى از عناصر وب پنهان عبارتند از :
• Librarians Index
• AcademicInfo
• Infomine
با استفاده از www.invisible-web.net مى توانيد موارد بسيار ديگرى از وب پنهان متناسب با نيازتان را مشخص کنيد.
نتيجه

اينترنت منبع مهمى براى دستيابى به اطلاعات معتبر و موثق است. مهم آن است که کاربر تکنيکهاى جستجو و ارزيابى اطلاعات را بداند تا بتواند بهتر و سريعتر به آنچه که ى جواهد دست يابد. از سوى ديگر تمام اطلاعات از طريق موتورهاى جستجوگر قابل دسترسى نيست.

ماهيت تجارى بسيارى از سايتها و همينطور محدوديتهاى تکنولوژيکى موتور جستجوگر را از
دسترسى به تمام اطلاعات وب دور مى کند. در اين مورد کاربر بايد بتواند از اطلاعات موجود در \”وب پنهان\” بهره گيرد.

نوشته های مشابه

دیدگاهتان را بنویسید

دکمه بازگشت به بالا