تکنولوژی

دامنه‌های اینترنتی بین‌المللی و .ایران

نام نویسنده: دکتر سیاوش شهشهانی

هفته نامه بزرگراه فناوری – اصطلاح سه حرفی IDN اختصار Internationalized Domain Names (نام دامنه‌های بین‌المللی شده) است. نکته این است که نظام دامنه‌های اینترنتی و پروتکل نظام کارگزارهای دامنه (DNS) به گونه‌ای طراحی شده است که فقط ۲۶ حرف الفبای لاتین، ده رقم رایج در زبان‌های اروپایی و خط تیره را می‌پذیرد، و بنابراین برای استفاده از علایم دیگر مانند الفباهای غیرلاتین یا حتی علایمی که در بعضی زبان‌های اروپایی به کار می‌رود چون accent فرانسه، umlaut آلمانی و علایم دیگری که در نوشتارهای زبانهای اسکاندیناوی به کار می‌رود می‌بایست یا تغییرات اساسی در نظام دامنه صورت گیرد و یا تمهیداتی جهت تبدیل الفباها و علایم بین‌المللی به نشانه‌های مجاز در DNS در نظر گرفته شود.

از حدود سال ۱۹۹۶ کارهای تحقیقاتی جهت پیاده‌سازی روش دوم ظاهر شد و اولین اجرای عملی در سال ۱۹۹۸ در سنگاپور برای الفبای چینی صورت گرفت که به سرعت به اکثر کشورهای آسیای شرقی و پس از آن به سایر مناطق جهان تسری یافت. این نظام مبتنی بر استفاده از UTF8 است که خود برگرفته از یونی‌کُد (UNICODE)، نظام جهانی کدگذاری الفباها و سایر علایم رایج نوشتای است. در این سامانه یک الگوریتم فشرده سازی علایم UTF8 موسوم به punycode مورد استفاده قرار می‌گیرد. باید توجه داشت که نوعی فشرده‌سازی در این فرایند اجتناب‌ناپذیر است زیرا که تعداد نشانه‌های مجاز (۶۳) برای نام دامنه در DNS امکان استفاده از کدهای به نسبت طولانی UTF8 را غیرممکن می‌سازد. دامنه‌هایی که به punycode نوشته می‌شوند با پیشوند xn- – آغاز شده و به این ترتیب شناسایی می‌شوند. استاندارد این فرایند موسوم به IDNA توسط ستاد مهندسی اینترنت (IETF) تدوین شده است و در حال حاضر در میان الفباهای مبتنی بر الفبای عربی، الفباهای زبان عربی، فارسی، اردو و پشتو در این استاندارد گنجانده شدهاند که این کار تا حد زیادی مرهون کوشش‌های آقای مهندس روزبه پورنادر است.

فکر ثبت دامنه به فارسی از اوایل دههٔ ۱۳۸۰ در مرکز ثبت دامنه .ir شکل گرفت. در بررسی‌های مقدماتی به کمک آقای پورنادر معلوم شد که ثبت دامنه به فارسی متضمن دشواری‌های خاصی است که باید در طراحی مورد توجه قرار گیرد. بعضی از این مشکلات میان همهٔ الفباهای راست به چپ مشترکند و مشکل وقتی تشدید می‌شود که مانند فارسی و عربی اعداد از چپ به راست نوشته می‌شوند و اگر عدد یا رقمی در آغاز یا پایان نام دامنه موجود باشد ابهامات اجرایی ایجاد می‌کند. از این مشکل بدینصورت اجتناب شد که مقرر گردید ارقام در ابتد و انتهای دامنه‌های فارسی مجاز نباشند. مشکل دوم این بود که بعضی حروف ممکن است به حرف بعدی چسبانده شوند یا نشوند و دو لغت مختلف ایجاد می‌شود. این در حالی است که در سامانه DNS استفاده از فاصله برای جداسازی حروف مجاز نیست. مثلاً دامنه‌های «سرمه‌ای تیر» و «سرمهای تیر» که دو معنی مختلف دارند در DNS به یک صورت ظاهر می‌شوند و فاصله میان «ه‍« و «ا» در «سرمه‌ای» در DNS مجاز نیست. این مسأله بدینصورت حل شده است که از «نیم فاصله» یا «فاصله مجازی» که روی صفحه کلید فارسی تعبیه شده است برای وارد کردن داده به صورت مورد نظر استفاده می‌شود ولیکن دو لغت بالا به یک صورت در DNS ثبت می‌شود. بنابراین چنانچه مثلاً سازمانی به نام «سرم سازی تیر» دامنه «سرمهای تیر» را ثبت کند، دیگر ثبت «سرمه‌ای تیر» میسر نخواهد بود. مشکل مشابهی در مورد نقطه‌ای که برای اختصار به کار می‌رود موجود است که به روشی مشابه حل شده است. مثلاً دامنه «هزار و سی صد و بیست و چهار ه‍ . ق.» این مشکل را دارد که نقطه‌های ه‍.ق. در نام دامنه مجاز نیستند، ولی می‌توان با صفحه کلید فارسی نقطه مانندی را اجرا کرد که به چشم قابل رؤیت باشد ولی در DNS ثبت نشود. بالاخره بزرگترین مشکل، تفاوتهای میان حروف «ک» و «ی» فارسی و عربی و نیز ارقام فارسی و عربی است. حروف «ک» و «ی» به صورت کوچک که در آغاز یا میان کلمه ظاهر می‌شود در فارسی و عربی یکی است ولی حروف بزرگ آنها متفاوت است: «ک» در فارسی و «ك» در عربی، «ی» در فارسی و «ي» در عربی. به سبب این تمایز حروف بزرگ، کد صورتهای فارسی و عربی «ک» و «ی» در یونی‌کد متفاوت است. همچنین کلیه ارقام فارسی و عربی دارای کدهای متفاوت هستند در حالی که تنها تمایز قابل رؤیت میان فارسی و عربی در ارقام ۴، ۵ و ۶ است. اضافه براین، در بعضی صفحه کلید‌های فارسی ارقام به صورت لاتین ظاهر می‌شود با کد فارسی، یا بالعکس. این پدیده موجب می‌شود که بتوان دو دامنه با کدهای مختلف ثبت کرد که عیناً به یک صورت ظاهر شوند و این امکان راه را برای انواع سوء‌استفاده یا اشتباهات غیرعمدی باز می‌کند. حل این معضل با ایجاد «بسته» (bundle) دامنه صورت گرفت، بدین ترتیب که وقتی یک دامنه فارسی ثبت می‌شود، چنانچه کدهای دیگری موجود باشند که همین شکل را تولید کنند، این کدها خود به خود همراه دامنه برای ثبت‌کننده محفوظ می‌شوند بدون آنکه ثبت‌کننده نیازی به ثبت آنها داشته باشد. بدین‌ترتیب ممکن است در بعضی موارد در قبال ثبت یک دامنه فارسی، ثبت‌کننده عملاً تا شش دامنه را برای خود محفوظ بدارد. یک نکته جالب توجه اینکه دامنه مرتبه اول .ایران که اکنون در انتهای دامنه‌های فارسی ثبت شده توسط مرکز ثبت دامنه .ir ظاهر می‌شود خود مشمول این مشکل است یرا که کلمهٔ «ایران» حرف «ی» (به صورت کوچک آن) را دربردارد. بدین ترتیب در ازای ۲۲۲۲ دامنه ثبت شده فارسی در زمان نگارش این مقاله، عملاً ۷۲۲۴ عدد رکورد در کارگزار دامنه مرکز ثبت دامنه ثبت شده است.

پیاده‌سازی عملی راه‌حل‌های بالا از یک طرف و آماده‌سازی کارگزار ثبت دامنه که سازگار با تمهیدات فوق باشد از اواخر سال ۱۳۸۲ زیر نظر آقای مهندس علیرضا صالح در مرکز ثبت دامنه .ir شروع شد و در زمستان سال ۱۳۸۳ دورهٔ آزمایشی ثبت دامنه فارسی دایر گردید. در این دوره علاوه بر پسوند .ایران چهارده پسوند دیگر مانند .فرهنگی، .دولتی، …. نیز به طور آزمایشی عرضه شد ولی نهایتاً به دو دلیل فقط پسوند .ایران جهت استفاده رسمی اتخاذ گردید. یکی اینکه استقبال از این دامنه به مراتب بیشتر از سایر دامنه‌ها بود: نیمی از دامنه‌های آزمایشی ثبت شده تحت .ایران بودند و نیمه دیگر به طور حدوداً مساوی میان ۱۴ دامنه مرتبه اول دیگر توزیع شد. نکتهٔ دیگر اینکه بعضی پسوندهای دیگر با زبان عربی مشترک بودند و استفاده از آنها متضمن هماهنگی با کشورهای عربی بود که هنوز میان خود به هماهنگی کامل نرسیده‌اند ودر هر صورت در این زمینه پیشرفت آنها محدود است. ثبت رسمی دامنه‌های فارسی تحت .ایران از مهر۱۳۸۴ آغاز شد و در چند ماه اول، نخست محدود به دستگاههای عمومی و اسامی عیناً دارای جواز ثبتی و سپس در مرحله دوم مختص کسانی بود که در دورهٔ آزمایشی اقدام به ثبت دامنه کرده بودند. بالاخره در زمستان ۱۳۸۵ امکان ثبت دامنه‌های http://www.nic.ir/idn/ موجود است. دو مشخصه دامنه‌های فارسی تحت .ir را در مقایسه با IDN کشورهای دیگر را می‌توان به اینصورت برشمرد:

۱- برای ثبت دامنه‌های فارسی می‌توان از صفحه کلید فارسی استفاده کرد و لغت فارسی مورد نظر را وارد نمود. در اکثر کشورها دامنه به خط محلی باید به صورت ترجمهٔ punycode آن، یعنی به شکل xn- – ثبت گردد که عملاً بسیاری از استفاده‌کنندگان معمولی را منصرف می‌کند. در غرب و جنوب آسیا ایران تنها کشوری است که در آن می‌توان مستقیماً به الفبای بومی دامنه ثبت کرد.

۲- ظاهراً ایران اولین کشوری است که ایدهٔ بسته (bundle) را پیاده‌سازی کرده است. در کشورهای آسیای شرقی، علیرغم تنوع زبانها، یک نظام یونی‌‌کد واحد چینی، ژاپنی و کره‌ای را فرا می‌گیرد، بنابراین برخلاف فارسی – عربی امکان تشابه شکلی برای کدهای مختلف موجود نیست. در میان ثبت‌کنندگان دامنه به زبانهای اروپایی چه آنهایی که مستقیماً به صورت punycode ثبت می‌کنند و چه آنهایی که از علایم محلی استفاده می‌کنند، استفاده از بسته معمول نشده است، بنابراین منازعات حقوقی ناشی از تشابه‌های شکلی رایج است و چند مورد در دو سال گذته مشکلات و جنجال‌های فراوانی ایجاد کرد.

با توجه به این مشخصات، سامانه دامنه‌های فارسی تحت .ایران به عنوان یکی از پیشرفته‌ترین سامانه‌های موجود IDN در جهان مورد استقبال و تحسین بین‌المللی قرار گرفته است که بعداً به فعالیت‌های بین‌المللی مرکز ثبت دامنه در این زمینه اشاره خواهد شد. علیرغم این موفقیت، استقبال داخلی از دامنه‌های فارسی چندان گرم نیست و تاکنون اندکی بیش از ۲۲۰۰ دامنه فارسی تحت .ایران ثبت شده است. در همین فاصله زمانی تعداد لاتین ثبت شده تحت .ir بیش از ۱۳۸۵۰، یعنی حدوداً ۶۳ برابر است. دلایل زیر را می‌توان برای این عدم استقبال ذکر کرد:

۱- تقریباً همهٔ کاربران فعلی اینترنت در ایران آنقدر به زبان انگلیسی آشنایی دارند که بتوانند به راحتی از دامنه‌های لاتین استفاده کنند و نیازی به استفاده از دامنه‌های فارسی احساس نمی‌کنند. توجه کنید که برای داشتن یک سایت کاملاً فارسی نیازی به دامنه فارسی نیست. در این مورد باید به این برتری دامنه فارسی برای سایت‌های فارسی اشاره شود که چون روش استانداردی برای برگرداندن یک نام فارسی به لاتین وجود ندارد، به کار گرفتن یک نام دامنه فارسی (اضافه بر نام دامنه لاتین) می‌تواند کمک بزرگی به جستجوگر ایرانی باشد. مثلاً فرض کنید «اتحادیهٔ حلبی‌سازان قوچان» سایتی دایر کرده باشد. دس اینکه نام دامنه مربوط به لاتین به چه صورتی است بسیار دشوار است زیرا که می‌توان این نام را به دهها صورت به لاتین برگرداند یا خلاصه کرد ولی موجود بودن اصل فارسی نام کامل می‌تواند جوینده را مستقیماً به سایت هدایت کند. بنابراین توصیه می‌شود حتی در مواردی که نام دامنه‌ای به لاتین موجود است یک نام فارسی که به وضوح به همان سایت اشاره دارد نیز برای کمک به مراجعان ایرانی ثبت شود.

۲- اکثر استفاده‌کنندگان از اینترنت در ایران از Microsoft Internet Explorer استفاده می‌کند که در حال حاضر از IDN پشتیبانی نمی‌کند، بنابراین استفاده‌کنندگان یا باید plug-in مناسب نصب کنند (راهنمایی لازم در سایت www.nic.ir آمده است) یا از مرورگرهای وابسته به Mozilla استفاده کنند. خوشبختانه این مشکل در حال رفع شدن است. در IE7 و نیز Outlook7 که صورت «بتا» آنها هم اکنون موجود است و احتمالاً تا آخر سال میلادی صورت استاندارد آنها وارد بازار خواهد شد، IDN وارد شده است.

۳- مشکل دیگر برخی تفاوت‌های فنی میان تنظیم کارگزار دامنه‌های IDN با دامنه‌های معمول لاتین است که رابطان فنی ابتدا به ساکن با آن آشنایی ندارند. برای رفع این مشکل، مرکز ثبت دامنه .ir کلاسهای چند ساعته‌ای برای رابطان فنی دایر کرد که در صورت نیاز ارائه آنها تکرار خواهد شد. به نظر می‌رسد چنانچه فروشندگان دامنه که نوعاً تنظیمات فنی کارگزار دامنه را نیز به عهده دارند آشنایی لازم را با این مقوله کسب کنند، رواج دامنه‌های فارسی سرعت یابد.

بالاخره لازم است به فعالیت مرکز ثبت دامنه .ir در سطح بین‌المللی برای اشاعه استفاده از IDN اشاره‌ای شود. این مرکز علاوه بر شرکت مستمر در فعالیتهای IDN سازمان ICANN و ارائه گزارش و سخنرانی در نشستهای آن مؤسسه در فعالیتهای و جلسات مؤسسات دیگر مانند IETF، ITU و MINC نیز شرکت داشته است. اخیراً یک کارگزار آزمایشی MINC (مخففMultilingual Internet Names (Consortium جهت دامنه‌های IDN در جهان با کمک آقای مهندس صالح راه‌اندازی شد. اتحادیه بین‌المللی مخابرات از راه دو (ITU) اخیراً فعالیت گسترده‌ای را در زمینه IDN آغاز کرده است و گروه مطالعاتی ویژه‌ای را جهت جلب همفکری دست‌اندرکاران در IDN تأسیس کرده است که مرکز ثبت دامنه .ir با آن همکاری و مشارکت دارد. گزارش کامل نشست اخیر ITU در این زمینه در نشانی زیر قابل دسترسی است:

http://www.itu.int/ITU-T/multilingual/programme.html

مسأله مهم مطرح که فعالیت ITU و MINC را اخیراً افزایش داده است کند بودن ICANN در پاسخگوئی به نیازهای گسترش IDN است. آیکان به عنوان متولی کارگزارهای ریشه هنوز اقدام به ثبت دامنه‌های مرتبهٔ اول IDN در کارگزارهای ریشه نکرده است. این بدان معنی است که مثلاً گر کسی در خارج کشور (یا حتی در بیشتر موارد داخل کشور) بخواهد به نشانی مختوم به .ایران وصل شود باید پسوند .ir را نیز در طرف راست اضافه کند. حل بعضی اشکالهای فنی دخیل در امنیت شبکه در این کندی اثرگذار بوده است ولی به زعم بعضی، نفوذ مراکز ثبت تجاری پرقدرت مانند Verisign (مرکز ثبت .com و .net) و Afilias (مرکز ثبت .org و .info ) در این امر بی‌اثر نبوده است زیرا ثبت‌کنندگان تجاری مدتی است در پی تحقق پروژه‌ای به نام DNames هستند که به وسیله آن می‌توانند دامنه‌های ثبت شده مثلاً تحت .com را به طور خودکار به زبانهای دیگر ترجمه کنند و چنانچه این برنامه تحقق پذیرد قدرت انحصاری این شرکتها را بیش از پی افزایش خواهد داد و این امر مورد اعتراض شرکتهای کوچکتر و مراکز ثبت دامنه‌های کشوری است و ممکن است در آینده نزدیک شاهد اعتراض‌های دامنه‌دارتری در این زمینه باشیم.

نوشته های مشابه

دیدگاهتان را بنویسید

دکمه بازگشت به بالا