دامنههای اینترنتی بینالمللی و .ایران
نام نویسنده: دکتر سیاوش شهشهانی
هفته نامه بزرگراه فناوری – اصطلاح سه حرفی IDN اختصار Internationalized Domain Names (نام دامنههای بینالمللی شده) است. نکته این است که نظام دامنههای اینترنتی و پروتکل نظام کارگزارهای دامنه (DNS) به گونهای طراحی شده است که فقط ۲۶ حرف الفبای لاتین، ده رقم رایج در زبانهای اروپایی و خط تیره را میپذیرد، و بنابراین برای استفاده از علایم دیگر مانند الفباهای غیرلاتین یا حتی علایمی که در بعضی زبانهای اروپایی به کار میرود چون accent فرانسه، umlaut آلمانی و علایم دیگری که در نوشتارهای زبانهای اسکاندیناوی به کار میرود میبایست یا تغییرات اساسی در نظام دامنه صورت گیرد و یا تمهیداتی جهت تبدیل الفباها و علایم بینالمللی به نشانههای مجاز در DNS در نظر گرفته شود.
از حدود سال ۱۹۹۶ کارهای تحقیقاتی جهت پیادهسازی روش دوم ظاهر شد و اولین اجرای عملی در سال ۱۹۹۸ در سنگاپور برای الفبای چینی صورت گرفت که به سرعت به اکثر کشورهای آسیای شرقی و پس از آن به سایر مناطق جهان تسری یافت. این نظام مبتنی بر استفاده از UTF8 است که خود برگرفته از یونیکُد (UNICODE)، نظام جهانی کدگذاری الفباها و سایر علایم رایج نوشتای است. در این سامانه یک الگوریتم فشرده سازی علایم UTF8 موسوم به punycode مورد استفاده قرار میگیرد. باید توجه داشت که نوعی فشردهسازی در این فرایند اجتنابناپذیر است زیرا که تعداد نشانههای مجاز (۶۳) برای نام دامنه در DNS امکان استفاده از کدهای به نسبت طولانی UTF8 را غیرممکن میسازد. دامنههایی که به punycode نوشته میشوند با پیشوند xn- – آغاز شده و به این ترتیب شناسایی میشوند. استاندارد این فرایند موسوم به IDNA توسط ستاد مهندسی اینترنت (IETF) تدوین شده است و در حال حاضر در میان الفباهای مبتنی بر الفبای عربی، الفباهای زبان عربی، فارسی، اردو و پشتو در این استاندارد گنجانده شدهاند که این کار تا حد زیادی مرهون کوششهای آقای مهندس روزبه پورنادر است.
فکر ثبت دامنه به فارسی از اوایل دههٔ ۱۳۸۰ در مرکز ثبت دامنه .ir شکل گرفت. در بررسیهای مقدماتی به کمک آقای پورنادر معلوم شد که ثبت دامنه به فارسی متضمن دشواریهای خاصی است که باید در طراحی مورد توجه قرار گیرد. بعضی از این مشکلات میان همهٔ الفباهای راست به چپ مشترکند و مشکل وقتی تشدید میشود که مانند فارسی و عربی اعداد از چپ به راست نوشته میشوند و اگر عدد یا رقمی در آغاز یا پایان نام دامنه موجود باشد ابهامات اجرایی ایجاد میکند. از این مشکل بدینصورت اجتناب شد که مقرر گردید ارقام در ابتد و انتهای دامنههای فارسی مجاز نباشند. مشکل دوم این بود که بعضی حروف ممکن است به حرف بعدی چسبانده شوند یا نشوند و دو لغت مختلف ایجاد میشود. این در حالی است که در سامانه DNS استفاده از فاصله برای جداسازی حروف مجاز نیست. مثلاً دامنههای «سرمهای تیر» و «سرمهای تیر» که دو معنی مختلف دارند در DNS به یک صورت ظاهر میشوند و فاصله میان «ه« و «ا» در «سرمهای» در DNS مجاز نیست. این مسأله بدینصورت حل شده است که از «نیم فاصله» یا «فاصله مجازی» که روی صفحه کلید فارسی تعبیه شده است برای وارد کردن داده به صورت مورد نظر استفاده میشود ولیکن دو لغت بالا به یک صورت در DNS ثبت میشود. بنابراین چنانچه مثلاً سازمانی به نام «سرم سازی تیر» دامنه «سرمهای تیر» را ثبت کند، دیگر ثبت «سرمهای تیر» میسر نخواهد بود. مشکل مشابهی در مورد نقطهای که برای اختصار به کار میرود موجود است که به روشی مشابه حل شده است. مثلاً دامنه «هزار و سی صد و بیست و چهار ه . ق.» این مشکل را دارد که نقطههای ه.ق. در نام دامنه مجاز نیستند، ولی میتوان با صفحه کلید فارسی نقطه مانندی را اجرا کرد که به چشم قابل رؤیت باشد ولی در DNS ثبت نشود. بالاخره بزرگترین مشکل، تفاوتهای میان حروف «ک» و «ی» فارسی و عربی و نیز ارقام فارسی و عربی است. حروف «ک» و «ی» به صورت کوچک که در آغاز یا میان کلمه ظاهر میشود در فارسی و عربی یکی است ولی حروف بزرگ آنها متفاوت است: «ک» در فارسی و «ك» در عربی، «ی» در فارسی و «ي» در عربی. به سبب این تمایز حروف بزرگ، کد صورتهای فارسی و عربی «ک» و «ی» در یونیکد متفاوت است. همچنین کلیه ارقام فارسی و عربی دارای کدهای متفاوت هستند در حالی که تنها تمایز قابل رؤیت میان فارسی و عربی در ارقام ۴، ۵ و ۶ است. اضافه براین، در بعضی صفحه کلیدهای فارسی ارقام به صورت لاتین ظاهر میشود با کد فارسی، یا بالعکس. این پدیده موجب میشود که بتوان دو دامنه با کدهای مختلف ثبت کرد که عیناً به یک صورت ظاهر شوند و این امکان راه را برای انواع سوءاستفاده یا اشتباهات غیرعمدی باز میکند. حل این معضل با ایجاد «بسته» (bundle) دامنه صورت گرفت، بدین ترتیب که وقتی یک دامنه فارسی ثبت میشود، چنانچه کدهای دیگری موجود باشند که همین شکل را تولید کنند، این کدها خود به خود همراه دامنه برای ثبتکننده محفوظ میشوند بدون آنکه ثبتکننده نیازی به ثبت آنها داشته باشد. بدینترتیب ممکن است در بعضی موارد در قبال ثبت یک دامنه فارسی، ثبتکننده عملاً تا شش دامنه را برای خود محفوظ بدارد. یک نکته جالب توجه اینکه دامنه مرتبه اول .ایران که اکنون در انتهای دامنههای فارسی ثبت شده توسط مرکز ثبت دامنه .ir ظاهر میشود خود مشمول این مشکل است یرا که کلمهٔ «ایران» حرف «ی» (به صورت کوچک آن) را دربردارد. بدین ترتیب در ازای ۲۲۲۲ دامنه ثبت شده فارسی در زمان نگارش این مقاله، عملاً ۷۲۲۴ عدد رکورد در کارگزار دامنه مرکز ثبت دامنه ثبت شده است.
پیادهسازی عملی راهحلهای بالا از یک طرف و آمادهسازی کارگزار ثبت دامنه که سازگار با تمهیدات فوق باشد از اواخر سال ۱۳۸۲ زیر نظر آقای مهندس علیرضا صالح در مرکز ثبت دامنه .ir شروع شد و در زمستان سال ۱۳۸۳ دورهٔ آزمایشی ثبت دامنه فارسی دایر گردید. در این دوره علاوه بر پسوند .ایران چهارده پسوند دیگر مانند .فرهنگی، .دولتی، …. نیز به طور آزمایشی عرضه شد ولی نهایتاً به دو دلیل فقط پسوند .ایران جهت استفاده رسمی اتخاذ گردید. یکی اینکه استقبال از این دامنه به مراتب بیشتر از سایر دامنهها بود: نیمی از دامنههای آزمایشی ثبت شده تحت .ایران بودند و نیمه دیگر به طور حدوداً مساوی میان ۱۴ دامنه مرتبه اول دیگر توزیع شد. نکتهٔ دیگر اینکه بعضی پسوندهای دیگر با زبان عربی مشترک بودند و استفاده از آنها متضمن هماهنگی با کشورهای عربی بود که هنوز میان خود به هماهنگی کامل نرسیدهاند ودر هر صورت در این زمینه پیشرفت آنها محدود است. ثبت رسمی دامنههای فارسی تحت .ایران از مهر۱۳۸۴ آغاز شد و در چند ماه اول، نخست محدود به دستگاههای عمومی و اسامی عیناً دارای جواز ثبتی و سپس در مرحله دوم مختص کسانی بود که در دورهٔ آزمایشی اقدام به ثبت دامنه کرده بودند. بالاخره در زمستان ۱۳۸۵ امکان ثبت دامنههای http://www.nic.ir/idn/ موجود است. دو مشخصه دامنههای فارسی تحت .ir را در مقایسه با IDN کشورهای دیگر را میتوان به اینصورت برشمرد:
۱- برای ثبت دامنههای فارسی میتوان از صفحه کلید فارسی استفاده کرد و لغت فارسی مورد نظر را وارد نمود. در اکثر کشورها دامنه به خط محلی باید به صورت ترجمهٔ punycode آن، یعنی به شکل xn- – ثبت گردد که عملاً بسیاری از استفادهکنندگان معمولی را منصرف میکند. در غرب و جنوب آسیا ایران تنها کشوری است که در آن میتوان مستقیماً به الفبای بومی دامنه ثبت کرد.
۲- ظاهراً ایران اولین کشوری است که ایدهٔ بسته (bundle) را پیادهسازی کرده است. در کشورهای آسیای شرقی، علیرغم تنوع زبانها، یک نظام یونیکد واحد چینی، ژاپنی و کرهای را فرا میگیرد، بنابراین برخلاف فارسی – عربی امکان تشابه شکلی برای کدهای مختلف موجود نیست. در میان ثبتکنندگان دامنه به زبانهای اروپایی چه آنهایی که مستقیماً به صورت punycode ثبت میکنند و چه آنهایی که از علایم محلی استفاده میکنند، استفاده از بسته معمول نشده است، بنابراین منازعات حقوقی ناشی از تشابههای شکلی رایج است و چند مورد در دو سال گذته مشکلات و جنجالهای فراوانی ایجاد کرد.
با توجه به این مشخصات، سامانه دامنههای فارسی تحت .ایران به عنوان یکی از پیشرفتهترین سامانههای موجود IDN در جهان مورد استقبال و تحسین بینالمللی قرار گرفته است که بعداً به فعالیتهای بینالمللی مرکز ثبت دامنه در این زمینه اشاره خواهد شد. علیرغم این موفقیت، استقبال داخلی از دامنههای فارسی چندان گرم نیست و تاکنون اندکی بیش از ۲۲۰۰ دامنه فارسی تحت .ایران ثبت شده است. در همین فاصله زمانی تعداد لاتین ثبت شده تحت .ir بیش از ۱۳۸۵۰، یعنی حدوداً ۶۳ برابر است. دلایل زیر را میتوان برای این عدم استقبال ذکر کرد:
۱- تقریباً همهٔ کاربران فعلی اینترنت در ایران آنقدر به زبان انگلیسی آشنایی دارند که بتوانند به راحتی از دامنههای لاتین استفاده کنند و نیازی به استفاده از دامنههای فارسی احساس نمیکنند. توجه کنید که برای داشتن یک سایت کاملاً فارسی نیازی به دامنه فارسی نیست. در این مورد باید به این برتری دامنه فارسی برای سایتهای فارسی اشاره شود که چون روش استانداردی برای برگرداندن یک نام فارسی به لاتین وجود ندارد، به کار گرفتن یک نام دامنه فارسی (اضافه بر نام دامنه لاتین) میتواند کمک بزرگی به جستجوگر ایرانی باشد. مثلاً فرض کنید «اتحادیهٔ حلبیسازان قوچان» سایتی دایر کرده باشد. دس اینکه نام دامنه مربوط به لاتین به چه صورتی است بسیار دشوار است زیرا که میتوان این نام را به دهها صورت به لاتین برگرداند یا خلاصه کرد ولی موجود بودن اصل فارسی نام کامل میتواند جوینده را مستقیماً به سایت هدایت کند. بنابراین توصیه میشود حتی در مواردی که نام دامنهای به لاتین موجود است یک نام فارسی که به وضوح به همان سایت اشاره دارد نیز برای کمک به مراجعان ایرانی ثبت شود.
۲- اکثر استفادهکنندگان از اینترنت در ایران از Microsoft Internet Explorer استفاده میکند که در حال حاضر از IDN پشتیبانی نمیکند، بنابراین استفادهکنندگان یا باید plug-in مناسب نصب کنند (راهنمایی لازم در سایت www.nic.ir آمده است) یا از مرورگرهای وابسته به Mozilla استفاده کنند. خوشبختانه این مشکل در حال رفع شدن است. در IE7 و نیز Outlook7 که صورت «بتا» آنها هم اکنون موجود است و احتمالاً تا آخر سال میلادی صورت استاندارد آنها وارد بازار خواهد شد، IDN وارد شده است.
۳- مشکل دیگر برخی تفاوتهای فنی میان تنظیم کارگزار دامنههای IDN با دامنههای معمول لاتین است که رابطان فنی ابتدا به ساکن با آن آشنایی ندارند. برای رفع این مشکل، مرکز ثبت دامنه .ir کلاسهای چند ساعتهای برای رابطان فنی دایر کرد که در صورت نیاز ارائه آنها تکرار خواهد شد. به نظر میرسد چنانچه فروشندگان دامنه که نوعاً تنظیمات فنی کارگزار دامنه را نیز به عهده دارند آشنایی لازم را با این مقوله کسب کنند، رواج دامنههای فارسی سرعت یابد.
بالاخره لازم است به فعالیت مرکز ثبت دامنه .ir در سطح بینالمللی برای اشاعه استفاده از IDN اشارهای شود. این مرکز علاوه بر شرکت مستمر در فعالیتهای IDN سازمان ICANN و ارائه گزارش و سخنرانی در نشستهای آن مؤسسه در فعالیتهای و جلسات مؤسسات دیگر مانند IETF، ITU و MINC نیز شرکت داشته است. اخیراً یک کارگزار آزمایشی MINC (مخففMultilingual Internet Names (Consortium جهت دامنههای IDN در جهان با کمک آقای مهندس صالح راهاندازی شد. اتحادیه بینالمللی مخابرات از راه دو (ITU) اخیراً فعالیت گستردهای را در زمینه IDN آغاز کرده است و گروه مطالعاتی ویژهای را جهت جلب همفکری دستاندرکاران در IDN تأسیس کرده است که مرکز ثبت دامنه .ir با آن همکاری و مشارکت دارد. گزارش کامل نشست اخیر ITU در این زمینه در نشانی زیر قابل دسترسی است:
http://www.itu.int/ITU-T/multilingual/programme.html
مسأله مهم مطرح که فعالیت ITU و MINC را اخیراً افزایش داده است کند بودن ICANN در پاسخگوئی به نیازهای گسترش IDN است. آیکان به عنوان متولی کارگزارهای ریشه هنوز اقدام به ثبت دامنههای مرتبهٔ اول IDN در کارگزارهای ریشه نکرده است. این بدان معنی است که مثلاً گر کسی در خارج کشور (یا حتی در بیشتر موارد داخل کشور) بخواهد به نشانی مختوم به .ایران وصل شود باید پسوند .ir را نیز در طرف راست اضافه کند. حل بعضی اشکالهای فنی دخیل در امنیت شبکه در این کندی اثرگذار بوده است ولی به زعم بعضی، نفوذ مراکز ثبت تجاری پرقدرت مانند Verisign (مرکز ثبت .com و .net) و Afilias (مرکز ثبت .org و .info ) در این امر بیاثر نبوده است زیرا ثبتکنندگان تجاری مدتی است در پی تحقق پروژهای به نام DNames هستند که به وسیله آن میتوانند دامنههای ثبت شده مثلاً تحت .com را به طور خودکار به زبانهای دیگر ترجمه کنند و چنانچه این برنامه تحقق پذیرد قدرت انحصاری این شرکتها را بیش از پی افزایش خواهد داد و این امر مورد اعتراض شرکتهای کوچکتر و مراکز ثبت دامنههای کشوری است و ممکن است در آینده نزدیک شاهد اعتراضهای دامنهدارتری در این زمینه باشیم.