Доменне ім'я російською? Легко! Частина 1
Термінологія
• Доменне ім'я (домен) - Область простору ієрархічних імен мережі Інтернет, яка обслуговується набором серверів доменних імен (DNS) та централізовано адмініструється. Домен ідентифікується унікальним ім'ям, наприклад, domain.ru.
• DNS (Скор. Від Domain Name System) - служба імен доменів (механізм, використовуваний в Інтернет і встановлює відповідність між числовими IP-адресами та текстовими іменами).
• ICANN (Скор. Від Internet Corporation for Assigned Names and Numbers) - некомерційна організація за призначенням адрес та імен в Інтернет, параметрів протоколів, управлінню системами доменних імен.
• IETF (Скор. Від Internet Engineering Task Force) - проблемна група проектування Інтернет, що відповідає за рішення інженерних завдань Інтернет, випускає більшість RFC, що використовуються виробниками для впровадження стандартів в архітектуру TCP / IP).
• RFC (Скор. Від Requests for Comments) - Запити на коментарі (серія документів IETF, розпочата в 1969 р і містить опису набору протоколів Інтернет і пов'язану з ними інформацію).
• IDN (Скор. Від Internationalized Domain Names) - група підтримки багатомовних доменних імен, була створена в 1999 р усередині IETF, підтримує реєстрацію доменних імен більш, ніж на 60 мовах.
• MINC (Скор. Від Multilingual Internet Names Consortium) - Консорціум багатомовних інтернет-імен - організація, створена в червні 2000 р для підтримки багатомовних доменних імен, здійснює інтернаціоналізацію Інтернету.
• ASCII (Скор. Від American Standard Code for Information Interchange [по-американськи вимовляється ески, по-російськи - аски]) - американський стандартний код для обміну інформацією, 7-бітна комп'ютерна кодування для представлення латинського алфавіту, десяткових цифр, деяких розділових знаків, арифметичних операцій і керуючих символів.
• Unicode (Юнікод, Унікод) - 16-бітний стандарт кодування символів, що дозволяє представити знаки практично всіх письмових мов. Стандарт був запропонований в 1991 р некомерційною організацією «Консорціум Юнікоду» (англ. Unicode Consortium), яка об'єднує найбільші IT-корпорації. Застосування цього стандарту дозволяє закодувати дуже велике число символів з різних писемностей: у документах Unicode можуть сусідити китайські ієрогліфи, математичні символи, букви грецького алфавіту, латиниці, кирилиці і т.д.
Стандарт складається з 2-х основних розділів: універсальний набір символів (UCS, Universal Character Set) і сімейство кодувань (UTF, Unicode Transformation Format). Універсальний набір символів задає однозначну відповідність символів кодам - елементам кодового простору, що представляє невід'ємні цілі числа. Сімейство кодувань визначає машинне представлення послідовності кодів UCS.
• cp1251 - Це подання (формат) Юникода, що забезпечує найкращу сумісність зі старими системами, які використовували 8-бітові символи. Формат cp1251 був створений 2 вересня 1992 Кеном Томпсоном і Робом Пайком.
Що відбувається, коли ми в адресному рядку браузера набираємо, наприклад, https://www.domain.ru? Спрощена схема така: система DNS встановлює відповідність доменному імені www.domain.ru IP-адреси, наприклад, 111.111.111.111. Запитаний нами ресурс відшукується на безкрайніх просторах Інтернету і завантажується на наш ПК. А чи не можна замість domain.ru набрати домен.ру?
Передісторія питання
Історично склалося так, що Інтернет (як і комп'ютер!) Зародився в англомовному середовищі, і основним обмеженням DNS є те, що для запису доменних імен необхідно використовувати тільки 37 символів ASCII (латинські літери від a до z, арабські цифри і символ дефіса).
Але багатомовне інтернет-спільнота не побажало з цим миритися: наприклад, китайці захотіли реєструвати доменні імена на китайській, в'єтнамці - на в'єтнамському ... Організації ICANN, яка відповідає за призначення адрес та імен в Інтернеті, довелося розкинути мізками: створити «групи підтримки», розробити масу протоколів і стандартів. Але, погодившись з появою національних доменних імен, ICANN довго наполягав на латинському написанні доменів верхнього рівня. Наприклад, в Рунеті спочатку з'явилися сайти зі змішаним написанням російських і латинських букв - http: //www.россія.net/ і http: //рбк.com/, а вже значно пізніше - http: //домени.ру/.
Як це впроваджувалося
Процес впровадження національних доменних імен виявився дуже непростим і дуже тривалим. Для того щоб зберегти працездатність існуючої системи DNS, доменні імена, що містять символи національних алфавітів, необхідно перекодувати в загальну для всієї системи адресації форму. У 2003 р група IETF IDN для представлення національних алфавітів вибрала універсальну кодування cp1251. З цієї кодування доменні імена певним чином перетворюються в послідовності ASCII-символів. Таке рішення дозволяє домогтися незалежності від використовуваних на стороні клієнта операційних систем, і при цьому відповідає вимогам вже існуючої системи DNS.
Необхідно відзначити дуже важливий нюанс. Застосовуючи російськомовні (або кітайскоязичние) доменні імена, насправді, ми просто тішимо своє національне самолюбство: інтернаціоналізація доменних імен не скасовує існуючих протоколів роботи DNS - всередині неї все так і залишається в символах ASCII, мультимовність як би додається зверху.