Багфикс, который “распахнет двери” в мир Web миллионам |
08.02.2018 00:00 |
Перевод: Анна Радионова Компании, которые ведут бизнес онлайн, теряют миллиарды долларов годового дохода из-за бага - несовместимости их систем с доменными именами, состоящими из символов, отличных от латиницы. Исправление этого общеизвестного бага увеличило бы количество пользователей онлайн-сегмента приблизительно на 17 миллионов человек за счет числа тех, кто говорит на русском, китайском, арабском, вьетнамском, индийском языках. Такое заключение сделала компания-лидер отрасли на основании своего нового исследования, спонсором которого является организация, ответственная за поддержание и актуализацию списка действительных доменных имен, International Corporation for Assigned Names and Numbers (ICANN) (Международная организация по распределению номеров и имен). Задача так называемой Координационной группы по вопросам всеобщего признания новых доменов (Universal Acceptance Steering Group), членами которой являются представители огромного числа интернет-компаний (например, Microsoft и GoDaddy), - мотивировать разработчиков ПО и владельцев сервисов производить обновления своих систем в отношении валидации набора символов справа от точки в имени домена или e-mail адреса, т.е. в домене верхнего уровня. Проблема не была столь очевидна до 2011 года, когда ICANN решил существенно расширить диапазон символов, которые могут использоваться справа от точки (см. ссылку “ICANN’s Boondoggle”). В период с 2012 по 2016 год число доменов верхнего уровня выросло с 12 до более чем 1200. Сюда входят 100 “интернационализированных” доменных имен - это те, которые содержат символы национального алфавита (не латиницы), символы латинского алфавита с диакритическими знаками как, например, умлаут (¨) или диграфы, например, буква немецкого алфавита Эсцет (ß). По сведениям, приведенным в новом исследовании, под новыми доменами верхнего уровня было зарегистрировано порядка 2,6 миллионов “интернационализированных” доменов и львиная доля приходится на русский и китайский языки. В большинстве веб-приложений и e-mail клиентов домены верхнего уровня считаются валидными только в том случае, если они состоят из символов в кодировке, совместимой с Американским стандартным кодом обмена информацией (ASCII). Особенно выражена проблема с e-mail адресами. Помимо своего основного назначения - обмена электронными письмами - они являются обязательными параметрами для авторизации в онлайн-банке и социальных сетях. В 2016 году проводилось тестирование адресов, содержащих символы, отличные от латиницы, справа от точки, в результате которого выявлено, что “пропускная способность” таких адресов системами составляет менее 20 процентов. Багфикс, который заключается в изменении основных правил валидации доменов, чтобы они могли быть совместимы с кодировкой Unicode (другой стандарт текстовой кодировки, который позволяет работать с разными языками) является относительно несложным, по словам Ram Mohan, председателя координационной группы. В исследовании доказано, что потенциальный доход, который могут получать компании после устранения этого бага, намного превышает расходы, связанные с его исправлением. “Многие компании, относящиеся к сегменту e-commerce, банковскому, e-mail сервисов просто до сих пор не знают, что их системы не способны принимать и обрабатывать эти новые домены” - говорит Mohan. Однако, надо сказать, что в настоящее время ситуация улучшается. В 2014 году Google внес изменения в Gmail, что позволило принимать и отображать интернационализированные доменные имена, не используя “костыльное” решение экранирования символов в соответствии с ASCII. Компания Microsoft в настоящее время производит обновления своих e-mail систем (клиентов Outlook и облачных сервисов) для возможности работы с интернационализированными доменными именами и e-mail адресами. “Но дело не только в увеличение прибыли”, - говорит Mark Svancarek, руководитель группы анализа уровня удовлетворенности клиентов в Microsoft и заместитель председателя Universal Acceptance Steering Group. Не позволять миллионам людей пользоваться интернетом в полной мере по причине непонятного для них набора символов противоречит миссии компании, по его словам. “Возможность использования отличных от стандартного кода ASCII доменов станет толчком для еще большего расширения интернет-пространства, т.к., в основном, люди, которые пока только обдумывают для себя возможность подключения к сети, говорят и пишут исключительно с помощью национального алфавита”, - подчеркивает Mohan - “и предоставление им возможности пользования интернетом во многом будет зависеть от основополагающих факторов регулирования ключевых функций сети. Проблема в некоторой степени обусловлена, так сказать, ленивой разработкой, и для ее устранения нужно просто заменить ее более качественной разработкой.” |