Что пишут в блогах

Подписаться

Что пишут в блогах (EN)

Разделы портала

Онлайн-тренинги

.
Инструменты тестирования доступности на основе ИИ: за и против
21.05.2025 00:00

Автор: Эди Стоукс (Ady Stokes)
Оригинал статьи
Перевод: Ольга Алифанова

Введение

Недавно я отметил двадцатилетие своей карьеры тестировщика. Почти десять лет я изучаю цифровую доступность и разработку приложений, сайтов и продуктов для максимально широкой аудитории. Я решил писать, говорить и даже преподавать доступность окружающим, так как, начав работать с доступностью, я обнаружил, что мало кто обучает ей.

Теперь, когда ИИ-инструменты широко распространяются, начинают появляться и инструменты тестирования доступности на основе ИИ.

Как правило, они делятся на три категории:

  • Инструменты оценки: подсвечивают все, что кажется им проблемой.
  • Инструменты оценки и рекомендаций: подсвечивают найденные проблемы и предлагают способы подхода к ним или их исправления.
  • Инструменты оценки и исправления: напрямую применяют исправления к тестируемому коду на основании своих находок.

Эти инструменты, особенно те, которые просто правят все за вас, выглядят прекрасной идеей! Но решат ли они все проблемы? К сожалению, нет. Помогут ли они? Да, в правильных условиях и в разумном масштабе.

В этой статье я рассмотрю уже существующие инструменты. Я изучу, что они предлагают, особенно по отношению к планируемым обновлениям методических указаний по доступности веб-содержимого (WCAG). Я пройдусь по плюсам и минусам применения искусственного интеллекта в оценке и тестировании доступности.

Что сейчас в наличии?

Я ограничил статью коммерчески доступными инструментами – аддонами и самостоятельными решениями. Из нее исключены коммерческие оверлеи – у них есть свои проблемы, и про них уже достаточно написано. Я также не продвигаю никакие конкретные инструменты. Вместо этого я делюсь публично доступной информацией о них, чтобы показать вам нынешний рынок.

Сейчас на рынке два основных типа инструментов. Некоторые из них относятся к одному типу, а некоторые гибридны.

  • Автоматизированные проверки. Инструменты этой категории прогоняют автоматизированные проверки на соответствие указаниям по доступности, и предоставляют вам отчет (некоторые из них могут также выдавать предложения, выходящие за рамки требований методички). Эти инструменты, как правило, концентрируются на системных или бинарно идентифицируемых элементах. Системные элементы – это HTML, заголовки или теги вроде header, main и footer. Бинарно идентифицирумые элементы или присутствуют, или нет – например, альтернативный текст (alt text).
  • Управляемые тесты. Инструменты этой категории комбинируют автоматизированные проверки с последовательностью шагов, верифицирующих информацию. Добавление ИИ к этим инструментам означает, что ИИ может генерировать ответы, содержащие специфическую для тестируемой системы информацию. Некоторые инструменты просят пользователя о подтверждениях в ходе тестирования, чтобы убедиться, что информация ИИ точна, прежде чем он предложит решение. Пример управляемого теста:
    • Инструмент запущен в приложении.
    • Инструмент выявляет потенциальную проблему – например, отсутствующую метку.
    • Инструмент выводит список шагов по исправлению проблемы. Он может даже показать проблемный кусок кода с инструкциями, как его заменить в общей базе.

Обе эти категории включают инструменты, способные создавать визуальный рендер тестируемой системы, подсвечивать визуальный фокус и состояние ошибки, и предлагать решения, если проблемы найдены. Одни могут сканировать код на соответствие WCAG, а другие пошагово разбирают методичку, давая пояснения и инструкции для тестирования. Третьи могут интегрироваться с инструментами дизайна или архитектуры, подсвечивая потенциальные проблемы доступности еще до начала тестирования.

Помимо примеров выше, некоторые инструменты поддерживают оценку доступности в специфических областях:

  • Читабельность
  • Упрощение текста
  • Генерация подписей
  • Транскрипция речи
  • Чтение содержимого и его краткое содержание
  • Перевод
  • Голосовые помощники
  • Улучшенное распознавание лица
  • Компьютерное зрение.

И, наконец, есть инструменты, помогающие с кодом – например, GitHub Copilot/

Что, учитывая такое разнообразие, могут и не могут предложить эти инструменты?

Будут ли инструменты соответствовать грядущим изменениям WCAG?

Мы пока не знаем, когда будет выпущено финальное обновление WCAG 3.0 (Project Silver), но для понимания некоторых перемен информации уже достаточно.

В обновлении будет ряд новых критериев, а подход к тестированию на основе указаний будет переосмыслен. Сейчас тесты или проходят, или падают в новой версии будут «элементарные» падения или успехи, а также «комплексные» результаты.

Среди целей новой методички есть, в том числе, такие:

  • Покрыть еще больше пользователей.
  • Включать новые технологии – например, дополненную и виртуальную реальность.
  • Создать более простые, легкие для понимания указания.
  • Расширить возможности тестирования и сделать результаты яснее.
  • Предложить потенциальную шкалу рейтинга (бронза, серебро, золото.

Это наиболее значительное изменение методички с момента ее рождения. Однако ни один известный мне инструмент не упоминал о грядущих переменах в документации и маркетинговых материалах. Вряд ли руководство обанкротит ИИ-инструменты, но, возможно, какое-то время они будут страдать от недостаточного покрытия.

Учитывая эти перемены, какие плюсы и минусы существуют у применения ИИ в тестировании доступности?

Оценка доступности при помощи ИИ: за и против

Как мы увидим далее, у улучшения оценки доступности при помощи ИИ большой потенциал. Однако поддержка живого человека будет крайне важна в областях, где инструменты слабоваты – это обсуждается в секции «против» для каждой опции.

Распознавание изображений для оценки альтернативного текста при помощи ИИ

За

ИИ может быстро генерировать альтернативный текст для большого количества изображений, что бережет время и силы создателей содержимого. Продвинутый ИИ понимает контекст изображения и генерирует его описание для альтернативного текста, что улучшает доступность.

Против

ИИ может генерировать точные описания, но может не понять, если изображение чисто декоративное. Это может запутать пользователя – он удивится, почему слушает про букет цветов, покупая нижнее белье. ИИ может также упустить более тонкий контекст или даже целевое предназначение изображения. Ваш продукт в результате получит неподходящие или неадекватные описания.

Улучшенный анализ семантической структуры

За

Пока ИИ придерживается изменений в спецификации HTML, он может помочь проверить согласованное применение заголовков и ролей ARIA (доступное полнофункциональное интернет-приложение). Это поможет снизить количество ошибок в семантической структуре. ИИ к тому же может эффективно анализировать сложные и масштабные сайты, проверяя, что все элементы следуют семантическим правилам.

Против

ИИ не всегда может полностью разобраться в значении или важности анализируемого контекста, может даже неправильно его понять, и в результате его предложения разрушат логическую цепочку или испортят клиентский опыт. Он может отметить валидные отклонения, как ошибки, и в итоге будут внесены ненужные изменения или выданы ложноположительные результаты.

Тестирование улучшенного цветового контраста с ИИ

За

  • Обстоятельный анализ: ИИ может анализировать цветовой контраст для разных состояний (ховер, активное, и т. д.) и симулировать различные нарушения зрения, тщательно оценивая ситуацию.
  • Подгонка в режиме реального времени: ИИ может предлагать подсказки или изменения цветовых схем на лету в ходе проектирования дизайна.

Против

ИИ может отметить цвета, как несоответствующие, если не полностью понимает контекст дизайна или предпочтения пользователя. Сложный визуальный фон или паттерн, где контраст сложнее оценить, может привести к падениям проверок или ложным отчетам.

Умная симуляция клавиатурной навигации

За

ИИ может имитировать сложные пользовательские взаимодействия, выявляя проблемы доступности, которые упустит ручное тестирование. Он способен быстро тестировать различные сценарии, выявляя потенциальные клавиатурные ловушки или недоступные элементы без нужды в объемном ручном труде.

Против

ИИ-тестирование может не отражать поведение реального пользователя, особенно в граничных случаях – это приведет к упущенным проблемам или возможностям. Если чересчур полагаться на эти тесты, то разработчики могут начать думать, что все проблемы клавиатурной навигации решены – а ряд сложных сценариев останется непроверенным.

Автоматизированный анализ читабельности и понятности содержимого

За

ИИ может оценить текст на предмет читабельности, отыскивая такие паттерны, как злоупотребление заглавными буквами, сложная речь и применение нерасшифрованных акронимов. Для этого он пользуется шкалами или рейтингами, измеряя, насколько текст сложно читать. Эти проверки помогают убедиться, что содержимое соответствует указаниям по когнитивной доступности. ИИ может предложить альтернативы попроще, делая содержание продукта доступнее для широкой аудитории.

Против

ИИ может чрезмерно упростить содержимое, отсекая важные детали или нюансы – особенно в техническом или специализированном контексте. Автоматизированный инструмент может проигнорировать культурные тонкости или зависимый от контекста язык, что приведет к неподходящим или некорректным предложениям.

Заключение

Ясно, что искусственный интеллект может значительно улучшить автоматизацию и скорость оценки и тестирования доступности. Но не менее важно осознавать его нынешние ограничения. Без всякого сомнения, инструменты будут становиться все лучше и лучше, но крайне маловероятно, что они смогут полностью заменить людей в любой области тестирования.

«Интеллект» ИИ основан на средних значениях и наборах данных, что описывает только наиболее распространенные сценарии и приводит к незапланированным искажениям. Важно это понимать, изучая результаты работы ИИ, особенно такие, как описания изображений.

Комбинация ИИ-инструментов и человеческого опыта – это всеобъемлющий и точный подход к удовлетворению требований и стандартов доступности, помогающий вовлекать всех пользователей без исключения.

Инструменты:

  • Axe DevTools and Artificial Intelligence (AI)
    • Deque известны тем, что делятся знаниями и ресурсами вроде их библиотеки компонентов доступности. Одна из фич их DevTools-набора – это их управляемые тесты. Они пошагово проводят вас по тестам вашего сайта, задают вопросы и комбинируют «компьютерное зрение с синтаксическим анализом, чтобы найти потенциальные проблемы».
    • Accessibility Desk AI Accessibility Toolkit
      • Accessibility Desk содержит бесплатный набор программ, отдельные инструменты в котором нацелены на улучшение доступности. Там, например, есть помощник создания альтернативного текста для изображений, генератор информации для лиц с ограниченными возможностями, валидатор кода, Read Easy для улучшения читабельности, а также оценочный инструмент, в котором нужно отвечать на вопросы.
      • Stark suite of integrated accessibility tools
        • Stark утверждает, что «повышает удобство использования», являясь «единственным end-to-end решением – от дизайна и кода до рабочего продукта». Безусловно, сильное заявление. Начиная с дизайна, у него есть плагины и интеграция с Figma, Sketch и Github. Он предлагает отчетность, автоматизацию на основе ИИ и центр соответствия требований. Он перечисляет внушительное количество знаменитых клиентов – от IBM до Microsoft и Deloitte. Он совмещает наблюдения ИИ с чеклистами, способными сканировать на предмет проблем и исправлять их.
        • Лучшие 18 тест-инструментов на основе ИИ в 2024 - Code Intelligence
          • Список ИИ-инструментов – некоторые можно использовать для тестирования или оценки доступности. Не специфические для доступности ИИ-инструменты.

Дополнительная информация