Обзор методов юзабилити-тестирования

Компании приходят к пониманию того, что удобство использования продукта — сильное конкурентное преимущество. Зачастую пользователь уходит туда, где проще и комфортнее получить искомое. А значит, самое время уделить внимание юзабилити продукта.

Согласно стандарту ISO 9241-11, юзабилити:

Степень, с которой продукт может быть использован определенными пользователями при определенном контексте использования для достижения определенных целей с должной эффективностью, продуктивностью и удовлетворенностью.

Продуктом должно быть удобно пользоваться его целевой аудитории. У реальных пользователей продукта свой уникальный опыт работы с аналогичными продуктами и свой багаж знаний. Опираться на мнение проектировщика об удобстве, например, внутренней банковской системы — неблагоразумно.
Продуктом должно быть удобно пользоваться в определенной ситуации взаимодействия. Условия работы бухгалтера и диспетчера МЧС значительно отличаются — нужно учитывать особенности ситуации, в которой продукт будет использоваться.
Продукт должен позволять пользователям решать определенные задачи.
Эффективность, продуктивность и удовлетворенность при использовании продукта — основы для метрик, использующихся для оценки юзабилити.

Юзабилити-тестирование (далее — “ЮТ”) — исследование, выполняемое с целью определения, удобен ли искусственный объект (такой как веб-страница, пользовательский интерфейс или устройство) для его предполагаемого применения, основанное на привлечении пользователей в качестве тестировщиков и суммировании полученных от них выводов.

Ценность ЮТ:

вы получите объективные данные, к которым сможете апеллировать при принятии решения;
до запуска проекта вы можете “обкатать” его на пользователях и своевременно исправить недочеты;
вы спасетесь от проф-деформации и “замыленности” взгляда, не позволяющих вам увидеть ошибки.

К сожалению, никто еще не придумал универсальной меры оценки юзабилити. Абстрактное “удобство” измерить сложно. Поэтому при оценке юзабилити мы опираемся на ряд факторов:

Скорость обучения — способность пользователя самостоятельно освоить продукт. Это важно, если у продукта много новых пользователей и период использования продукта краток. Мы можем пожертвовать скоростью работы ради скорости обучения.
Скорость работы — скорость, с которой пользователь может выполнять типовые операции с продуктом. Важно, когда у продукта не много новых пользователей, но существующие взаимодействуют с продуктом длительное время. Например, банк-клиент, с помощью которого финансовый менеджер компании проводит банковские операции. Менеджер может потратить некоторые ресурсы на изучение системы, если в дальнейшем она позволит быстро выполнять необходимые действия.
Ошибки, которые совершают пользователи при взаимодействии с продуктом.
Субъективная удовлетворенность пользователем работой с продуктом.

Используемые методы ЮТ разумно разделить на те, которые требуют привлечения пользователей, и те, которые этого не требуют.

Методы юзабилити-тестирования с привлечением пользователей — наиболее эффективны и разнообразны, они позволяют получать и количественные, и качественные данные.

Лабораторное тестирование

Проводится при личном присутствии респондента и модератора. В исследуемом интерфейсе респондент выполняет задания, которые дает ему модератор. Техническое оснащение лаборатории позволяет производить запись сессий или регистрацию движений глаз (eye-traking).

187H

Возможно проводить тестирование пользователей на рабочем месте. Это важно, когда для тестируемого продукта большое значение играет контекст использования — тестирование проводится в рамках заданного контекста и позволяет получить более достоверные данные.

Лабораторное тестирование позволяет работать с множеством качественных метрик: вопросами и затруднениями респондента, его эмоциональным состоянием, ожиданиями и проч. Мы можем тщательно проконтролировать качество выборки: соответствие целевой аудитории и другим требованиям. Все это делает лабораторное тестирование одним из самых эффективных и информативных методов. Но есть и минусы. Во-первых, это дорого. Во-вторых, это требует значительных усилий для респондента, а потому сильной мотивации к участию. Не стоит забывать и про хоторнский эффект: участники эксперимента действуют более усердно благодаря осознанию своей причастности к эксперименту.

Удаленное модерируемое тестирование

Принцип тот же, что и у лабораторного, однако коммуникация между модератором и респондентом осуществляется удаленно, респондент выполняет задания через удаленный рабочий стол.

179H

Данный метод накладывает ограничения на техническое обеспечение тестирования: мы работаем с тем оборудование, которое имеется у респондента. Главный плюс данного метода — вариативная география выборки. Мы можем исследовать аудиторию, которая находятся практически в любой точке мира. Среди других особенностей: возможность контролировать качество выборки и сложности с наблюдением за действиями респондентов и невербальными проявлениями респондентов.

Удаленное немодерируемое тестирование

В данном методе задания формируются в одной из специализированных систем и рассылаются респондентам для самостоятельного выполнения.
Примеры систем:
http://www.loop11.com/

http://usabilla.com/

http://userzoom.com/

Системы фиксируют данные по основным метрикам:
— выполнение заданий;
— пути пользователя по сайту;
— время на выполнение;
— ответы на вопросы;
— тепловые карты движения мыши по сайту.

Мы также можем задать пользователям интересующие нас вопросы.

Этот метод требует большого количества участников — около 100 на каждую целевую группу — и дает в первую очередь статистические данные согласно метрикам. Он дешевле и проще в реализации, чем описанные выше методы. Однако здесь из-за размера выборки осложнен контроль ее качества.

A/B тестирование

Здесь несколько версий контента с незначительными различиями показываются большим группам пользователей, фиксируются и сравниваются данные по интересующим метрикам (целевые действия, время, глубина просмотра и проч.).
Качество тестирование определяют:
— простые различия между версиями — можно понять, что именно повлияло на поведение пользователей;
— внушительная выборка респондентов — часто ориентируются на 1000 респондентов для каждой версии, однако это число зависит от задач;
— однородность выборок для каждой версии.
В противном случае мы получим некорректные данные или не сможем их верно интерпретировать.

Существуют также методы ЮТ, в которых в привлечении пользователей нет необходимости. Среди них экспертная оценка и численные методы.

Экспертная оценка

В рамках данного методы специалист (или несколько) проводят аудит системы: по заданным сценариям и метрикам оценивают удобство интерфейса, фиксируют ошибки и дают рекомендации. Этот метод — один из самых экономичных, однако требует доверия профессионализму эксперта.

К численным методам относятся Модель GOMS, Законы Фиттса и Хика, Feature Map и ряд других. Информации о них в сети более чем достаточно, поэтому мы не будем разбирать их подробнее.

Каждый из перечисленных методов хорош по-своему и решает свои задачи. Поэтому не стоит отдавать предпочтение одному из них — делайте выбор исходя из необходимых данных и имеющихся ресурсов.