Lec-7 评估技术-用户测试

用户测试主要是指在受控环境中测量典型用户执行典型任务的情况,目标是获取客观的性能数据来评价系统的可用性,适合对原型和现有系统进行评估。

DECIDE 评估框架

六个步骤

  1. 决定评估需要完成的总体目标
  2. 发掘需要回答的具体问题
  3. 选择用于回答具体问题的评估范型和技术
  4. 标识必须解决的实际问题,如测试用户的选择
  5. 决定如何处理有关道德的问题
  6. 评估解释并表示数据

1. 确定目标

评估目标决定了评估过程,影响评估范型的选择。

评估的 why:

  • 产品设计是否理解了用户需要
  • 为概念设计选择最佳隐喻
  • 界面是否满足一致性需要
  • 探讨新产品应做的改进

2. 发掘问题

  • 根据目标确定问题。
  • 问题可逐层分解

3. 选择评估范型和技术

  • 范型决定了技术类型
  • 必须权衡实际问题和道德问题
    • 最适合的技术可能成本过高、所需时间过长、不具备必要设备和技能
  • 可结合使用多种技术
    • 不同技术有助于了解设计的不同方面
    • 不同类型数据可从不同角度看待问题
    • 组合有助于全面了解设计的情况

4. 明确实际问题

即如下因素的选择,以及明确限制等注意事项。

  • 用户
    • 选择恰当的用户
    • 用户任务时间
    • 安排用户熟悉系统
  • 设施及设备
  • 期限与预算
  • 技能技术
    • 是否需要可用性专家

选择参与者

  • 选择具有代表性的典型用户;
  • 通常需要根据实际情况平衡性别比例。
  • 至少 4−5 位,5−12 位用户就足够了。

5. 处理道德问题

保护个人隐私

指导原则

  • 说明研究的目的及要求参与者做的工作
  • 说明保密事项
  • 测试对象是软件,而非个人
  • 对测试过程的特殊要求,是否边做边说等
  • 用户可自由表达对产品的意见
  • 说明是否对过程进行录像
    • 不能拍摄用户的面部
  • 欢迎用户提问
  • 用户有随时终止测试的权利
  • 对用户话语的使用应征得同意,并选择匿名方式

6. 评估、解释并表示数据

  • 评估技术决定了:搜集什么类型的数据,如何分析,如何表示
  • 可靠性
  • 有效性
  • 偏见
  • 普遍性
  • 环境影响

小规模试验

对评估计划进行小范围测试

  • 以确保评估计划的可行性
  • 如检查设备及使用说明
  • 练习访谈技巧
  • 检查问卷中的问题是否明确

小规模试验可进行多次

  • 类似迭代设计
  • 测试——反馈——修改——再测试
  • 快速、成本低

可用性问题分级

  • 方法一:基于量化数据的分级
    • 如多少人遇到该问题,耗费多少时间等
  • 方法二:问题严重性的主观打分,取平均值
  • 方法三:可用性分级的两个因素
    • 多少用户会遇到这个问题
    • 用户受该问题影响的程度
  • 该问题只在第一次使用时出现,还是会永远出现