Lec-7 评估技术-用户测试
用户测试主要是指在受控环境中测量典型用户执行典型任务的情况,目标是获取客观的性能数据来评价系统的可用性,适合对原型和现有系统进行评估。
DECIDE 评估框架
六个步骤
- 决定评估需要完成的总体目标
- 发掘需要回答的具体问题
- 选择用于回答具体问题的评估范型和技术
- 标识必须解决的实际问题,如测试用户的选择
- 决定如何处理有关道德的问题
- 评估解释并表示数据
1. 确定目标
评估目标决定了评估过程,影响评估范型的选择。
评估的 why:
- 产品设计是否理解了用户需要
- 为概念设计选择最佳隐喻
- 界面是否满足一致性需要
- 探讨新产品应做的改进
2. 发掘问题
- 根据目标确定问题。
- 问题可逐层分解
3. 选择评估范型和技术
- 范型决定了技术类型
- 必须权衡实际问题和道德问题
- 最适合的技术可能成本过高、所需时间过长、不具备必要设备和技能
- 可结合使用多种技术
- 不同技术有助于了解设计的不同方面
- 不同类型数据可从不同角度看待问题
- 组合有助于全面了解设计的情况
4. 明确实际问题
即如下因素的选择,以及明确限制等注意事项。
- 用户
- 选择恰当的用户
- 用户任务时间
- 安排用户熟悉系统
- 设施及设备
- 期限与预算
- 技能技术
- 是否需要可用性专家
选择参与者
- 选择具有代表性的典型用户;
- 通常需要根据实际情况平衡性别比例。
- 至少 4−5 位,5−12 位用户就足够了。
5. 处理道德问题
保护个人隐私
指导原则
- 说明研究的目的及要求参与者做的工作
- 说明保密事项
- 测试对象是软件,而非个人
- 对测试过程的特殊要求,是否边做边说等
- 用户可自由表达对产品的意见
- 说明是否对过程进行录像
- 不能拍摄用户的面部
- 欢迎用户提问
- 用户有随时终止测试的权利
- 对用户话语的使用应征得同意,并选择匿名方式
6. 评估、解释并表示数据
- 评估技术决定了:搜集什么类型的数据,如何分析,如何表示
- 可靠性
- 有效性
- 偏见
- 普遍性
- 环境影响
小规模试验
对评估计划进行小范围测试
- 以确保评估计划的可行性
- 如检查设备及使用说明
- 练习访谈技巧
- 检查问卷中的问题是否明确
小规模试验可进行多次
- 类似迭代设计
- 测试——反馈——修改——再测试
- 快速、成本低
可用性问题分级
- 方法一:基于量化数据的分级
- 如多少人遇到该问题,耗费多少时间等
- 方法二:问题严重性的主观打分,取平均值
- 方法三:可用性分级的两个因素
- 多少用户会遇到这个问题
- 用户受该问题影响的程度
- 该问题只在第一次使用时出现,还是会永远出现