1.介绍
今天,用户界面事件是用户操作基于窗口的用户界面系统的必然产物。因为这些事件可以被自动地捕捉,并且可以根据应用程序的用户界面来表明用户的行为,所以被认为是关于应用程序的可使用性和可用性潜在的丰富信息源。然而,由于用户界面事件容量大而且细节上复杂,自动的支持要求:在对调查者所关心的分析使用性和评价可用性的水平上汲取信息。
1.1目标和方法
研究的基本目标是建立一个框架来帮助HCI实践者和研究者分类、比较和评价已经或者可能将要应用到这个问题的方法的力度和局限。
1.2 比较框架
这个小结介绍更高层次的分类,这种分类已经作为研究的结果出现。我们将在第4部分更加详细地阐述这个框架。
l 同步和查找技术。这些技术允许用户界面事件被同步,并且参照索引使用其他的数据源,例如视频记录和编码观测日志。这允许在一个媒介中寻找,在其他的定位辅助信息。在某种方式下,这是最简单的挖掘用户界面事件可用性评价的技术,却是最为强大的。
l 变换事件流技术。变换包括挑选、抽象和记录事件流,使得用户的和自动化的分析(包括计数,概要统计,模式检测,比较和描述)便利。挑选包括把事件和来自“噪声”感兴趣的序列分离。抽象包括相关的事件到分析中所关心的更高水平的概念。记录包括在挑选和抽象的结果的基础上产生新的事件流,以便于选择的和抽象的事件能够与相同类型的手动的和自动的分析技术(一般是作用在原始事件流)相一致。
l 计数和摘要统计技术。一旦用户界面事件被获得,就会有许多的数字和摘要统计被拿来计算,以总结出用户的行为。例如,特性使用次数,出错频率,帮助系统的使用,等等。尽管许多的调查者依赖通用的电子制表软件和统计包来实现这样的功能,还有一些调查者提出了独特的“内置”功能,以计算和报告这种摘要信息。
l 检测序列技术 。这些技术允许调查者识别出具体或者抽象的目标序列的发生,事件的源序列也许会显示出潜在的可用性问题。有时候,目标序列被抽象地定义,由技术的开发者提供。另外,目标序列对于特定的应用更加特别,由技术的使用者提供。有时候,为了让调查者更细致的阅读,而产生相应的源--后继列表。还有一个目的是自动地识别那些特殊的,与期望值相矛盾的,和用户接口的使用相关的序列。还有,有时候,目标是为了实现源序列的转换,而通过抽象和记录目标序列的实例到“抽象的”事件。
l 比较序列技术。这些技术帮助调查者比较源序列和具体的或者被抽象的目标序列,表明了相互匹配的序列之间的范围。一些技术试图找出代表着目标序列的抽象模型和源序列之间的分歧。其他的试图找出具体的目标序列(例如,一个专家用户)和源序列(其他的用户)之间的分歧。一些产生出诊断性方法,用距离来给目标和源序列分类。其他的,尝试着去实现最为可能的事件队列(目标和源的队列),并且以可视的形式出现在调查者面前。还有一些利用目标和输入序列的分离点来自动地显示潜在的可用性问题。所有的方法,都是为了比较实际的事件序列和一些模型或理想的或者是期望的序列,以识别可用性信息。
l 序列分类技术。这些技术把预案序列当作输入,并且尝试建立一个抽象的模型去总结,分类那些序列的有趣且有序的特征。一些技术计算可能性矩阵,以产生处理转变可能模型。还有的是建立文法模型或者有限状态机,给源序列的事件文法结构分类。
l 可视化技术。这些技术从形式上表现了转换和分析的结果,允许人们去探索可视化分析能力以解释结果。这些技术在联系分析的结果和接口的特征时,特别有用。
l 集成的评价支持。评价环境提供了集成化的支持,它使得各种变换,分析和可视力变得容易。有些环境提供内置的支持,用于管理特定领域,例如,评价,主题,任务,数据和结果的分析。
图1表明了框架的层次是怎样安排的。最高的层次,被调查的技术涉及到了同步和搜索转换,分析,可视化,和集成化的支持。转换通过选择,抽象和记录实现。分析通过计数和概要统计,序列检测,序列比较,以及序列分类实现。
1.3 调查的组织
第2部分确立了背景,并且表达了重要术语的定义。第3部分讨论了UI事件的本质和特征,并且提供了实例来表明从这样的事件中获取可用性信息的困难。第4部分把上述基于框架的方法进行了对比。对于每一类的技术,提供了如下:简洁的描述,例子,相关的工作,强壮性和有限性。第5部分概括了最为重要的调查点,并且未将来的研究指明了方向。第6部分阐述了结论。
许多的作者没有依据他们的方法做出清楚的假设。我们假设UI事件是数据结构,用来表示事件的属性:事件类型(比如,按键的按下,鼠标的点击),事件的目标(比如,ID指示一个特别的按钮或者文本域),时间戳,以及输入设备各种各样的状态。 然而,在我们的讨论中,为了提高抽象的等级,我们把事件流当作字母流来表述,每个字母与一个更叫详细的事件结构相对应。当有用且可能的时候,我们提供使用符号的例子来说明方法的特殊性。
2. 背景
这个部分提出了三个目的。第一,建立关键术语的定义,例如,可用性,可用性评价,以及可用性数据。第二,它使观察到的可用性评价处于更加广阔的HCI评价之中,包括一些相对的强壮性和局限性。最后,它分离了用户接口事件,表明它的强壮性和对于其他类型的有限性。定义和框架表明这里不是新发现的,并且能够在HCI的标准里面发现。对可用性,可用性评价和用户接口事件熟悉的人,也许希望直接跳过第3章,也就是用户接口事件本质和分析复杂的原因的那一章。
2.1 定语
可用性经常被认为是一个系统或者设备的单个属性。然而,更正确的是,他是指许多相关的属性。Nielsen提供了如下的定义。可用性有多个部件,并且传统上与这5个可用性属性相联系:
易学性:系统应该是易于学习的,以便于用户能够快速地投入工作。
效率:系统应能高效地使用。一旦用户学会了系统的使用,就会产生高的效率。
易记录:系统能够容易地记录。以便于任何用户在离开系统以后能够返回系统。
容错性:系统应该出错率低,允许用户在使用系统时有少许错误,所以一旦用户出错,就能够轻易地恢复。更进一步讲,灾难性的错误不应出现。
满意度:系统使用起来应该令人快乐,使用户由衷地满意。
“可用性评价”可以被定义为在特定的情况下,权衡一个系统或设备与特定用户操作特定的任务相关的可用性属性。用户,任务,环境是定义的一部分的原因是,可用性属性的价值依赖于用户的背景知识和经验,系统的哪个任务被使用,在哪种情况下被使用。
“可用性数据”是任何对评价一个系统可用性属性有用的信息。
可用性和用途被认为是术语“使用”的子类。用途是权衡一个系统的功能是否能够支持用户的使用,而可用性是怎样让用户对系统的功能满意。因此系统的使用依赖于可用性和用途。
然而,这个区别仅仅在理论上是清晰的。可用性评论经常区别可用性和使用性问题,因此需要更恰当地阐述使用。然而,为了避免引入新的术语,这个调查简单地假设可用性评价和可用性数据能阐述可用性和可用性问题。
2.2可用性评价的类型
这个部分比较在HCI中评价可用性的方法的不同类型。
第一,一般在构成评价和总结评价时是不一样的。构成评价的目的是提供给设计者反馈,以便于报告和评价设计,总结评价涉及到对已完成产品的判断,以权衡相对于以往版本的改进和对类似产品的比较。在这个调查中,所讨论的技术可以被应用在这两种情况。
另外一个重要的问题对评价来说有更加特别的动力。对于评价,有许多实际的动力。例如,一个人可能希望对一个系统的行为有深入的了解。以及它的用户在实际的使用环境中,便于改进和实现可用性。也可能希望预见用户的需要,要求,思维过程,经验。也许希望比较不同的设计,例如,为一些领域在0概念上决定最有效率的接口或者最好的设计表达。也许希望计算可用性,以便于可用性目标能够在数量上被指定并且过程能被权衡,以便于对同类产品的比较。还有学院的推动,比如,试图发现人类认识的特征,也就是影响用户行为和理解,以及人机界面。
有许多的HCI评价方法用来实现这些目标,总结起来有三个基本的类别:预见性的,观察性的和参与性的。
预见性的评价一般涉及到基于心理模型或者认知模型或者具有HCI知识的专家的设计、评论、经验、指导,对可用性属性进行预测。预见性评价的关键在于能够在没有人为作用的介入的情况下,产出设计性的人工制品,也就是并不需要实际用户的参与来产生结果。
观察性的评价涉及到观察用户与原型或者完整系统的交互来权衡可用性属性。观察性的方法可以是正式的实验,也可以是正式环境的学习。观察性技术的关键是暴露丑实际用户的行为,然而用其他的技术难于捕获。
最后,参与性评价涉及到根据主观的报告直接从用户收集信息。收集到这些数据可以通过调查、面谈、也可以是把观察和被观察人结合起来的人类学方法。参与性技术的优点就是能捕获用户的需求、要求、想法、经验,而其他技术难于得到。
在实践上,实际的评价往往是把多个方法结合起来的技术。然而,提出问题并且收集,分析和解释数据,每个类型中都是不同的。表I提供了对评价类型和评价原因的高度概括。大写X表明较强的关系,小写x表明较弱的关系,空格表明很少或没有关系。
已经调查的方法在这里首先支持观察评价,尽管一些为捕获参与性数据提供有限的支持。
2.3可用性数据
已经利用可用性、观察性、参与性方法给可用性评价定位,用户界面事件可以被隔离为许多的可能的观察数据源的一种。
Sweeny和同事确定了许多指标来衡量可用性属性:
l 在线行为:例如,任务时间,任务完成百分比,出错率,使用在线帮助的频率和持续事件,功能使用范围。
l 离线行为:例如,眼睛的移动,面部表情,离线帮助的使用频率和持续时间,离线问题的解决
l 认知/理解:例如,词语规则,理解问题的答案,对任务分类
l 态度/观点:例如,评论,调查,面谈
l 压力/焦虑:例如,皮肤电流反映,心率,事件相关的大脑潜力,脑电图,焦虑的频率
表II总结了这些指标和收集到的不同观察性数据技术之间的关系。这个表是无法理解的,仅仅用于指示在观察性评价方面更加专业的互补的用户界面的本质。
UI事件从数字上为在线行为的属性提供了丰富的数据,然而,UI事件的效用在关于给指标提供数据方面还没有作用。但是,一些调查者已经使用UI事件来指示用户的知识和理解力的特点。
很多调查的方法集中在专门事件的数据。然而,还有一些是把数据结合,这些数据包括视频记录,代码观察,和主观的用户报告。
3.UI事件的特点
这部分讨论了HCI事件的本质和特征。我们讨论了UI事件的语法特征,包括一些分析上的假设。我们也讨论了在解释事件重要性方面与上下文有关的信息。最后,我们阐述了一个由UI事件组成的模型,用来说明在UI事件分析中,这些问题怎样去证明自己。我们用这个讨论来就以往的讨论和显示调查方法的力度和局限。
4.方法的比较
4.1同步和查找
4.2变换
描述:选择是从剩下的事件流中分离出感兴趣的事件的过程。
抽象是在存在的事件基础上产生新的事件过程。
4.3计数和概要统计
4.4序列检测
描述:序列检测是在源序列中识别目标序列的过程。
4.5序列比较
描述:序列检测比较是比较目标序列和源序列的过程,并且产生相应的措施。
4.6序列描述
描述:序列描述是分析源序列和产生抽象模型过程,以描述这些序列的顺序结构。
4.7可视化
描述:可视化用图标的格式表达了变换和分析的结果。
4.8集成化支持
描述:集成支持包括多个变换,分析和可视化能力和数据的管理
5.讨论
6.结论
我们已经研究了许多的关于从UI事件汲取可用性信息的计算机辅助技术。我们的分类模式包括:同步和查找技术;交换技术;简单计算和总结统计技术;序列检测、比较和描述技术;可视化技术;集成评价技术。
非常少的研究方法支持变换,我们所讨论的是所有从UI事件中汲取有意义的可用性信息的过程的子过程。
一个来自某大型软件开发组织的可用性专家的报告中说,最近可用性团队经常着手处理设计和开发团队的问题,例如:“用户多久做X。”或者“用户多久做Y。”对于那些想评估预想的问题的影响和对下一个版本的开发做出努力的开发者,这明显是一个有用的信息。然而,这不是可靠的信息。我们相信自动化的数据收集技术最终会补充传统的可用性评价技术,不仅会支持以上所描述的开发者,而且会帮助评估可用性评价的影响和集中于可用性评价的努力。