英语原文共 9 页,剩余内容已隐藏,支付完成后下载完整资料
基于Web的信息系统的可用性评估决策支持系统
关键词:
基于Web的信息系统
可用性工程
机器学习
敏感性分析
临界指数
摘要:
在这项研究中,可用性评估和基于Web的信息系统(WIS)的设计决策支持系统(DSS)被提出。它使用三个机器学习方法(支持向量机,神经网络,和决策树)和统计技术(多元线性回归)以显示整体WIS可用性和其决定性因素之间的潜在关系。执行对预测模型进行敏感性分析和一项新指标,临界指标,被设计来确定决定因素的重要性排序。具有最高和最低对WIS的可用性性能检查表项的贡献由临界指数的装置指定。WIS的最重要的可用性问题是在伪帕累托分析的帮助下确定的。通过对法提赫大学的学生信息系统的案例分析用来验证提出的DSS。所提出的DSS可以用来决定专注其可用性问题上,以提高WIS的可用性和质量。
1、前言
通过基于网络的信息系统(WIS)提供的Web服务已经在当代地社会越来越重要。 WIS的用户想找到一个方便快捷的方式的信息。然而不幸的是,很多WIS仍然是速度太慢以致于不能用,不能满足他们的许多用户。来自计算机科学/信息科学,可用性/人机交互和需求工程领域的专家设法解决基于网络的信息系统设计问题(Yang amp; Tang, 2003)。对于衡量其服务质量,ServQual模型(Parasuraman, Zeithmal, amp; Berry, 1988)和其基于Web的信息系的修改(Li, Tan, amp; Xie, 2002)仍然是使用最广泛的方法。 ServQual提出了一种调查工具,声称对任何类型的服务机构上的服务质量进行评价。
- 拟议的决策支持系统
在第1节,对基于Web的信息系统的可用性评估研究进行了总结。他们有基本的限制是,他们只是管理李克特式清单的最终用户(可用性测试)或者通过可用性专家的方式来采取启发式评估。他们不提供可用性专家的分析基础或数字的证据,将就改进和补救的重要性对新兴的可用项目进行排名。这些方法强烈依赖于特定的最终用户或领域专家有代表性的样品池提供的评估结果,等价评价结果基于每个清单维度的平均分值。他们主要忽略的是,是否提高某一特定的可用性问题,最终会影响最终用户的可用性感知。换言之,他们揭示的WIS系统可用性方面的问题,建议调查评价平均得分越小,清单项目就越重要,因此,应优先于它的改进。然而,他们忽略了一个单元的影响,这个特定的清单项目的最终可用性的看法,即整体的可用性。尽管一个可用性清单产品相当低(由最终用户或可用性专家严重评估),改变/改进它可能会或可能不会对WIS的最终可用性有很大的改进分析。因为时间和精力应该集中在一个值得的可用性问题上,最终将在可用性上有一个显着性的差异,这两个标准应考虑可用性评价过程。因此,在这项研究中,我定义了一个综合指标,临界指数,这需要两个措施考虑,并且可以如等式(1)来计算。
临界指数 = 敏感性评分
*(1)
敏感性评分是指清单项目在解释因变量(整体可用性)和独立变量(清单项目)之间的因果关系的重要性,将在2.2.3节详细解释。另一方面,清单的平均评价分数,是很直接的,但要取它的倒数的原因,需要进一步的解释,给出如下的解释。此值越小,清单项目就越重要。然而,灵敏性分数更大,清单项目就越重要。为了使这两个相互矛盾的值可比并合并于一个指标(即临界指数),于是使用平均清单评价分数的倒数。决策支持系统(DSS)随着UWIS清单的使用如图1所示。
图一、决策支持系统(DSS)
所提出的方法的第一步是收集从具有代表性的最终用户的样本数据,以便能够应用的可用性测试过程。数据由Oztekin等人通过UWIS清单开发收集(2009)。表1简要介绍了UWIS清单项目和相应的问题。在整个文献进一步使用中,我指的是清单的问题/项目作为预测WIS总体可用性的输入变量,通过使用作为第一,第二,和第三个问题相关的UWIS清单的“可靠性”维度的缩写符号如RL1,RL2和RL3。
表1、UWIS维度,简称项目及相关问题
相关 |
|
UWIS维度和他们的缩写符号 |
相关的UWIS清单问题 |
可靠性 |
|
RL1 |
替换或恢复默认设定容易吗 |
RL2 |
系统是否充分引导新手用户? |
RL3 |
没有不必要的注册? |
RL4 |
在用户需要的服务执行时是否有回拨系统或电子邮件系统告诉用户 |
RL5 |
执行任务(计划、执行、纠错)和任务复杂度是否足够? |
保证 |
|
A1 |
重要的控制按钮是否在屏幕上,并且是否清楚它们是如何工作的? |
A2 |
语气的信息始终是有礼貌的吗? |
A3 |
系统上的安全声明和电子邮件通知吗? |
A4 |
比起没有系统,系统是否使用户的工作更容易和快速? |
反应性 |
|
RS1 |
做自动或人性化的电子邮件或服务的网页给用户提示服务了吗? |
RS2 |
是否有电子邮件系统的入站和出站处理用户投诉? |
RS3 |
在整个系统中使用术语、图形和菜单吗? |
RS4 |
是在任何时候提供帮助(窗口标题,操作指南)? |
通信集成 |
|
I1 |
用户技术语言的术语和缩写部分是什么? |
I2 |
有相关的FAQs帮助用户解决自己的问题吗? |
I3 |
设备上的按钮的功能是显而易见的吗? |
导航 |
|
N1 |
系统监测用户最后一次回话或者操作了吗? |
N2 |
是否提供任何的导航帮助(例如发现工具) |
N3 |
打开不必要的新浏览器窗口被避免了吗? |
可控性 |
|
C1 |
能通过明确标示的出口和/或继续后在任何时候被打断对话吗? |
C2 |
是否提供了在任何阶段(如链接回到主页),返回到顶部的措施? |
质量信息 |
|
Q1 |
是否包含在系统当前、及时、准确和相关的信息? |
Q2 |
是否有一个层次的组织信息从一般到具体? |
Q3 |
信息是否提供语言选项? |
输出变量(WIS系统的总体可用性)是表示这个清单的最后一个问题。我用了一个5点的李克特量表,锚点从强烈反对(1)到非常同意(5)。因此,在决定可用性得分是否满意时,我采用了4(等价于“同意”)作为阈值的李克特分数。换句话说,清单问题测量WIS系统的整体可用性应被评为4或更高的平均可以认为整体WIS可用性令人满意。如果是这样,假设最终用户找到足够的可用系统,则不需要进行进一步的分析。否则,评估过程如下进行。因为输出变量和所述输入变量之间的复杂关系是未知的先验,下一步就是要找到解释考虑各种性能的措施(即错误率和相关性)这种潜在的复杂关系的最佳预测模型。然后,计算每个输入变量的临界指数,即每个清单项目,以降序排列它们。这个排名将有助于确定哪些变量首先提高稀缺的时间和金钱的限制。伪帕累托图会是唯一最有效的清单项目,确定WIS的可用性问题非常有用。帕累托法则(Pareto,1971年)基本上声称80%的问题源于20%的原因。因此,并不是所有的原因都着手处理,这个规则说明处理20%的原因将帮助解决80%的问题。通过这种方式,最严重/最关键的可用性问题可以揭示和改进,以提高WIS的整体可用性。如图1所示,可用性评价算法实际上是一个循环,只有当达到了预期的可用性水平时才终止。请记住,对于“整体可用性令人满意”我采用了上述的4/5作为阈值。
2.1预测模型
输出变量和输入变量之间的关系是由预测模型来解释的。我用了四种不同的模型来揭示这些关系:多元线性回归,决策树,神经网络,支持向量机。这组预测模型的选择是由于其在文献中的普及。下面的章节简要地描述这些模型。
2.1.1多元线性回归
多元回归的通用(Pearsonamp;Lee,1908)是了解几个独立变量之间的关系(即外生变量,变量,输入变量,预测变量或解释变量)和因变量(即输出变量或回归)。这是一个简单的线性回归的延伸。不同的是,它假定一个以上的预测变量的信息是可用的,因此这些预测变量可以与输出变量回归。这种建模技术的主要缺点是双重的:(a)假设输入变量之间没有相互作用(没有共线性)和(b)它假定的输出变量与输入变量之间是线性关系(Weisberg,1980)。
2.1.2决策树
根据预设的标准(例如,信息增益)在分支决策树递归分割数据以最大化导致树状结构的预测准确性(Quinlan,,1986)。为了实现这一目标,他们使用的数学算法(如信息的增益,基尼系数,和卡方检验),以确定一个双变量及其阈值,将输入观察分裂到两个或多个亚群。这个步骤被重复在每个叶节点上,直到完整的树被构造。分裂算法的目的是找到一个可变阈值对,最大化2个或多个亚群样本结果的同质化(有序)。热门决策树算法包括Quinlan的ID3,C4.5,C5(Quinlan,1986,1993),Breiman等人的CART(Breiman,Friedman,Olshen,amp;Stone,1984),Kass的CHAID(1980)。与其他机器学习方法相比,决策树具有的优点是它们不是黑箱模型,因此可以很容易地作为规则说明。它们图形化地展示问题之间的关系,能够以紧凑的形式处理情况。然而,如果有许多变量包含在这个过程中的话决策树可能会很麻烦(Turban, Aronson, Liang, amp; Sharda, 2007)。如果因变量是分类或序号,决策树被称为分类树;如果因变量是连续的,所得决策树被称为回归树。回归树是一组相对灵活的,计算机密集型的统计技术(例如 Efron amp; Tibshirani, 1991)。这些方法使用重复采样的数据来发展经验抽样分布的相关统计,代替经典的统计方法中更严格的分布假设。流行回归树CART和CHAID这两者都可以被用作分类和回归树。
2.1.3、神经网络
神经网络(NNs)已被用于如非线性函数和多重共线性的预测变量与因变量之间的复杂关系进行建模(Mitchell,1997年)。神经网络正式的定义是在对已存在的数据执行完所谓的“学习”过程之后能够从其他的观察值(同一或其他的变量)预测新的观察值(特定的变量)的高度复杂的分析技术 (Haykin, 1998)。神经网络在所涉及的变量的数量非常大而且变量之间的关系是复杂和不精确的
时候往往是非常有效的(Turban et al., 2007)。
2.1.4、支持向量机
支持向量机是从一组标记的训练数据产生输入-输出映射函数的进行监督的学习方法。它们属于在线性组合特点的值上实现分类或回归的广义线性模型。它们也被说成是属于内核的方法(Cristianini amp; Shawe-Taylor, 2000)。支持向量机的映射函数可以是一个分类函数(用于分类的数据,如在本研究中的情况)或一个回归函数(用于估计期望输出的数值)。非线性的核函数经常被用来将输入数据(本质上代表了高度复杂的非线性关系)转化为一个高维的特征空间,这个特征空间相比传统的输入空间里面的输入数据更加可分离(即线性可分)。然后,最大间隔超平
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[154229],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。