英语原文共 13 页,剩余内容已隐藏,支付完成后下载完整资料
教育数据挖掘研究的调查
Richard A.Huebner
挪威奇大学
摘要
教育数据挖掘(EDM)是一个新兴学科,侧重于应用数据挖掘工具和技术教育相关数据。学科重点分析教育数据开发模型改进学习经验和提高机构效率。文献综述教育数据挖掘之前,海湾的话题,例如保持率和损耗,个人推荐系统在教育、如何使用数据挖掘来分析课程管理系统数据。当前文化和进一步研究的机会之间的间隙摆在眼前。
关键词
教育数据挖掘 学术分析 学习分析 制度
简介
压力在高等教育机构提供最新的信息制度的有效性(C.Romero amp; Ventura,2010)。机构也越来越负责学生成功(Campbell amp; Oblinger,2007)对这种压力的一个反应是对教育相关数据寻找新的方法来分析和应用数据挖掘方法。尽管数据挖掘(DM)已经被应用在很多行业和领域,DM教育上下文的应用程序是有限的(Ranjan amp; Malik,2007)。研究人员发现,他们可以将数据挖掘应用去丰富来自课程管理系统的教育相关的数据,如Angel,Blackboard,WebCT,Moodle。新兴的教育数据挖掘领域(EDM)应用了数据挖掘独特的方式来解决教育相关问题。
最近的文学教育相关数据挖掘(EDM)。教育数据挖掘是一个新兴学科,侧重于数据挖掘工具和技术应用到教育相关数据(Baker amp; Yacef,2009)。研究人员在EDM关注话题从使用数据挖掘来提高机构效率应用数据挖掘在改善学生的学习过程。有一个广泛的话题在教育数据挖掘,所以本文将专注于数据挖掘方法,用于提高学生成功和过程直接关系到学生的学习。例如,学生成功和保留,个性化推荐系统,评估学生的学习在课程管理系统(CMS)的广泛领域内的所有主题教育数据挖掘。
研究人员感兴趣的教育数据挖掘建立教育数据挖掘(2009)和《华尔街日报》从2008年开始的年度国际会议。EDM文献从几个参考学科包括数据挖掘、学习理论、数据可视化、机器学习和心理测验学(Baker amp; Yacef,2009)。最早的一些作品发表在《人工智能教育、会议和人工智能教育的国际期刊。有趣的是,人工智能是一个大型数据挖掘的一部分,这就是为什么我们看到早期教育数据挖掘论文人工智能相关的出版物。
本文的目的是提供一个教育数据挖掘研究的调查。教育数据挖掘的具体应用描述,其中包括学生保留和摩擦,个人推荐系统,和其他数据挖掘研究在课程管理系统。本文结尾识别差距在当前文学和进一步研究的建议。
数据挖掘的背景
大数据是一个术语,描述的数据量的增长是用于一个组织和潜力分析数据时发现新的见解。IBM建议大数据跨越三个不同的维度,包括体积、速度和种类(IBM,2012)。组织有一个筛选所有信息的难题,和需要的解决方案。数据挖掘可以帮助组织发现有用的信息,以指导决策(Kiron,Shockley,Kruschwitz,Finch,amp; Haydock,2012)。数据挖掘是一系列的工具和技术来发现隐藏的模式和数据之间的关系(Dunham,2003)。数据挖掘也一步在整个知识发现过程中,组织要发现新的信息从数据以帮助决策过程。知识发现和数据挖掘可以被认为是决策和组织效能的工具。数据挖掘的复杂性导致数据分析社区建立一个标准的数据挖掘的流程活动。
数据挖掘的交叉行业标准过程(CRISP-DM)是一个生命周期的过程开发和分析数据挖掘模型(利文斯,2010)。CRISP-DM过程是很重要的,因为它给特定的技巧和技术如何从理解的业务数据通过部署一个数据挖掘模型。CRISP-DM有六个阶段,包括业务理解、数据理解、数据准备、建模、评估、和部署(Leventhal,2010)。CRISM-DM的好处是,非专利和软件厂商中立,并提供一个坚实的框架,用于指导数据挖掘(Leventhal,2010)。模型还包括模板来帮助分析。这个过程中使用大量的教育数据挖掘研究(Luan,2002;Vialardi et al .,2011;Y.-H.Wang amp; Liao,2011),但是可能没有显式声明。
数据挖掘有它的根源在机器学习、人工智能、计算机科学、统计(邓纳姆,2003)。有各种不同的数据挖掘技术和方法,如聚类、分类、关联规则挖掘。这些方法可用于定量分析大型数据集,以发现隐藏的含义和模式。数据挖掘是一个探索性的过程,但可以用于确认调查(amp; Thearling Berson,史密斯,2011)。它不同于其他的搜索和分析技术,数据挖掘是高度探索性,其他分析通常问题确认。
而数据挖掘被应用在各种各样的行业,政府、军事、零售、和银行,数据挖掘并没有得到太多的关注在教育背景(Ranjan amp; Malik,2007)。教育数据挖掘的研究领域,分析和数据挖掘应用于解决教育相关的问题。应用数据挖掘这种方式可以帮助研究者和实践者发现新的方法来发现在大量的教育数据模式和趋势。
教育数据挖掘的背景
有不同的方法,教育数据挖掘的定义。Campbell和Oblinger(2007)定义的学术分析使用统计技术和数据挖掘的方式帮助教师和顾问会变得更主动地识别高危学生和相应的响应。通过这种方式,数据挖掘的结果可以用来提高学生记忆。学术分析侧重于过程发生在部门、单位,或学院和大学水平。这种类型的分析并不关注每个课程的细节,因此可以说,学术分析有一个宏观的视角。学术分析可以被视为一个分场的教育数据挖掘。
Baker和Yacef(2009)把EDM定义为“一个新兴学科,关注发展与方法探索独特的类型的数据,来自教育设置,并使用这些方法来更好地了解学生,和他们学习的设置”(Baker amp; Yacef,2009,p.1)。他们的定义并没有提到数据挖掘,让研究人员开放,探索和开发的其他分析方法可以应用于教育相关数据。同时,许多教育工作者不知道如何使用数据挖掘工具,因此有必要为了方便教师针对数据进行高级分析属于他们(在线CMS数据等)。他们的研究的一个优势是它提供了一个广泛代表性的EDM领域迄今讨论该领域的著名论文。然而,他们的研究文章引用的数量来评估EDM的增长。也许未来的研究可以使用更广泛的角度在评估这门学科的发展。
在评估上面的两个定义,教育数据挖掘是一个广义词,着重于几乎任何类型的数据在教育机构,而学术分析具体数据相关制度有效性和学生保留问题。如前所述,纪律依赖于几个参考规程和在未来,将会有额外的EDM的跨学科性质的增长。随着学科的发展,研究人员将需要改进EDM的范围和定义。在这个早期阶段,是很有帮助的有一个更全面的分类研究在不同区域的EDM,尽管研究人员已经建立了一个基本的分类(Baker amp; Yacef,2009)。一个缺点Baker和Yacef分类法(2009)的是,它并没有解决方面的聚类数据挖掘任务。也许未来的研究可以扩大EDM的集群方面。
教育数据挖掘的范围包括那些直接影响学生。例如,挖掘课程内容和推荐系统的发展(将在本文后面讨论)。其他领域内EDM教育过程包括分析包括招生、校友关系,课程选择。此外,应用程序特定的数据挖掘技术,如web挖掘、分类、关联规则挖掘、多元统计也是关键技术应用于教育相关数据(Calder amp; Pechenizkiy,2012)。这些数据挖掘方法主要是探索性的技术,可用于预测和预测学习和制度建设的需要。也可以用于建模的技术学生的个体差异,提供一种方法来应对这些差异从而提高学生的学习(Corbett,2001)。尽管如此,一个问题是如何机构采用教育数据挖掘来提高机构效率?
为了使教育数据挖掘成功,关键是有一个坚实的数据仓库的策略。Guan et al.(2002)讨论了如何重要的是决策者在高等教育机构有意义的信息。这是一个挑战,决策者需要的信息迅速和有效率。一些初始数据仓库项目的主要驱动因素包括增加竞争格局,和增加的责任报告等外部利益相关者的父母,董事会成员,立法者和社区领导人(Guan,Nunez,amp; Welsh,2002)。
教育数据挖掘可以从组织数据挖掘利用的想法。组织数据挖掘(ODM)专注于帮助组织保持竞争优势(Nemati amp; Barko,2004)。DM和ODM的关键区别在于,ODM依赖组织理论作为参考纪律(Nemati amp; Barko,2004)。组织将他们的数据转换成有用的信息和知识,并有效地这样做,应该获得巨大的好处,如提高决策、增加竞争力和潜在财务收益(Nemati amp; Barko,2004)。因此,EDM领域利用组织理论。因为这是一个重要的关系研究的重点在EDM可以检查各级现象的分析,从社会、组织、单位或个人层面。
EDM内的类型的研究主要集中于定量分析,这是必要的,因为数据挖掘采用统计、机器学习和人工智能技术。许多的研究提出了文献综述是案例研究数据挖掘项目都是在一个特定的机构,与单个机构的数据。定性访谈和文档等技术分析也用于支持案例研究EDM。占主导地位的研究范式是定量,结果预测的形式,集群或分类,或关联。缺点与现有的一些案例研究的结果并不一定适用于其他机构。这意味着结果高度关联到一个特定的机构在一个特定时间。研究EDM应该检查数据挖掘结果更可归纳的方法。
数据挖掘的应用
回顾相关文献在教育数据挖掘。它关注如何使用数据挖掘技术对提高学生成功和过程直接关系到学生的学习。教育数据挖掘研究考察了不同的方式,课程管理系统(CMS)数据挖掘提供学生行为的新模式。结果可以协助教职员改善学习和支持教育过程,进而提高机构效率。
学生保留和摩擦
研究表明,数据挖掘可以用来发现高危学生和帮助机构变得更加积极主动地识别和应对这些学生(Luan,2002)。Luan2002)应用数据挖掘作为一种预测什么类型的学生辍学,然后返回到学校。他应用分类和回归树(Camp;RT)——一个特定的数据挖掘技术教育数据以预测哪些学生不太可能重返学校。在这个案例研究中,菜肴应用定量和定性研究方法,揭示学生成功因素。这项研究很重要,因为它展示了成功应用的数据挖掘工具,协助学生保留的努力。如前所述,EDM的案例研究方法可能产生的结果往往不一般化。然而,研究人员应用数据挖掘的过程可以广义和用于其他上下文。它仅仅是的结果可能不是广义的数据挖掘模型。
在一个相关的研究中,Lin(2012)应用数据挖掘作为一种提高学生保留的努力。Lin(2012)能够生成预测模型是基于输入学生的数据。模型能够提供短期预测精度类型的学生将受益于校园学生保留项目。研究发现,某些机器学习算法可以提供有用的预测学生保留(Lin,2012)。
鲍伊州立大学的研究人员开发了一种基于数据挖掘的系统支持,提高保留(Chacon Spicer amp; Valbuena,2012)。他们的系统帮助学生机构识别和应对风险。他们的研究意义有助于EDM文学,因为它演示了一个成功实现和使用数据挖掘。他们的工作是高度纪律的代表,它遵循一个严格的数据挖掘过程,定量。Chacon et al(2012)的研究也支持其他工作在数据挖掘应用到学生保留问题,比如Lin(2012)和Luan(2012),所有成功的结果。Chacon等人更进一步的工作比Lin和Luan的菜肴,因为研究人员能够制定和实施他们的解决方案在生产环境中。鲍伊州立大学使用系统来帮助学生保持努力。
数据挖掘是用来评估写作中心的功效,以分析学生成绩和学生进展到下一个等级(Yeats,Reddy,Wheeler,Senior amp; Murray,2010)。他们的工作证明的能力来评估一个特定的教育支持流程,即。写作中心,为了提高机构效率。他们的研究方法结合定量和案例研究分析工作。混合方法的数据挖掘方法有助于理解更多关于数据挖掘的方法可以用在一个实际的实现。他们的研究结果并不令人惊讶,因为它发现学生参加写作中心往往会做得更好。Yeats et al .(2010)的研究采取了不同的方法来分析学生成绩,它使写作中心的出勤率和学生成绩之间的联系。它没有使学生保留链接问题,但未来研究可以检查这三个概念之间的关系:写作中心出席,学生的成绩,和保留。
在另一项研究中,三个不同的数据挖掘技术被用来确定预测的学生保留。Yu ,DiGangi,Jannesch-Pennell Kaprolet(2010)应用分类树,多元自适应回归样条函数(火星),和神经网络教育数据导致发现转移时间,居住权和种族的关键元素保留的努力(Yu,DiGangi、Jannasch-Pennell amp; Kaprolet,2010)。通过这一研究,他们还发现,东海岸的学生入学往往更长比西海岸同行。
学习成绩和学生成功利用数据挖掘技术可以预测。一个研究团队使用数据挖掘分类的学生分成三组早在他们可以在学年(Vandamme,Meskens amp; Superby,2007)。三组包括低风险、中等风险和高风险的学生。作者用了几个数据挖掘技术包括神经网络、随机森林,决策树。学生在失败的高危人群有一个高概率或辍学。这些类型的研究很重要,因为它们给教职员工的方法识别高危学生以积极的方式,因为“一旦学生决定离开,很难说服他们留下来”(与诺维奇大学主管建设效果的主任的讨论)。
在一个相关的研究中,研究人员检查了学生的人口背景是否影响他们的表现(Yorke et al .,2005)。从研究结果出现不确定的,可能因为类型的分析。有趣的是,教育数据挖掘涉及的领域分析方法,而不一定只是数据挖掘方法。Yorke et al。(2005)使用Microsoft Excel的
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[150662],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。