英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料
基于文本挖掘的评估学生在线交流中表现质量的学习分析系统,
YAHYA AL-ASHMOERY *摩洛哥 电信和决策工程实验室系统(LSTED) 伊本·托法尔大学,摩洛哥科尼特拉科学学院。 yahya_new@hotmail.com
ROCHDI MESSOUSSI 决策和电信工程实验室系统(LSTED) 摩洛哥基尼特拉科学学院Ibn Tofail大学。 messoussi@gmail.com
摘要
在电子学习环境中,对于教师和研究人员而言,艰巨的任务是评估学生的表现。本文将介绍一种用于学习管理系统(LMS)的新学习分析系统,该系统将帮助和支持教师和研究人员理解和分析正在进行在线交互参与者的交互模式和知识结构。它无缝集成到Moodle中。学习管理系统(LMS)没有用于学生活动的全面审核日志和日志分析功能交互的分析工具,也缺乏对参与者水平的评估以及对学生在LMS上的绩效质量评估的支持。文本的语义相似性度量与文本相关的研究和应用扮演着越来越重要的角色,在诸如文本挖掘,网页检索和对话系统等任务中,处理LMS中的消息文本采用了用于计算句子相似度的方法。该系统使人们能够测量在交流会话期间交换的文本之间的语义相似度,以便找出讨论阶段的连贯程度,它以数字格式给出相关性值。
关键字 : 学习管理系统(LMS);学习分析;日志分析;句子相似度;本体论
1引言
学习分析为高等教育提供的宝贵见解可以为有关资源的战略决策提供分配卓越的教育。研究表明学习管理系统(LMS)可以增加学生社区意识,支持学习社区和LMS可以增强学生的参与度和成功度,因此它成为许多企业的开放大学核心组成部分。学习分析可以为教师和研究人员提供强大功能分析工具,以提供支持他们在提高效率的迭代过程中他们的课程管理,并附带加强他们的学生的表现质量。在应对这一挑战的过程中,老师和研究人员通过建立一个丰富的传统教学范式技术增强的学习环境。大多数情况下,正在使用学习管理系统(LMS)作为这种环境的基石。因此,他们精心设计的学习脚本,要求学生参与复杂的协作学习和问题解决活动,例如个人和小组任务,通过合作和交流获得知识和技能以及建立社交网络的通信(同步或异步),以及各种在线教育的使用资源等。
在这种情况下对学生的表现质量的评估技术增强的学习脚本既费时又费力,教师和研究人员的消耗过程应该考虑大量的性能指标。评估过程涉及设计适当的真实评估活动和聚会来自各种来源的信息,例如讨论日志文件,项目可交付成果和共同创造活动,以便对学生产生丰富而有意义的理解学习环境中的学习和行为。
我们的研究重点是利用可用的LMS日志来提供学习活动跟踪。一种可能的方式是LMS日志数据可用于可视化学习活动数据通过更人性化的图形界面。这个介面实时更新以反映不同的活动,也是无缝集成到LMS中。使用此图形界面,讲师可以了解全班活动或可以专注于特定活动学生或不同小组的活动。学生可以使用界面以了解他们的进度与全班的信息对比。我们的假设是该网站的可用性图形界面可以提供有关如何学生正在访问在线课程资源。本文的目的是提出一种新的学习分析系统的几个方面:
1.与在线学习平台LMS之类的在线联系Moodle,作为插件集成到LMS中2.了解异步会话的流程讨论系统。3.物化不同的代理商,以帮助教师和研究人员处于良好的协作工作环境中。4.提供汇总的不同统计报告。5.可视化结果,进行比较在多个学生或所有组之间轻松进行。6.显示学生执行的活动还可以识别学生尚未查看的材料7.它具有提醒学生查看所有他们尚未下载的资源。8.使用信息的文本的语义相似性度量内容和深度相似度方法9.短信内容分析。10.找出两者之间关系的相关性消息。11.建议老师和研究人员帮助他们进行管理远程课程来通知他们不同学生的知识状态。可视化概念的重要挑战之一是在给定的条件下显示尽可能多的信息良好的显示区域,不会造成过载或混乱显示或观看者的认知能力。全面审查了现有的不同工具后,我们认为这一挑战到目前为止已经发展起来的。下图1提供了一个这些系统工具及其特征的概述。
图1 可视化工具(包括我们的工具)的比较
所有这些工具都是不同的,各有优势和缺点。他们几乎都会产生单个讨论线程或单个讨论的可视化互动结果。在本文中,我们重点介绍一些与Moodle互操作的学习分析工具。以下内容:1.GISMO是Moodle的可视化工具,它使用记录数据,对其进行处理,最后生成图形可供教师用来检查的表述社交,认知学生行为或者与学生互动。该工具与Moodle结合在一起,作为内部的补充模块图形环境,只有老师才能看到。它提供分析统计表示并显示整体学生的总体情况,分析所有学生在所有学科上的学习过程。它也可以提供特定的分析统计表示学生,资源和活动。2. MOCLog 是用于分析的工具,它在在Moodle中显示日志数据,该工具发展历程基于GISMO。因此,某些GISMO的生产统计报告的主要组成部分教育者和学生已被重用。 MOCLog尝试分析在线课程中发生的互动,以对产品和产品进行更好的分析教育过程本身。区分用户根据他们在系统中的角色(课程经理–老师–学生)并为这些角色提供不同的统计报告。因此,系统的用户拥有访问与动作相关的互动的汇总结果以及特定范围内的教育资源和教育工具主题,例如测验,作业,Wiki等。3. Excel Pivot Tables 可用于来自Moodle的学习统计数据的产生,从电子表格形式的日志文件中导出数据(Excel),用户可以通过它输入数据并创建数据透视表。图形结果称为“汇总表”报告。借助该工具,用户可以相对轻松地并快速分组整理大量数据,从数据中产生并执行的重要信息,然后立即对这些数据进行复杂的计算。4.分析和建议。这是一个对学生行为可视化的工具,学生参与在线课程的每项活动以及使用咨询工具,可以向学生推荐能使他们提高自己素养的活动。该工具使用表格和图形,并添加了特殊的着色,以便使呈现的信息更容易理解。上述所有工具均提供了多种功能,可尝试支持教师评估从而进行有效性在线课程设计,以提高其质量并为找出干预和改进的机会。
2我们的工具系统的措施
拟议的战略包括三个主要步骤:
下列:(1)用户活动的统计报告(2)视觉小组和监控学生(3)文本工具的语义相似性度量
图2 我们系统的结构
学习分析指标
我们工具系统中的一些指标如下:
A.用户活动摘要
该系统提供了有关多久一次的丰富信息以及学生与LMS互动的强度。
图3 用户活动的总结
B.课程活动摘要
此统计视图列出了有关正在进行的消息活动,例如:
1.在论坛讨论中向学生发送消息。
2.聊天中的学生消息。
3.学生是电子邮件中的活动消息。
4.活动总数,平均值,标准差(Std开发)和百分比。
5.按活动升序对学生列表进行排序。
图4 课程讯息活动
C.映射异步讨论系统
这有助于他们了解对话的流程论坛讨论,我们可以从中获取有关node的所有信息
鼠标在其上移动,如图5所示。
图5 监视异步讨论系统
具有与之相关的统计数据的指标可以方便用户在讨论论坛上进行不同活动。该指标主要的目的是提供对以下活动:
(1)阅读消息(2)查看已发布的课程材料或作业在论坛中(3)发布新消息(或开始新讨论)(4)回复了邮件和文档。
图6 用户在论坛讨论中的活动
3语义相似性度量
在许多研究领域,例如心理学,语言学,认知科学与人工智能,计算词之间的语义相似性是一个重要问题。语义相似性或语义相关性是定义度量在一组文件或术语上,它们之间距离是基于其含义的相似性还是语义内容相似性的估计(例如,字符串格式)。这些是用于估算的数学工具单位之间语义关系的强度语言,概念或实例,它们通过数值根据比较而得到,以便描述支持其含义或描述其含义的信息性质。具体而言,可以通过以下方式估算语义相似度:通过使用本体来定义拓扑相似性术语/概念之间的距离。例如比较部分排序的概念的度量有序集并表示为有向无环图的节点。例如,分类法是连接两者的最短路径概念节点。基于文本分析,语义相关性语言单位(例如单词,句子)之间也可以使用统计方法进行估算从合适的文本中关联单词和文本上下文语料库。
A.分类学
语义相似性的概念相比语义相关性,因为后者包括以下概念:反义词和代词,而相似性则不然。然而,许多文献将这些术语互换使用带有语义距离之类的术语。本质上,语义相似性,语义距离和语义相关性的意思是,“术语A与术语B有多少关系?”的这个问题的答案通常是-1和1之间的数字或介于0和1之间,其中1表示相似度极高
B.语义相似度
语义相似性或语义相关性是测量一组术语或文档之间的接近程度其含义的上下文。我们有两种不同的方法用于计算语义相似度,一种是通过定义拓扑相似性,使用本体定义距离单词之间或使用统计手段(例如向量空间)模型以将合适的单词和文本上下文相关联文本语料库。我们专注于使用WordNet本体的前一种方法语义相似度计算。相似度计算方法依赖于这样一个事实,即相似性取决于两者物体的共同特征。Resnik引入的另一种方法,信息内容基于方法捕捉概念的信息部分;高信息含量意味着更多相关性和特定性比下一个更低。基于路径长度的方法根据概念之间的距离来衡量相似性在本体中。相似性度量、参数长度,深度和局部密度构成非线性函数的一部分测量概念之间的相似度。
C. WordNet:
WordNet是英语的语义网络数据库由普林斯顿大学开发。的某些版本词网。已经以多种语言开发。基本部分WordNet的同义词是一个概念的同义词集。同义词集在某些模型中是相关的,例如hypernymy(类型),和反义词(相反的词)。WordNet中的语义相似性可以分为两个方法,称为路径长度和信息内容方法。路径长度方法是计算节点数或分类中节点之间的关系。距离更短两个概念之间有较高的相似性的优势路径长度不取决于语料库的静态和单词分配。弱点是分类法,它具有统一的距离。 WordNet是英语的词汇本体。它将词汇知识建模为分类层次。WordNet包含三个数据库,一个用于名词,一个用于动词一个用于副词和形容词。术语和概念是组织成同义词集(同义词术语或概念列表)。我们只考虑了is-a关系和名词概念用于相似度计算的WordNet层次结构。我们使用WordNet 3.1,其中包含9个单独的名词包含两个概念之间的路径的层次结构可能不会在WordNet中存在。因此,我们创建一个根节点在WordNet中包含所有九个给定的层次结构。
图7 WordNet名词分类的摘录
D.语义相似度计算图
语义相似度计算图如图所示图6。我们提出了语义相似性度量策略由两个阶段组成:1.文本分析模块2.计算语义模块
图8 语义相似度计算图系统
阶段1:文字分析模块
此阶段包括四个主要的处理设置,处理和过滤文本:1.文本规范化。2.学期中断。3.停止单词删除。4.词干和词条去除
1.文本规范化
文本规范化是将文本转换为以前可能没有的单一规范形式。在存储或处理文本之前对其进行规范化可以关注点分离,因为可以保证输入在对其执行操作之前保持一致。文本规范化需要知道什么类型的文本进行标准化以及之后如何处理,没有通用的标准化程序。规范化是您可以进行执行文本的某些转换以使其变形。假设您要搜索或排序文本,在这种情况下,您需要将该文本标准化为代码点相同的文字。标准化适用于您需要转换带有变音符号的字符,全部更改字母大写,分解连字或转换一半片假名宽度到全角字符等等。例如 :字符串s1 =“Tĥiuml;ŝĩscaron;acirc;fůňķŷScaron;ťŕĭńġ”→=“这是时髦的字符串”
2.学期中断
文本分为句子。然后,每个句子中的术语是提取为特征。一个词被视为一个词的词干字。
3.默认英语停用词
停用词是被自然语言数据(文本)处理之前或之后过滤掉的词,所有停用词在文本中都应被被删除。
4.词干和词条去除
语言学中的词法化(或词法化)是一个过程将单词的不同变形形式组合在一起的方法。它们可以作为一个项目进行分析。在计算中语言学,词形化是确定给定单词的引理。过程可能涉及复杂的任务,例如理解上下文和确定句子中单词的词性(例如,需要了解某个语言的语法语言),对于新语言。在许多语言中,单词会以几种形式出现变形形式。例如,在英语中,动词“ to walk”可能显示为“去走路”,“行走”,“为了走路”,“走路”。可以在字典中查找的形式为“走”这个词的引理。基本形式的组合带有词性的词通常被称为单词的词素,将其合法化并阻止他们之间的紧密相关。区别词干对单个单词进行操作而没有对上下文的了解,因此不能区分单词之间的含义不同,具体取决于词性,通常容易使实施和运行得更快,降低的精度可能不会对于某些应用很重要。在语言形态学和信息检索中,词干是减少变形(或有时衍生)的过程词干,词根或词根的形式通常是书面形式。
阶段2:计算语义模块
我们使用不同的算法来计算语义具有两个消息的文本之间的相似性度量不同的方法:1.信息内容2.接近边缘一种算法中语义相似度的度量以下:
1.路径长度
2. Resnik相似度
3.林相似度
4.江-康拉斯距离
5.吴和帕尔默测度
我们将在下面解释所有算法:
1)路径长度算法
<p
剩余内容已隐藏,支付完成后下载完整资料</p
资料编号:[239081],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。