用于学习和做统计和概率的软件 – 从个人角度回顾和展望外文翻译资料

 2021-12-29 22:07:56

英语原文共 15 页,剩余内容已隐藏,支付完成后下载完整资料


用于学习和做统计和概率的软件 –

从个人角度回顾和展望

Rolf Biehler

德国帕德博恩大学

摘要

本文讨论了支持学习和做统计的软件要求。它回顾了20世纪90年代,并期待这些工具面临新的挑战,这些工具源于统计知识的最新概念和大数据的挑战,即数据在社会中的爆炸式使用以及数据科学的出现。从统计教育工具要求的角度来看,重点是Fathom,TinkerPlots和Codap。在小学和中学教育以及职前和在职教师教育等各种教育背景下使用这些工具的经验和成功条件都有得到说明。数据科学带来的新挑战需要具有新功能的新的教育工具。 本文从最近的一个高中数据科学教育项目中获取经验并形成了一些想法。

关键词:学习和做统计的软件;软件的关键特征;数据科学教育;统计素养

1.介绍:一个简单的回顾

Amelia McNamara(2015)最近重新讨论了软件如何支持学习和统计的观点。 她善意地参考我的论文Biehler(1997),在这一论文中这个主题在某些特定历史条件下被讨论。 本文开始回顾1997年论文的起源,其中阐述了未来软件工具用于统计教育的愿景。 程序Fathom,TinkerPlots和Codap实现了许多设想的功能,但也必须从在各种教育环境中使用它们的角度进行讨论。1997年的论文基于1994年在马拉喀什举行的ICoTS 4上的一次演讲,并进一步受到Carmen Batanero于1996年在格拉纳达组织的关于统计教育技术的会议的启发(Garfield&Burrill,1997)。 它基于关于概率和统计教育的内容和工作方式应该是什么的多个假设和愿景。一个更清晰的标题就是:一个软件实现两个目标:学习和统计。本文反映了统计学领域的当代变化,如探索性数据分析(EDA)的出现(Tukey,1977)和大量使用模拟的计算推理统计学的增长(Efron,1982)。EDA将交互式,重度图形化的探索放在焦点上,并与多变量数据集配合使用。概率建模可以扩展到新的领域,因为计算工具允许克服模型的使用,只有相对简单的假设可以用分析方法跟踪。可以通过计算建模来研究更复杂和逼真的模型。模型可以与实际数据相关联,以便可以在建模周期的下一步中验证和更新模型。

如果我们想在入门教育中实施这些新实践,我们需要足够的类似于实践中使用的那些计算工具。另一方面,计算技术有可能通过交互式可视化、通过提供用于实验方法的环境以及通过使用模拟使概率支持主动学习。有几个程序 - 我们今天会调用applet - 问题是:我们能想象一个统计工具,同时可以支持创建支持主动学习的交互式applet。基于这种方法,问题是计算工具应该具备哪些特征,以便它能够支持在高中和大学入学层面的课程中以类似模型的方式在介绍性统计和概率教育中进行这些新实践。在统计本身的背景下,自1980年代以来,已经开发了各种工具,旨在支持新的统计做法。一方面,编程语言S已经开发(Becker,Chambers,&Wilks,1988),另一方面,Data Desk是使用图形用户界面进行探索性统计的新原型工具(Velleman,1989)。最初,DataDesk仅适用于Apple Macintosh计算机。 Windows操作系统是在20世纪90年代之前开发的。 S现已被R取代,R已成为统计和统计方法研究的标准工具。从当前可用的工具中,JMP与交互式风格的Data Desk类似,而Data Desk仍然可用。关于它们所包含的统计和图形方法,JMP和R这两个工具当然要先进得多。此外,还详细说明了用户界面。这些最近的工具都有教育用途,例如,卡夫(2016年)为JMP和Gould等人。(2016年)为R.教育用途部分完成了这些工具的调整,以更好地适应学生的需求和技能。

2. 1997年论文背景,关于软件实现以及实现学习概率和统计的愿景

1997年的论文是由课程和软件开发项目MEDASS(与EDA和随机模拟相关的建模)的一个失败引起的。该项目的目标是为中学教育中的数学,历史,政治科学和地理学这些相互交叉的课程开发课程材料。数学教师应该找到数学课堂中使用的数据的背景信息,地理,社会和政治科学教师可以通过参考数学教师的材料获得她在课堂上使用的统计和图形方法的背景信息。这些材料被发表(Kohorst,1992; Noll&Schmidt,1994; Portscheller,1992)。同时,项目团队开发了支持跨课程探索性数据分析的软件工具的要求。雇用开发软件的软件公司最初同意实现规范,但最终退出协议。我们首先将这一要求作为MEDASS软件概念的200页扩展规范(Biehler&Rach,1992)来鼓励我们发布我们的要求,1997年的论文是重点的总结,希望本文可能影响未来的发展,它似乎确实做到了。作为计算机科学的硕士论文,我们称之为MEDASS light的更为简单的版本是在20世纪90年代末开发的(Bauer,Biehler,&Rach,1999)。

形成我们思维的可用工具 - 在专业方面 - 使用命令语言界面,工具S,Splus(后来的R)和ISP-PC,由Peter Huber在20世纪80年代后期开发用于PC(Huber,2000)。我们还使用图形用户界面查看了DataDesk和Statview(当时仅适用于Apple Mac计算机)。我们考虑的另一个工具是Survo 84c(Mustonen,1992; Puranen,1994),其中命令语言代码可以嵌入到文本文件中 - 从而创建一个所谓的“sucro”并有选择地执行,这是今天的早期版本在Jupyter笔记本电脑(Toomey,2017)中是可能的,我们将在下面更深入地讨论。在教育方面,我们有路线型角色和风景型角色的节目。这种区别是由Arthur Bakker(2002)后来创造的。路线类型的计划包括交互式模拟,实验和某些学习目标的可视化。示例包括显示平均值对偏离值的敏感度或在回归上下文中可视化平方残差的总和。在景观类型的软件中,我们看过DataScope(1994)和Konold(1994)开发的模拟软件ProbSim,它们是从20世纪80年代末开始创建的。另一个相关工具是由Chris Hancock(1995)开发的桌面。但是,有人一致认为,原则上,机会(概率)和数据不应该由两个不同的工具单独处理,因此我们想象一个支持两者的工具:模拟和数据分析。几年后,这些要求在Fathom和TinkerPlots中以略微不同的方式实现。

从这个分析来看,我们的第一个基本要求是中等规模的“模型工具”,它与专业工具有相似之处,但具有更合适的学习曲线,涵盖了基本的统计方法,并支持统计学中的探索性工作方式(在EDA中,在推论统计中)并且关于统计图表)。它应该可以通过模拟而不是使用分析概率模型来研究统计方法的属性。参考了Thisted(1986),它将三种类型的功能环境“数据分析环境”,“蒙特卡洛工作台”和“理论统计学家的环境”区分开来。这个模型工具可以实现类似于学校外的实践的统计和概率模拟,并学习这种工具必不可少的实践。在第一种意义上,模型工具也是学习(实践)统计的工具。建议包括开发具有直接操作数据的图形用户界面的工具,仅在需要时才具有命令语言输入功能(例如Fathom后来开发了公式编辑器)。我们将在下一段讨论如何在Fathom和TinkerPlots等工具中实现这些要求。GUI工具的一个基本限制在于,操作不会记录为一系列命令,因此我们的愿景包括一个具有类似于S的历史功能的日志播放器/记录器的工具。但是,这样的记录或历史记录功能从未在这些工具中实现。最新的发展是iNZight(www.stat.auckland.ac.nz/~wild/iNZight/),它基于R语言.这里可以包含这样的录音功能,似乎有计划实现这样的 iNZight中的功能,同时为学生提供简单的访问。

第二个基本要求是设想的工具也是创建特定目的学习环境或微观世界的元工具。编程应该主要通过例如在电子表格中编程来编程,而不需要通常使用编码。由此产生的微观世界可称为“嵌入式微观世界”。它们的基本特征是它们可以在没有特定编程语言的专业知识,但具有托管软件环境的知识的情况下进行更改和调整。这种适应性优于独立的微观世界。

3.学习和统计的工具:自2000年的愿景与事实

诸如Fathom(自2002年以来,fathom.concord.org)和TinkerPlots(自2005年以来,www.tinkerplots.com)等工具实现了1997年愿景的许多方面以及更多,侧重于学校教育和大学初级教育。 Konold(2007)提供了从早期软件起源和软件概念设计TinkerPlots的背景知识。我的工作小组创建了德国Fathom(2006)和TinkerPlots(2017)(www.stochastik-interaktiv.de)。基于Fathom和TinkerPlots的经验和特征的工具是Codap(codap.concord.org)。它还没有Fathom和TinkerPlots的功能,但超出了这些工具,例如,它提供了一个现代的分层数据结构,并包括基于位置的数据的地图和设施。专家程序员可以不断添加应用程序和功能。最近,一个用于TinkerPlots风格的基本模拟的采样器正在开发中,并且已经添加了用于实现决策树的工具。一个有吸引力的功能是Codap是基于网络的,免费提供。其他语言版本很容易创建。在我们的本地化中,我们使用我们为Fathom和TinkerPlots的德国本地化开发的术语来创建Codap的德语本地化。

如果没有优秀的开发人员和统计教育工作者团队从国家科学基金会NSF和其他来源获得的数百万美国公共资金,那么Fathom,TinkerPlots和Codap的发展就不可能。这些工具并未取得巨大的商业成功,但已在包括英国,以色列,美国,新西兰,澳大利亚和德国在内的多个国家的许多研究试点项目中使用。 Biehler,Ben-Zvi,Bakker和Makar(2013)的论文最近对现有软件工具,这些工具和相关研究的学习环境进行了回顾,并更新了用于学习和统计的软件工具的要求。除了已经提到的这三种工具之外,还有更多的发展。一个受同一基本理念启发的工具是iNZight,已经在上面提到过,它是一个免费的工具。它基于编程环境R,但提供类似于Fathom,TinkerPlots和Codap的图形用户界面。

4.学习以及统计和概率工具-它们在教育背景中的使用

1997年的论文设想了一个用于许多目的的工具。然而,在我们在卡塞尔和帕德博恩大学的研究和开发项目中,我们在不同的大学教师教育,学校背景和在职教师的专业发展课程的背景下使用不同的工具。

以大学为基础的职前教师教育

帕德博恩的学生教师必须获得概率和统计学方面的内容知识和教学内容知识。中学教师(5至10年级)有两门关于这些课程的单独课程,而小学教师(1至4年级)则必须参加综合课程。我们在中学教师课程中使用Fathom,在小学教师课程中使用TinkerPlots。这些背景允许一学期的强化学习和使用一种工具,通过这种工具,我们的学生可以在概率建模和统计数据分析(探索性和推理性)方面获得适度的专业知识。没有Fathom(中学)和TinkerPlots(小学),这个成就很难想象。然而,事实证明,尽管这两种工具对于学生来说相对容易学习,但学生需要大量的支持和仔细的学习整合去使用这种工具并且学习概念和方法。例如,我们开发了多媒体工具eFathom(Biehler&Hofmann,2011; Hofmann,2012),它介绍了使用Fathom进行数据分析和模拟。eFathom适合学生通过四个模块进行自我调节学习,这四个模块使用文本和视频教程以及与Fathom相关的活动。我们的经验与数学工具在数学教育的其他领域中使用的经验和研究产生共鸣,其中组织一种精心的工具性起源,通过工具编排将软件转化为学习者的思维工具的作用得到了广泛的认可(Trouche,2004)。

因此,成功条件包括:教师对工具的约束和可供性进行了仔细分析,教材在基于设计的研究周期中进行了测试,实现了整合内容和工具学习的细致“教学编排/工具起源”,以及学生的困难和工具推理一直是详细的实证研究的对象。此外,学生需要支持学习复杂的多步骤活动。为了指导模拟,我们开发了“模拟和建模方案”(Maxara&Biehler,2007)。为了指导数据分析,我们开发了关于如何保存“数据日记”或如何撰写简要报告的想法(Biehler,2005,2007)。Wild和Pfannkuch(1999)的过程模型用于简化版本。我们还实施了如何在课程中将内容知识和教学内容知识联系起来的想法(Batanero,Biehler,Engel,Maxara,&Vogel,2005)。

德国学校的统计和概率教育

学校层面的实施面临更多困难。德国学校的许多数学教师都不会觉得自己是统计学家或概率建模者,也不打算长时间深入地教授这些活动。大多数教师并不一定渴望使用Fathom或TinkerPlots这样的工具来使他们能够进行这种教学。 此外,许多人认为他们没有时间来教授仅仅适合概率和统计的工具,而更喜欢(如果有的话)更通用的工具,如GeoGebra,EXCEL或卡西欧或德州仪器(TI Nspire)的图形计算器。

德国的国家标准(KMK,2012年,2004年)强调数据和机会是主要思想之一,但小学和初中的课程并没有为概率和统计分配太多的强制性时间。它与课程一致,避免对实际数据集进行任何大量工作并避免使用模拟。用于5至10年级概率和统计的总时间平均每年不到一周。即使教授统计工具,它们也可能不会被用于数据探索。例如,虽然箱形图已经成为大多数中学课程的一部分,但学生们通常只学习为玩具数据集构建它们,并且从未在真实多变量数据集中体验其用于组比较任务的能力。

这种情况也不利于广泛的综合工具使用。高中课程不包含数据分析,但侧重于概率和推论统计。鼓励和规定软件使用以用于模拟,交互式可视化和计算(例如具有二项式或正常概率)。一

全文共21568字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[3091]

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。