频繁用词提高阅读障碍患者的阅读能力和短句提高理解能力
Luz Rello1,2, Ricardo Baeza-Yates4,1, Laura Dempere3 and Horacio Saggion2
1Web Research Group, 2Natural Language Processing Group,
3Computational Neuroscience Group, Universitat Pompeu Fabra, Barcelona,
4Yahoo! Labs, Barcelona
luzrello@acm.org, rbaeza@acm.org,
laura.dampere@upf.edu, horacio.saggion@upf.edu
摘要:大约10%的人口患有阅读困难症,这是一种阅读障碍,对一个人阅读和理解文本的能力产生负面影响。以前的工作已经研究了如何优化文本。但是修改文本内容并没有得到那么多的关注。在这篇文章中,我们提出了一项眼睛追踪研究,调查阅读障碍患者是否会受益于内容简化。在一个46人的实验中,23人有诵读困难,23人作为对照组,我们比较了用较短/长和较多/较少的同义词代替单词的文本。使用更多的频繁词使阅读困难患者的阅读速度明显加快,而使用较短的单词使他们更好地理解文本。对照组间无显着性差异(Pgt;0.05)。 发现了。这些结果提供了证据表明,阅读障碍患者可以从进行词汇简化的交互工具中获益。
关键词:文本可及性,阅读障碍,眼睛跟踪,词汇简化,可读性,可理解性,词频,单词长度.
1.介绍
阅读困难症是一种神经学阅读障碍,其特点是难以准确或流利地识别单词,拼写和解码能力差。[49]
次要后果包括阅读理解中的问题和可能阻碍词汇量增长和背景知识优势的阅读经验[22]。因为有大量的信息 作为文本,这种情况使阅读障碍患者更难以使用标准的信息系统。根据文献,有诵读困难的人特别会遇到困难。 较少的词和较长的词[11,20,52]。
本文的目的是研究单词频率和单词长度在多大程度上影响以为母语的西班牙语国家的阅读障碍患者的文本可读性和可理解性。可读性指的是文本的易读性,即文本的易读性
可理解性是指文本的可理解性,即文本的易懂性。同样地,也要简化词法,这通常涉及到将困难的单词重新放置在更简单的同义词[2],我们用不同长度和频率的同义词代替名词,研究其对可读性和可理解性的影响。
这项研究的动机是:(1)研究结果的社会相关性;(2)揭示阅读障碍患者是否能从词汇简单化工具中获益的挑战。简化工具允许用更简单的同义词来交互替换复杂词.
首先,阅读困难是普遍存在和经常发生的。根据语言的不同,美国人口的阅读障碍患病率从10-17.5%到西班牙人的8.6%-11%不等。[7,23,36]
与阅读困难相关的困难也由其他有特殊需要的群体分担,例如视力低下的人[16]。此外,在大多数人中,诵读困难的症状在不同程度上是常见的。 [12]。关阅读障碍的研究如何对更广泛的公众有用的另一个例子是,对阅读困难友好的建议与更一般性的文本可访问性建议的重叠[29]。这种研究可以扩展到一般可用性问题和其他目标群体。
第二,考虑到阅读障碍是影响语言的一种障碍,我们可以假设文本的可访问性可以从两个方面着手:形式,即定制文本布局和内容, 即简化案文。尽管有一些应用程序可以为有阅读障碍的用户修改文本布局,例如Claro ScreenRuler Suite[8]、SeeWord[17]或理想的电子书阅读器[26],但是修改其设计,但不修改其内容。我们的实验模拟了可能的词汇简化策略[2],并且我们的结果激励为有阅读障碍的人开发工具来简化文本内容。
据我们所知,这是第一次用一种结合眼睛的方法,从阅读障碍患者的可读性和可理解性的角度来研究词汇的复杂性 追踪和问卷调查。因此,本文提出了以下主要贡献:
1.研究了词频对可读性和可理解性的影响,主要结果是频繁出现的词能提高阅读障碍患者的可读性。
2. 对单词长度对可读性和可理解性的影响进行了研究,其主要结果是短词可理解性提高了患者的可读性和可理解性。
3. 将这两项研究与未出现阅读障碍的对照组进行比较,发现单词长度和频率对阅读障碍的影响不显著。
论文的其余部分组织如下。第二节涉及相关工作,第三节介绍了本研究的问题和假设。第四节详细介绍了实验方法,第5节介绍了结果,这些结果在第6节中得到了详细的讨论.最后,结束语和未来的挑战在第七节中得到了阐述。
2相关工作
由于可读性对语篇理解有很大的影响,有时这两个词被交替使用。然而,先前对阅读障碍患者的研究表明,这两个概念都需要 单独考虑。例如,在[35]中,阅读障碍患者的理解能力与可读性无关,而文本可读性则可以作为一个指标。 对无阅读障碍的人的理解。因此,在本研究中,我们区分了阅读能力和可理解性.还请注意,在阅读困难的定义中,阅读能力和阅读能力 丁的理解分别处理[22]。
我们选择研究单词频率和单词长度,因为它们与单词的处理时间有关[33,44],它们与阅读障碍患者发现的困难密切相关[11, 20,52]。与本研究相关的工作可分为:(A)阅读障碍患者眼动的实验心理学研究;(B)体育理解能力的研究。 (C)患有诵读困难,和阅读障碍患者的接口。
阅读障碍读者的眼动。有大量的知识,有关眼睛运动的读者阅读困难使用眼睛跟踪。这些研究大多集中在寻找诊断诵读困难的方法上。然而,眼睛的本质- 阅读障碍患者的运动目前正在讨论中。有些人在这两个群体中发现了差异[14],而另一些人则没有[47]。与我们最接近的工作来自实验心理学 OGY[20],研究单词长度和词频对读者注视模式的影响。他们的研究结果表明,低频和长字词会出现较长的注视硬脑膜。 还有更多的重新检查。他们的研究方法集中在寻找眼动模式来研究特定的词汇,目的是摒弃阅读障碍的动眼神经功能障碍假说[20]。他们 在分析全文的同时,对单个词进行分析。
阅读障碍患者的理解能力。先前的研究了结构困难的长句[46]、句子上下文[30]以及图形格式的结合[39]等因素对语篇理解的影响。 阅读障碍的读者。与我们的工作更相关的是[46,43],他们建议,通过列入低频和长词,可以使案文更加困难。
阅读障碍患者的接口。有许多针对阅读障碍患者的应用程序可以改变文本的表示方式,例如SeeWord1[17]、Colour Explorer、2 Text4All3[49]和PenFriendXL.4等其他工具。 结合文本到语音技术,如Claro屏幕规则套件,5或理想的电子书阅读器6[26]。Dyseggxia 7[41]是一种针对阅读障碍儿童的游戏,它是一种基本的词汇修饰, 但是,就我们的知识而言,没有任何界面可以改变阅读困难的人要阅读的文本内容。
在以前的研究中缺少的是关于西班牙语中词汇复杂性的两个因素-单词频率和单词长度的知识,以及它们对阅读性能和阅读效果的影响。 阅读障碍患者的理解,以及将这些发现整合到阅读障碍患者的工具中。
3阅读障碍的词频和长度
在有诵读困难的人发现的语言困难中,较少频繁出现的单词(如原始词)和较长的单词(例如,变戏法)所带来的额外困难是特别突出的。 d[11、20、52]。词汇频率在阅读困难中起着至关重要的作用,甚至在阅读频繁的单词时,还会根据其表现来诊断诵读困难[27]。
由于词频和词长在语言中是自然相关的,我们在两个不同的实验中对它们进行了研究。这种相关性来源于这样一个事实:经常使用的表达式倾向于 随着时间的推移而变短[24]。正如Rayner等人所强调的。[33]为了揭示因果关系,必须分别研究这些方面。因此,我们的假设是:H1.1:更多的高频单词增加了阅读困难患者的可读性。
H1.2:更多的高频单词增加了阅读困难患者的理解能力。
H2.1:与长词相比,短词的存在提高了阅读障碍患者的可读性。
H2.2:与长词相比,短词的出现提高了阅读障碍患者的理解能力。
据我们所知,与阅读困难有关的其他与单词有关的困难包括:不规则单词8[9],字形相似的单词,例如加法和试听[15],同音词或假谐音词,例如天气和是否[31],外来词[11],新词,例如幻想[11],带ER-Rors的词[9],非词,例如快乐 [9]和数字表达式[40]。在实验设计中,我们没有使用这些特征的词来控制其他可能的效果。
4研究方法
在两个不同的实验中,我们将词频和字长作为两个自变量进行了研究.尽管如此,频率和长度之间的内在关系限制了选择c。 目的词的仪式,即长词不可避免地不那么频繁。
在实验中,46名参与者(23名有诵读困难)不得不阅读四篇课文,这些课文被修改为包括更多/更少的频率和更长/更短的单词。
4.1 实验设计
每个实验有两个条件。在第一项实验中,单词频率[plusmn;频繁]作为自变量,具有两个层次:[频繁]表示合适的的条件。被更频繁的同义词取代,[-频繁]表示以较少频率的同义词替换合适的单词的条件。在第二个实验中,字长[plusmn;长度]充当 具有两个层次的摆变量:[-长度]表示用较短的同义词替换合适的单词的条件,而[ 长度]表示适当的单词被长的替换的条件。
实验遵循被试的内部设计,因此每个参与者都对两项实验中的每一种情况进行了研究。条件的顺序被反平衡以抵消顺序。 效果。为了衡量可读性和可理解性,我们将阅读时间、眼睛固定时间和理解得分作为因变量。接下来,我们将详细解释它们。
阅读时间。较短的阅读时间比较长的阅读时间更好,因为更快的阅读与更易读的文本有关[50]。因此,我们使用阅读时间,即分词所需的时间。要完全阅读一篇课文,作为一种阅读能力的衡量标准.这种测量是从眼睛跟踪数据中提取出来的。
固定时间。在阅读文本时,眼睛不会连续地在文本上移动,而是交替使用扫视和视觉固定,也就是说,跳到短步骤上并停留在文本的部分上。持续时间表示眼睛停留在文本的单个位置上的时间。固定时间被证明是一个有效的阅读能力指标 。根据[25,33,43],较短的固定时间与更好的可读性相关联,而较长的固定值则表明处理负荷更大。
因此,除了阅读时间外,我们还将固定时间作为一种可读性度量。
理解力得分为了衡量文本理解,我们使用了推理项,即需要深入理解文本内容的问题。我们使用了三个选项的多项选择题。一种正确的选择,一种标准的正确选择,一种错误的选择。为了计算课文理解得分,选择分别为100%、50%和0%。
4.2 实验设计
我们有23位讲西班牙语的人(12位女性,11位男性),他们被确诊为阅读障碍(D组),他们参加了我们的研究。他们被要求把他们的诊断结果带到实验中,。 阅读障碍是在授权的中心或医院诊断的。年龄13~37岁,平均20.74岁(s=8.18)。
其中三名参与者也被诊断为注意力缺陷障碍。所有参与者都是经常阅读的人;每天11人的阅读时间少于4小时,9人的阅读时间介于4到4小时之间。 每天8小时,3名参与者阅读超过8小时。10人正在学习或已经完成大学学位,11人正在上学或上高中,2人没有更好的教育。
23名讲西班牙语的人(13名女性,10名男性)组成的对照组也参加了这项研究(N组)。年龄13~35岁,平均20.74岁(s=8.18)。那,那个 总的来说,我们有46名参与者(25名女性,21名男性)。
4.3实验材料
为了研究单词长度和频率的影响,我们需要在语境中研究目标词,即作为文本的一部分。这背后的理由是可读性和不可阅读性是相关的。文本的较长部分[19]。为了隔离这些变量的影响,文本需要在复杂性上具有可比性。在本节中,我们将描述如何设计文本、目标词和本研究使用的问卷。
基本文本。作为测试的基础,我们挑选了四篇平均长度为60.63字的短文。对于词频,我们使用了两篇关于
巴基斯坦和索马里的战争。这些是我们在西班牙单纯形语料库中能找到的最相似的文本[3]。在字长方面,我们创作了两个神秘故事,一个是关于巫师的,另一个是关于一个巫师的。 关于一辆车。在下面,我们表示这些文本与巴基斯坦,索马里,向导和汽车。
为了满足同类文本之间的可比性要求,我们对原文进行了尽可能多的修改。我们匹配文本的可读性。 通过确保用于计算可读性[13]的参数具有相同或类似的值:
(a)他们有相同数量的目标词:在单词频率实验中,每个文本有15个[plusmn;频繁]单词对,在单词长度ex中,每个文本有6个[plusmn;长]单词对。 周遭。只有在索马里(词频实验),两个目标词被重复在文本中。
(b)在每个实验中,文本使用相同的体裁,国际新闻。
(c)他们是关于相似的话题。
(d)它们包含相同数量的句子:在单词频率实验中,每个文本有四个句子,在单词长度实验中,有三个句子。
(e)每个实验的课文都有相同的字数(在单词频率实验中,两个文本都有93个单词,在单词长度实验中有33个单词)。
(f)所有的文本都有相似的单词长度,平均长度从4.89到5.50字母不等。
(g)它们包含相同数量的唯一命名实体,并且不包含外来单词、数字表达式或缩略语。
文本布局。文本的呈现对阅读困难患者的阅读速度有一定的影响[18]。因此,我们采用了遵循前人研究建议的文本布局。作为字体 类型,我们选择Arial,无
剩余内容已隐藏,支付完成后下载完整资料
英语原文共 18 页,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[278263],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。