在选定的系统中将医学缩略语和首字母缩写词映射到医学主题词表外文翻译资料

 2022-03-22 20:57:04

英语原文共 5 页,剩余内容已隐藏,支付完成后下载完整资料


在选定的系统中将医学缩略语和首字母缩写词映射到医学主题词表

1摘要

1.1介绍:

鉴于缩略语和首字母缩写词在健康科学中的大量使用,搜索者在使用在线系统时可能会更倾向于输入这些缩写词而不是完整词组。本研究的目的是评估各种MEDLINE医学主题词表(MeSH)接口如何映射缩略语和首字母缩写词到MeSH词汇表中。

1.2方法:

本研究使用的接口为:PubMed MeSH数据库,PubMed自动术语映射功能,NLM网关术语查找器和Ovid MEDLINE。缩略语和首字母缩写词是从两个打印源中随机选择的。测试数据集包括415个随机选择的相关含义都被认为是MeSH术语的缩略语和首字母缩写词。每个缩略语和首字母缩写词都被输入到每个MEDLINE MeSH接口中一确定它是否映射到相应的MeSH术语。另外,还测试了46个常用的缩略语和首字母缩写词。

1.3结果:

尽管性能差异很大,但对于这些随机选择的术语,所有接口的成功率都很低。常见的缩略语和首字母缩写词在接口上的测试有着较高的成功率,但是不同接口之间的差异仍然存在。

1.4结论:

在线的接口并不总是能够将医学缩略语和首字母缩写词映射到相应的MeSH短语。如果在搜索策略中使用时缩略语和首字母缩写词,就可能导致不准确的结果和错误信息。

1.5强调

1、缩略语和首字母缩写词在健康科学中被广泛地使用,并且在搜索文献时也可以使用。

2、缩略语和首字母缩写词并不总是能够正确映射到医学主题词表(MeSH)。

3、映射的准确性取决于所使用的MEDLINE MeSH接口。

4、仅通过缩略语和首字母缩写词可能会导致错误或丢失的信息。

1.6对实践的意义

1、 在选择接口和生成搜索策略时,应考虑不同系统之间映射到MeSH的差异性。

2、鉴于这些缩略语的广泛使用,在指导用户通过缩略语和首字母缩写词进行获得信息可能是有益的。

3、在创建自动将术语映射到MeSH的机制时,使用缩略语和首字母缩写词对于系统开发人员是一件有意义的方法。

2介绍

缩略语是”由其他单词的首字母组成的单词”。它来源于含义为顶部的akros和含义为名字的onyma两种希腊词的组合。尽管缩略语常常被用来指代由各个单词和音节的首字母构成的任何短语,但具体的定义适用于那些可以作为单词发音的整体词汇。一些常见的例子包括NATO(北大西洋公约组织),JAMA(美国医学协会杂志),AWOL(擅离职守)以及AIDS(获得性免疫缺陷综合症)。另一方面,首字母缩写词是”由一些首字母组成的用于名称或者表达的缩写”,与缩略语不同的是,缩略语是整体发音,而首字母缩写词是每个字母或部分单独发音。首字母缩写词的相关例子包括UN(联合国),TWA(环球航空公司)和FD(食品和药物管理局)。

有些学者要求一个真正的缩略语应该像上文定义的那样作为一个整体发音,并且至少由三个字母组成。1962年,鲍姆指出,缩略语的定义正在变得”模糊和困惑”。在目前的用法中,缩略语和首字母缩写词通常都被认为是缩略语,并且包含两个字母的术语。虽然与其他的缩短词汇(缩写、单词剪报、单词混合)相比,关于缩略语的定义还有许多值得讨论的地方,但是这些主题已经超出了本研究的范围。值得一提的是,它们在语言学文献中有很好的记载,这里引用了几个例子[4-9]。为了本研究的目的,缩略语和首字母缩写词都包含在测试数据中,同时也包括双字母术语,例如MS(多发性硬化症)。

“缩略语”这个术语似乎是在1943年创造的。虽然这个术语在1943年被首次提及,首字母缩写已经使用了一段时间。已经被证实的是,这些类型的缩写在罗马帝国时期出现过,例如SPQR 代表Senatus Populusque Romanus[5]。虽然这种历史上的首字母缩写被记录了下来,还是不知道当时的读者将它们读作缩略语还是首字母缩写词,或者是在看到这些字母时实际上说出了完整的短语。缩略语和首字母缩写词的使用量随着时间的推移而增加,尤其是在第二次世界大战之后。

现在,无论是书面还是口头交流都包含着大量的缩略语和首字母缩写词。在任何一天,新闻报道和通俗文学都会遇到缩略语和首字母缩写词。缩略语和首字母缩写词的使用也渗透到日常对话中,例如ASAP(as soon as possible尽快),ETA(estimated time of arrival预计到达时间)和VW(Volkswagen大众)。在访问聊天室的过程中,可能会遇到BRB(be right back和快回来),LOL(laughing out loud放声大笑)或者是TTYL(talk to you later稍后与您交谈)等等。

在健康科学中,这种缩略语的使用量也大大的增加。1970年,布里顿注意到”在科学中,新词通常是出于对新颖,精确和经济的交流的需要而出现的”,并且缩略语是经济需要和交流方便的结果,通常由短语名的首字母构成。如果医疗条件或者过程中没有伴随缩略语和首字母缩写词,这是非常异常的。医学中由许多缩略语,例如MRI(magnetic resonance imaging核磁共振成像),ALS(amyotrophic lateral sclerosis肌萎缩侧索硬化症),CPPD(chronic obstructive pulmonary disease慢性阻塞性肺病),HRT(hormone replacement therapy激素替代疗法)以及SARS(severe acute respiratory syndrome 严重急性呼吸系统综合症)等等。

多年来,社论,致编辑的信和发表在健康科学文献的文章都在惋惜医学期刊中缩略语的使用,过度使用,误用,滥用。Basu提到,在一起临床杂志上发现了52个缩略语。Fred和Cheng进一步指出,在一篇评论性文章中有超过九十个未定义的缩略语。

鉴于健康科学中缩略语和首字母缩写词的普及,搜索者在使用在线搜索系统时可能会输入这些缩写形式而不是完整的短语。当整个短语很冗长或者是很难拼写时,上述的情况就尤其如此。在某些情况下,搜索者可能知道缩略语和首字母缩写词,但是不知道其确切的含义。搜索者也可能会认为在线系统会正确地将缩略语和首字母缩写词翻译为相应的完整短语。、

对缩略语搜索的困惑已经被认识了,并且一些系统已经被开发出来帮助将首字母缩写词和它们对应的含义匹配起来。MEDLINE中缩略语和首字母缩写词搜索的有效性取决于它们映射到相应的医学主题词表的成功率。不同的MEDLINE接口不以相同的方式映射到MeSH,这一点已经被证明了。Federiuk发现,使用缩略语和首字母缩写词搜索MEDLINE不是一个简单的过程,可能需要同时使用缩写词、完整词组和主题词来获取所有独特的引文。这可能会导致不同的结果以及可能丢失信息或使得信息不完整。当前研究的目的是比较MEDLINE的不同接口如何将缩略语和首字母缩写词映射到它们相对应的MeSH术语以及注意不同系统之间的变化。

3方法

这项研究是一项试点研究的延伸,其结果在2004年的年度医学图书馆协会的海报上发表。该试点研究检查了114个随机选择的缩略语和首字母缩写词,并且,在当前的测试数据集中,这项研究已经扩展到包含415个术语。

本研究使用的接口为:PubMed MeSH数据库,PubMed自动术语映射功能,NLM网关术语查找器和Ovid MEDLINE。测试术语从两个打印源中随机选择:由Jablonski所著的医学缩略语和首字母缩写词词典以及Tsur所著的在医学中使用的包含缩写词,缩略语,同义词和符号的Elsevier词典。以下程序用于选择测试术语:

  1. 使用微软的Excel生成两个随机数表。第一个数组包括从1到440(Jablonski书中的页数)中随机选择的数字。第二个随机数组包含了1到843的数字(Tsur书中的页数)。
  2. 对于每本书的每个随机生成的页码,选择所有的缩略语和首字母缩写词以便可能包含在测试数据集中。其他类型的缩写,名词和符号被排除在外。
  3. 如果一个缩写词相对应的完整短语是MeSH术语,则每个选定的缩略语和首字母缩写词都包含在测试数据集中。NLM MeSH游览器用于确定缩写词对应的完整短语是否为MeSH术语。同时也包括MeSH记录的主要标题词或者是条目的短语。例如,如果HTR是来自其中一本书的某个选定页面上的缩略语,那么它的完整含义”激素代替疗法”就会在NLM MeSH 游览器中被搜索。如果整个完整的短语是一个MeSH术语,那么这个缩略语或者首字母缩写词就会被添加到测试数据集中。如果整个短语不是MeSH术语,则将其排除。NLM MeSH 游览器被选择用来完成这项任务是因为大部分的MeSH打印源因”MeSH 游览器的更大覆盖范围、灵活性和流通性”而停止发布。

在415个测试属于中,由263个是来自Jablonski的词典,其中包括原始试点研究中的114个测试术语。在目前的研究中,152个测试术语也从Tsur的词典中获得。表1的实例显示的是研究中随机选择的测试术语以及其相对应的MeSH术语。

表一:随机选择的缩略语的例子

一些缩略语和首字母缩写词不止一个含义。例如,ALS代表肌萎缩侧索硬化,但它也代表传入环综合症和抗淋巴细胞血清。如果一个测试术语具有等同于MeSH术语的多种含义,那么该术语被添加到数据库中,并针对每个含义分别进行计数和测试。在测试数据集的415个术语中,176个是唯一的,仅有1个含义其余的测试术语来源于随机选择的68个具有多重含义的缩略语和首字母缩写词。

将每个测试术语输入到每个MEDLINE MeSH接口上以确定它是否映射到其对应的MeSH术语。例如,将”DCL”输入到每个选定的接口中,以查看它是否正确地映射到”弥漫性皮肤利什曼病”。来自最初试点性研究的114个术语用作当前研究的扩展术语集重新测试。每个接口的详细步骤是:

  1. 在Ovid MEDLINE数据库中,每个测试术语都被输入到查询框中。该术语映射到相应的主题词的选项已经被选中。没进行义词搜索,就会得到一个新页面,其中包含一个特定的MeSH术语或者是一系列可能被选择的相关MeSH术语列表。如果在此页面上找到与输入的测试术语相对应的MeSH术语,则映射成功;反之,则映射失败。
  2. 对于PubMed,测试了两项功能:PubMed MeSH数据库和自动映射功能。对于PubMed MeSH数据库,此功能是从PubMed主屏幕的边菜单栏中选择的。每个测试术语都被输入到查询框中,然后点击开始按钮。结果会显示一个或多个MeSH术语可供选择。出现在结果中的完整列表会被进行二次检查以确定是否存在相关的MeSH术语。如果在列表中找到与输入的测试术语相关联的MeSH术语,则说明映射是成功的;反之,则映射失败。
  3. 对于PubMed的自动映射功能,每个测试术语都被输入到PubMed主页上的搜索框中。然后点击开始按钮,就开始了带有引文检索的搜索。此时,可以点击详细按钮来查看查询翻译框,该翻译框显示了如何利用MeSH术语和Pubmed的搜索规则及语法去翻译所输入的术语。如果相应的MeSH术语出现在查询翻译框中,则说明映射成功;反之,映射失败。
  4. 对于NLM网关接口,术语查找是从菜单栏中选择的。每个测试术语都被输入到查询框中,点击开始按钮。结果页面可以是MeSH术语的直接匹配,也可以是可能的可供选择的MeSH术语列表。如果检测到与测试术语相关的MeSH术语,则说明映射成功,反之,映射失败。

正如在试点研究中所做的那样,对常见缩略语和首字母缩写词进行了第二个狭义构建的测试。这些术语不是随机选择的,而是通过对图书馆成员的调查并收集他们在搜索中遇到的常见的缩略语。第二组缩略语和首字母缩写词是为了比较常用的术语和随机选择的术语。测试常用的术语的方法与测试随机选择的术语方法相同。这组常用的术语包括46个缩略语和首字母缩写词。表2包括的是测试的常用术语的例子。

表二:从非正式调查中得出的常用缩略语的例子

4结果

4.1随机选择的测试数据集

对于随机选择的测试术语,所有的测试接口都以较低的成功率执行(如表3所示).Ovid MEDLINE以32%的最高成功率执行,其次是NLM网关术语查找器,成功率为25%。虽然所有的测试接口的成功率都比较低,但是不同系统的接口之间也表现出了较大的差异。

表三:随机选择的缩略语和首字母缩写词映射到MeSH的成功率(n=415个术语)

4.2选择常用的术语

如表4所示,46个常用的缩略语和首字母缩写词在映射到MeSH时的成功率明显较高。与随机选择的数据集一样,Ovid MEDLINE和NLM网关术语查找器的成功率最高,均为89%。同样的,不同系统之间的差异也非常的大。

表四:常用的缩略语和首字母缩写词映射到MeSH的成功率(n=46个术语)

5讨论

这项研究的结果表明,在所研究的所有接口中,缩略语和首字母缩写词对MeSH的映射成功率通常较低。研究结果还显示,不同的测试接口之间的映射成功率也存在较大的差异。随机选择的测试数据集中包含了可能不太常用的缩略语和首字母缩写词,这可能导致了较低的映射成功率。

映射率的差异可能与每个系统的搜索策略以及如何将缩略词映射到MeSH有关。借助Pubmed和NLM网关中的帮助屏幕,Pubmed自动术语映射功能和NLM网关术语查找器都使用统一医疗语言系统(UMLS)。鉴于者两个接口之间的映射成功率有很大差异,很明显它们采用不同的映射算法。成功率最高的Ovid MEDLINE采用自己的统计分析技术将术语映射到受控词汇表中。

在所有系统中,常用的缩略语和首字母缩写词比随机选择的数据集更容

全文共7068字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[15859],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。