英语原文共 5 页,剩余内容已隐藏,支付完成后下载完整资料
多媒体数字化图书馆的综合管理系统
- barbutia , S. Ferillib , D. Redavid c, T. Caldarolad
a Dept. of Classical and Late Antiquity Studies - University of Bari, Piazza Umberto I, 1 70121 Bari, Italy
b Dept. of Computer Science - University of Bari, Via E. Orabona, 4, 70125 Bari, Italy
c Artificial Brain S.r.l., Via Piave 63, 70125 Bari, Italy
d D.A.BI.MUS. S.r.l., Via Quintino Sella, 268, 70123 Bari, Italy
摘要
由于多媒体数字文档的扩散和多样化, 当代图书馆迅速改变了他们的社会角色和功能,成为能够支持各种分布式用户社区之间的通信和协作的复杂网络。除了在一些具体的领域和范围外, 现有的技术能力没有办法与这一新方式产生的社会需求同步性的增长。因此, 我们有必要设计一个集成的通过先进的技术涵盖所有功能的数字化图书馆架构, 没有这些功能, 现代数字化图书馆的相同的社会功能和文化功能就会受到威胁。本文简要介绍了一种旨在弥合这一差距并且将大学和公司研究人员开发的经验、专业知识和软件系统汇集在一起的技术架构。该系统的原型正在开发中。
copy;2014作者 Elsevier b. v. 出版
2014年 IRC数字化图书馆 科学委员会负责同行审查。
关键词: 数字化图书馆;数字化图书馆管理信息系统;数字识别;布局分析
1. 介绍
在这里, 图书馆学已经发展起来, 并且且已经采用了最新的研究成果和研究领域, 以便构思和设计能够快速更新信息管理的新闻系统, 同时促进用户之间的合作和异构信息资源的整合, 开创了数字化图书馆(DL)的时代。多年来,数字化图书馆已经从公共图书馆在复杂网络中的物理馆藏的简单数字接口产生了足够长远的发展进步, 已经变得能够支持全球各种不同用户社区之间的通信与协作。通过当代数字化图书馆,人民群众可以访问、讨论、评价和开发不同类型的信息内容。对于旨在创建能够支持数字化图书馆同时包含同质数字集合和元数据的数字化图书馆管理信息系统的研究进展, 数字化图书馆管理信息系统在设计和实施数字化图书馆有效集成、管理和提供可访问性这几个方面仍然存在足够的困难和问题。本文提出了一个 '集成' 的数字化图书馆架构, 系统地设计为项目D _ ISRAELI的原型, 这是一个在阿普利亚地区被叫做 '生活实验室智能普利亚2020'的计划调用下批准的项目, 由有“地中海犹太教研究和文献中心”之称的巴里·阿尔多·莫罗和塞雷德姆大学提出。该项目原型正在开发中, 目的是在阿普利亚地区创建一个专门为图书馆学和档案领域设计的关于犹太人历史和文化的数字化图书馆。本论文的篇章结构如下所示: 第2章节部分介绍了主要开源数字化图书馆管理信息系统(DLMS)间的相互比较, 以便最后选择最适合我们的目标系统。第3章节部分详细介绍了一下应该在选择的数字化图书馆管理信息系统体系结构中进行集成或增强以便实现组件本身所标识的创新功能的组件。第4章节部分大概描述了提出的数字化图书馆管理信息系统的主要特点, 特别是不同类型元数据的管理以及从扫描的数字对象中提取文本和编制索引的情况。第5章节给出了最后的结论。
2. 开源技术基础
第一章节部分之前提出的体系架构的定义要求对可用的开源数字化图书馆管理信息系统进行分析, 以便选择更适合我们目标的结构。在最知名和最常用的架构中我们考虑并且比较了dSpace(数字空间系统,可以收 集、存储、索引、保存和重新发布任何数字格式、层次结构的永久标识符研究数据)系统,EPrints系统(全球使用最多、分布最广的开源IR软件系统之一,能以相对较低的技术花费与较快的速度建立和运行机构知识库,系统具有较大的灵活性,能按机构的实际需求进行改进)和Greenstone系统(一个面向全球、基于Unicode编码多语言的开源系统)。Fedora Commons系统采采用用CORBA和Java技术实现的开源系统)在这种比较中并且没有被考虑在内, 因为从根本上说,它是一个面向数字数据保存而不是结果的存储库。此外, FEDORAESUNS 系统没有充分支持Marc数据(以代码形式和特定结构记录在计算机存储载体上的、用计算机识别与阅读的目录)和书目数据交换协议Z39.50, 这两个特性对于要实现的数字化图书馆 来说都是不可忽视的。从三个已确定的数字化图书馆管理信息系统的比较中, 共同的特点是: 第一点,支持OAI-PMH协议(以HTTP为基础,在协定中,储存地被定义为可取用的网路系统,其包含可使用撷取协定进行检索的诠释资料,主要的功于在于於从电子全文的典藏处获得诠释资料,并且予制作索引以为搜寻线索,达到便於搜寻电子全文的目的);第二点,支持任何类型内容的存储和管理;第三点,面向最终用户的多语言界面功能以及第四点,统计报告的制作基于记录的计数。相反, 它们在以下特征上有所不同:
·作为DSPACE对象的唯一标识符, dSpace使用 CNRI 句柄系统 (CNRI公司为数字化图书馆提出的第一个完整可用的名录服务系统或URN系统), Greenstone使用OAI标识符 (www.openarchives.org/OAI/2.0), 而Esprints不依赖于任何标准约定。
·除了所有三个DLMS共有的Dublin Core(致力于规范Web资源体系结构的国际性元数据解决方案,定义了一个所有Web资源都应遵循的通用的核心标准)和METS元数据外,dSpace还支持MARC / MODS数据,同时,Greenstone 支持NZGLS数据(新西兰政府定位服务)和AGLS数据(澳大利亚政府定位服务)。
·Dspace 支持的搜索功能 (特定于字段、布尔逻辑和排序选项) 是 Eprint 和 Greenstone所支持的搜索功能的超级集。
·对于浏览功能, Eprint 和 Greenstone 允许使用任何字段, 但是dSpace 只有作者、标题、主题和收藏这些字段才能使用。
·Dspace 中的用户身份验证可以通过 LDAP协议(轻量级目录访问协议,是一项开放协议,用于通过分层目录结构对数据进行存储与检索)或 Shibboleth(Shibboleth是一个基于标准的,实现组织内部或跨组织的网页单点登录的开源软件包)进行, 在 Elprints 中只能通过LDAP协议进行身份验证, 在 Greenstone 中可以进行用户组身份验证。
·各个框架可以使用的数据库分别是dSpace的Oracle和PostgreSQL,以及EPrints的MySQL和Cloud,而 Greenstone 则有自己的实现。
·Oai-ore、SWOD、SWAP 被dSpace (添加 SRW/u作为Z.39.50(基于ISO的OSI参考模型的应用层协议)的扩展) 和 Eprint (添加RDF(用于描述Web资源的标记语言)) 提供支持, 而 Z39.50 则由 Greenstone 提供支持。
我们的选择已经落在 dSpace 上, 主要是因为以下三个因素: 第一点,它比其他因素更好地支持各种元数据标准和互操作性协议;第二点,它只使用一个编程语言开发;第三点,它有一个更多完整的文档和有各种社区提供支持。
3. 提出的系统的体系结构
因此, 提出的数字化图书馆管理信息系统 扩展了 dSpace 的体系结构, 为创新功能的管理添加了特定的模块。根据图1中的概念框架, 该体系结构分为三个级别, 其中包括用于访问系统的以下组件:
·Web UI 是通过各种门户对后台区域 (通过IDP) 和数字化图书馆前端进行基于web页面的访问的模块。后台区域允许插入和编辑数字内容及其元数据, 以及管理用户进行访问。前端允许通过一个Web界面对内容进行可视化和渲染呈现, 该界面结合了所有高级文件格式, 可提供多媒体、多通道保护。它还提供了协作标记 (由 Web2.0 模块操作) 的前端。
·移动设备允许通过平板电脑和智能手机查看和呈现内容。
·监视是允许您观察系统行为并且在 Excel 、XML 和 PDF中生成报告的模块格式, 并且有可能通过图形表示。
·Ito 模块包括允许使用 OAIS(开放档案信息系,旨在为基于长期保存的目的地信息系统建立一个参考模型和基本概念框架,以维护信息系统中数字信息的长期保护和可存取)、OAI-PMH、Z39.50 和 OAI-ORE 进行元数据交换的接口。它还启用了将内容呈现为 '打开数据' 的功能。
业务逻辑级别包括以下适用于实现系统功能的模块:
·核心工具是包含用于系统配置和日志记录的基本实体的模块。
·搜索引擎是用于实现支持信息查找功能的模块。内容索引是由Lucene(开放源代码的全文检索引擎工具包,是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎)开源工具完成的, 该工具在最先进的领域实现基于术语的技术。
·Web2.0 是用于管理协作标记的模块, 即它允许执行必要的功能, 以支持门户用户积极参与已发布的内容。
·访问管理是用于用户身份验证和分析的模块。它允许在正常模式下或通过IDP进行访问管理。
·文本提取器是允许通过ICRPad从文档中提取文本的模块 (见第4章节)。
·内容管理器是设计用于管理数字化图书馆中的对象、集合和许可证的模块。
·编目是用于允许管理数字内容的模块, 这些内容将用于填充数字化图书馆。在这里将使用与标准 METS 兼容的MAG/ICCU 标准 (2.0.1 版)。
·地理参照是允许系统根据使用系统的用户其地理坐标引用内容的模块。该模块将允许在空间查询的基础上存储和检索内容。
存储级别管理对系统物理资源的访问, 处理该系统的组织, 包括元数据、有关用户的信息和与之关联的权限、插入内容期间审批流的状态。具体一点来说: RDBMS(关系数据库管理系统) 包装器是允许对数据库的特定实现进行读写访问的模块 (在此项目中是 PostgreSQL, 但我们可以很容易的扩展到其他类型数据库, 如 Oracle)。Bitstream 存储管理器是允许在文件系统或 SRB (备份工具) 上存储的模块。数字化图书馆的操作将涉及各种体系的结构模块。在下一章节部分中除了介绍 数字化图书馆的功能外, 还将介绍即将集成到系统中的一些创新方面。
4. 提出的解决办法的创新方面
为了能够有效地管理和检索具有不同表示格式的内容, 我们采用了基于状态的表示形式用于涉及使用不同语言且几乎不兼容的管理和描述性元数据。为此, 我们从一开始就有必要开始整合工具, 以便根据各种表示标准对元数据进行分离管理
全文共6669字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[2665]
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。