英语原文共 15 页,剩余内容已隐藏,支付完成后下载完整资料
远距离通信与信息学
在大数据领域的实时业务活动监控与执行过程分析
摘要:实时获取业务性能信息是运营有竞争力的企业以及通过高水平的竞争不断改变企业环境的关键,对业务流程的及时分析与监控是很有必要的,以确定不符合的情况并立即做出反应,为了快速响应竞争对手。在这方面,整合商业智能(BI)和过程感知额度信息系统(PAIS)可以成为企业用户决策的一个重要工具。然而,目前的BI系统不适合优化和改善端到端的流程,因为这些是通常商业领域的具体和不充分的过程,以支持改善活动过程的需求。此外,高度交易的业务环境可能会产生大量的事件数据,这些数据不能通过不是设计来管理大量数据的传统储存系统有效地管理。我们引入了一个基于云的架构,利用大数据技术及时支持任何业务领域的性能分析,不管操作系统的问题。同样,我们证明了有能力以很低的硬件成本,在大数据环境下提供实时业务活动监控的办法。
- 简介
通常用的基于通信技术的工具和实时测量,以及业务活动性能的数据分析,是企业保持竞争力的关键(Keller an von der Gracht,2014)。业务执行流程的监控允许业务用户检测错误率和不符合情况,如供应链问题。这个动作必须及时执行以便快速反应这些情况。在一个运行良好的过程中,预计到达(需求)和吞吐率是平衡的。不具备工作能力的过程或活动会造成延误和瓶颈,是的程序的输入供应不足。这可能会导致增加延误和损失的利润,因为浪费了宝贵的资源,没有得到充分的利用,从而失去客户的满意度和忠诚度。
业务流程的一个成功的分析是企业获得竞争优势的必要。此外,基于分析的过程改进被认为是使得组织变得效益性的方法。在组织内,过程模型总会不充分的理解与优化,并因此处理。这会导致长的响应时间,不平衡的资源利用,低的服务水平等,从而导致公司高成本和巨大利润亏损。在这方面,使用先进的分析技术,将有助于分析人员不断改进自己的流程,从而满足他们的业务目标。
结合BI和业务活动监控(BAM)技术可以提供机制来推断企业绩效的知识,但这些不足以回答如今企业客户的大多数问题。现如今对更先进的分析的需求与日俱增,例如分析性能问题的根原因,预知分析,和“what-if”模型。这些特征对分析师来说是巨大的资产,扩展他们的知识,突破目前平台提供的限制。此外,这些平台通常是业务领域特定的,并没有足够的流程来满足改进活动的过程,特别是在大型和复杂的供应链中,他需要及时整合,检测和分析大量的产生于各种不同环境中的非结构化事件。
在一般情况下,业务数据的监测和分析的目标是基于事实的,因此以可导致可靠分析结果的真实数据作为经验评价。无论如何,实现理想业务流程和实际事件之间数据的明显分割是很困难的。目前他们的BI平台没有解决这个问题,因为它们都集中在本地决策,而不是终端到终端的过程。结果就是,他们的输出趋向于不可靠,因为他们是基于现实的理想化模型,而不是基于观察到的事实。为了使业务用户在业务流程中获得可视性,必须从业务操作中收集执行结果,任何组织都统一相关。
技术的最新进展使得组织的互相配合变成可能,需要多个领域的大型和复杂的供应链的不同的业务信息系统的整合。在这些情况下,个别组织内的隔离优化
不足以优化和改善端到端的流程。这导致了复杂的操作管理过程, Web服务技术和云计算的应用越来越广泛,生产的事件日志超越了公司的边界。这在企业中已经促进了一个令人难以置信的数据增长,需要合并分析(van der Aalst,2012)。
此外,企业的业务数据通常是通过异构系统在不同的技术平台上运行的,甚至使用的标准不兼容。此外,分布式业务流程的连续执行(英国石油公司)可能产生巨大的不能使用传统储存系统有效地管理的事件数据量,它不足以管理数以亿计的事件数据。因此,需要创新的方法和技术,把真正的专家系统技术传达到企业用户手中。现在,有新兴技术如大数据和云计算,可以利用驱动业务流程分析(BPA)解决方案,能在及时的基础上产生结果。
尽管如此,一个完全分布式的BPA成功实施涉及不易解决的重大挑战:
- 首先,双向平台必须重新设计,以支持业务流程分析,这些都是典型的业务领域。
- 过程和企业事件本质上是相互关联的,但这些需要跨组织边界,这是具有挑战性的。
- 测量和提高整体业务性能在高度分布式环境下很难实现,其业务流程是复杂供应链的一部分。反过来,这些过程通常在各种异构系统中被执行,这使得它们更难以衡量。
- 分布式业务流程的连续执行可能产生大量的不能被传统存储系统有效管理的事件数据,它不足以管理数以百万计的事件数据记录。
- 现有的集中式方法例如维拉巴葵里路和莫洛伊所描述的,不能在会产生大量的事件数据的复杂业务情况下提供实时分析。这些系统不适合处理如此大量的信息因为他们既不包括分片机制也不会提供大数据支持。此外,这些方法可能出现从事件的发生时间到事件被记录的时间的明显时间延迟。这是非常大的和复杂的供应链,这通常涉及大量的业务单位和更大数量的操作系统强化。
- 处理高度分布式供应链需要各利益相关者的协同分析,他们被地理分离,需要一个平台以合作方式进行BPM,而不是取决于一个单一的中央集权所有者去监控和管理供应链节点。这是实现采用集中式方法特别困难的地方。
本文提出了一种基于云的解决方案,旨在解决上述挑战。 整体的解决方案已经在Vera-Bequero et al.(2013)和Vera-Bequero et al.(2014)中被介绍。但是本文的重点是对系统的BAM部分的内部细节,以达到及时监测它的过程,它的执行结果是在大数据背景下产生的。这导致我们处于一个大数据分析的情况,支持系统需要非常大的规模来及时处理这些结果。对大数据分析来说,云计算是一个关键的因素,因为管理巨大的数据量需要非常大规模的处理,尤其是在数据的规模超过了单个计算节点的情况下。(Orsquo;Driscoll et al,2013)在这方面,基于云的基础设施对满足BPA的大数据的计算和存储需求是理想的。涉及到非常复杂和高度分布的过程如供应链管理在业务场景里是非常有趣的。
下一节推出了解决方法的基本原理,给出了系统内部整体架构的概述。该文件的提醒如下。首先,我们回顾艺术之国在企业活动监控领域下的演变,然后我们以模型和事件的相关算法来介绍分析框架。基于事件的模型及相关算法的研究是双重的:(1)保持系统对任何业务领域的忽视性,(2)允许系统无视操作系统的基本问题来整合数据。根据事件相关的基础,我们引入了基于相关事件序列的测量代数。最后,我们评估解决方案的性能,并以简短的总结,结论和未来的工作大纲来概括。
2.企业活动监测系统的解决办法
过程性能的基本概念在一段时间被众所周知,Lean和Six Sigma的方法被广泛应用于对车辆的理解,测量和分析过程性能。原则是以提高可视性为基础,知道什么是真实发生的并提供硬数据来确认对于发生的问题和问题的所在的假设。我们用来测量业务流程的实际测量标准往往分为不同类的指标,比如质量,时间,灵敏度和成本。使用适当的BAM工具,我们能收集所有与时间相关的所有需要的指标,比如周期时间,不合格(返工)率,生产率,生产日期等。
当谈及测量一个持续周期的过程性能,Six Sigma的计算通常与过程测量结合使用。Six Sigma的关键是分布和变异指标的测量,以便我们能随时间改变性能。
网络的核心是监控和业务事件的处理,获取足够的业务流程事件(例如任务开始,任务结束)和他们的及时处理,使我们能够在一个关键的时间收集统计有效的过程指标,并作出反应。只要我们有一个捕捉相关业务流程事件的手段,我们就可以产生当前过程可视化和性能度量。自从面向服务和事件驱动架构的出现,便有一个用于收集、处理和分析业务流程的框架。webMethods公司反映了当时的普遍的共识,他们叫BAM ,BPM的新称呼,从2006年的白皮书开始(Crump,2006)。他们的系统被设计为能够从异构系统中收集过程和相关的事件数据,但已经被Software AG收购,并提供整个系统实时的监测和度量。一个提供跨异构系统过程建模,监测和分析的框架是由科斯特洛和莫雷研制成功的,在这个系统里,事件相关性是依赖于上下文(或有效载荷)的数据,如一个订单通过创建事件顺序,以实现多个事件的相关性。在这个云计算和大数据的技术尚未应用的时候关注的焦点是面向服务的体系结构、数据仓库和商业智能方面的BAM框架。然而,它得到了广泛的认可,特别是实时的双向分布式业务流程,如供应链,将推动运营效率的改进(Sahay和Ranjan,2008)。当不是中央解决所分析的问题时,在业务流程数据分析与交换的基础下,语义网和本体的出现有助于定义过程度量计算。另一种立即考虑BAM的合适性的技术是复杂事件处理(CEP),而且一些框架已经在处理相关事件和延迟方面显示出它的实用性。然而,事件过程与特定过程实例的相关性仍然是一个要解决的问题。如Herzberg和Srdic和Juric。
随着大数据和云计算的出现,很显然有机会使用这些技术从整个供应链中收集和处理大量信息,不只是为了监测分布式业务流程,也为分析执行数据。这可能是一个逻辑性的结论—企业实际上将业务流程迁移到云。然而,这有一个负面影响的双向战略的公司,因为它增加了更复杂的解决方案的需求,它可以满足数据分析的延迟和数据量方面的需求。这在BAM情境中是很特别的挑战,它的回答及时可用,而且在企业执行期间持续增长的事件数据使这些系统处理起来很困难。
- 分析框架
建议的解决方案的目的是提供集成的云服务的监控和分析业务流程的性能,在高度分布式的环境。一套Basu(商务分析服务单元)的节点,随着全球大师GBAS(全球商业分析服务)组成,已经制定了监控和分析经营活动的目的,当地和全球环境。在当地的背景下,居住在一个组织的过程,在那里他们可以分析和巴蜀单位手段优化。这些单位被连接到个别企业进行管理活动,他们的内部流程。本地业务流程分析的一个例子是客户的旅程。在这种情况下,业务流程通过不同的部门和系统,如产品营销,采购,服务,计费和支持的系统。一个孤立的巴苏单元能够进行局部分析和测量这些过程的性能在不同的部门或业务单位。这通常被称为跨部门的性能分析,其中流程是跨部门或不同的业务部门和多个异构数据源和应用程序的价值链的一部分。在非本土语境,跨组织业务流程的分析可以达到对GBAS模块。此组件支持的监控,分析和优化的大型复杂的供应链流程,如制造业和零售分销。这一全球性的分析允许一体化合作组织优化的分布式过程跨软件和企业的边界,支持这些类型的场景。整体解决方案的基础上,通过一个全球性的业务分析服务的本地业务分析服务单位提供一套统一的。以这种方式,多个复杂的过程,可以聚集在本地和全球的水平,以提供过程的见解在微观层面(详细的客户交易或互动的水平),并在宏观层面(供应链的整体健康)。
图1中描述的整体架构,旨在提供云计算服务,在非常低的延迟响应率。这些服务可以通过丰富的信息环境,支持BPA和提供清晰的洞察的效率和组织过程的有效性提供有助于业务流程的持续改进。这些都是暴露于第三方的一些可利用的应用范围广泛的分析应用,如实时监控,模拟,预测和可视化等
设计的架构使分析师能够衡量的性能跨组织的跨职能业务流程扩展。云服务组件(Basu,GBAS)收集来自分布式企业系统数据的能力,存储企业数据和推断的知识从收集到的大量信息。通过企业服务总线适配器成功整合这些组件,完成了基于大数据的解决方案的高层次架构。
每个Basu组件附加的每个操作的业务系统,随着自己的本地事件库。事件存储库是一个云数据存储,是建立在大数据技术。大数据存储库被设计为一个基于云的解决方案,以使系统扩展容易在现成的硬件,这是处理数据密集型处理的相关过程的基本要求。因此,它使我们能够确定数据量之间的权衡,KPI的延迟和硬件投资,从而我们可以很容易的分析框架对多个业务领域非常具体的业务需求。
在这方面,基础技术的选择是解决方案的BAM实时性要求的关键。当它将被覆盖以后,相关过程确实需要将存储在事件存储库中的所有数据都可用。在高高的交易,因此在大数据环境中,这可以为关系数据库管理系统(RDBMS),真正的瓶颈在跨多个服务器的处理负载分布的处理非常大的数据量的强制性。它已经被工业界和学术界的广泛认可,这是很难规模和RDBMS倾向于体验差的可用性(decandia et al.,2007)。此外,他们提出了严重的挑战来处理大数据(grolinger et al.,2013)。尽管现代的RDBMS功能分片机制水平缩放功能(卡特尔,2011;grolinger et al.,2013),他们是不适合的关键分区(Padhye和子孙,2015)他们仍然依赖于酸的性质,和分布式系统技术的使用,使他们落在著名的上限定理(2002吉尔伯特和Lynch)通过牺牲可用性或分区耐受性损害的一致性。在一般情况下,数据存储,提供ACID往往具有较差的可用性(decandia et al.,2007),因此一个NoSQL的使用方法是实现高性能和横向扩展方面对这项工作的目的更合适的技术解决方案。
在此,事件库是使用HBase产品作为大数据存储的实现。HBase是一个NoSQL,版本,面向列的数据存储系统,提供随机实时读/写访问大数据表上运行的Hadoop分布式文件系统。HBase的功能强大的缩放功能。HBase集群扩大商品hregionservers,因此线性增加的存储和处理能力。本产品的技术文档,揭示了非凡的集群能力,提供
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[151859],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。