基于运营商数据的个人征信评估模型外文翻译资料

 2022-09-06 10:41:34

英语原文共 143 页,剩余内容已隐藏,支付完成后下载完整资料


第一章 市场和大数据分析的业务驱动因素

1.1 大数据现实分离炒作

有几个技术现象所采取的技术和主流媒体的风暴比'大数据'。从分析师社区到报纸的头版最受尊敬的新闻来源,世界似乎充斥着在大数据项目、 活动、 分析,等等。然而,随着许多科技潮流,还有一些低迷在其定义中,增添混乱、 不确定性和怀疑,当试图理解如何方法可以使组织受益。

因此,它最好是将大数据的定义开始。分析公司 Gartner 可以贷记与大多数经常使用定义 ︰

大数据是信息的要求具有成本效益、 创新形式处理增强的洞察力和决策的高容量、 高速度和高品种的信息资产。

对于大多数的一部分,在推广大数据概念,分析人士和媒体似乎锁定在定义开始出现的头韵、超聚焦在什么是被称为“3比体积,速度,和品种。”别人都建立在模因注入额外的与这样的“值”或“变异”旨在利用定义的一个明显的改善。

无处不在的与定义,尽管如此,值得注意的是,最初的概念是不是新的,但提供了(当时Meta集团,现在Gartner分析师道格Laney)在一份研究报告2001“三维数据的管理,”他说:

企业很难巩固系统和折叠冗余数据库,以使更多的业务,分析,和协作一致性,经济条件的变化已使这项工作更加困难。电子商务,特别是已爆炸的数据管理的挑战,沿着三个维度:卷,速度和品种。在2001 / 02,它的组织必须编译的各种方法,以处理每个处理。

Gartner的定义的挑战是双重的。首先,截断的定义集中与有效提炼出消息的另外两个重要成分的影响:

  1. “具有成本效益的创新形式的信息处理” (这意味着可以实现利益)
  2. “增强洞察力和决策”(预期结果)

第二个是有点微妙 ︰ 定义并非真正的定义,而是叙述。组织中的人不能使用定义来确定无论他们正在使用大数据解决方案或即使他们有问题,需要一个大的数据解决方案。同样的问题阻碍能够传达一种价值主张在范围什么目的是设计、 开发和交付,结果在本组织的真正意义存在一定难度。

基本上,它是需要超越本质上是市场营销的定义来理解这一概念的核心意图作为评价的价值主张的第一步是什么。大数据是从根本上对应用创新和具成本效益的技术,为解决现有和未来的业务问题的所需资源 (数据管理空间,计算资源,或立即,存储器中的存储表示需要) 超过目前配置在企业内的传统计算环境的能力。设想这另一种方式如图 1.1 所示。

最好了解大数据可以给您的组织带来的价值,它是值得考虑了市场条件,有使其显然越来越多的接受作为一个可行的办法来补充业务和分析业务应用程序根据爆炸数据卷的缠绕。这本书,当然,我们希望量化一些变量相关的评价和决策的整合大数据作为企业信息管理架构的一部分侧重专题如 ︰

图1.1

  • 表征,何谓'大规模'的数据量;
  • 审查的数据创建和交付速度与分析融入实时业务流程; 之间的关系
  • 探索传统数据管理框架不能处理日益增长的数据变异性; 由于的原因
  • 排位赛的业务; 价值的量化措施
  • 发展战略计划的集成;
  • 评估技术;

设计、 开发和生产进入新的应用程序。

排位赛的商业价值是特别重要,特别是当组织的前瞻性利益相关者需要进行有效的沟通拥抱大数据平台的商业价值和与之相应,大数据分析。例如,业务理由可能显示如何纳入新的分析框架可以是一个竞争优势。建立客户追加销售档案的公司基于有限的数据采样脸劣势时相比,创建包含有关客户打算提高客户体验的同时增加收入的所有数据的全面的客户模型的企业。

采用技术作为媒体热议的下意识反应,具有比评估以及现有的解决方案基地作为客场的转变业务利用这种技术可以如何成功降低的机会。为此原因,我们开始探索的大数据技术细节之前我们必须深入探索业务驱动因素和市场条件,使大数据在企业内的一个可行的选择。

1.2 了解业务驱动因素

这个故事开始十字路口需要灵活性和可操作的洞察力的需求作为信号噪音减少的比例。有关所有类型的业务流程决策改进降低'上市时间'已成为一个关键的竞争优势。然而,必须在组织的业务驱动程序的上下文中理解用户的需求不断增加的数据量由驱动的洞察力为帮助你适当地采用一致的新闻战略作为前奏,部署大数据技术的组织。

企业的业务驱动因素可能会有所不同,以及由公司,但回顾一些现有的趋势,数据的创建,使用,共享和分析的需求可能会揭示如何不断发展的市场条件使我们到一个点,通过大数据可以成为现实。 商业驱动力是关于利用和分析数据集和流的灵活性 ︰ 增加收入、 降低成本、 改善客户体验,降低风险,并提高生产率。数据爆炸凸显捕获、 管理和分析信息的要求。开车需要大数据平台的一些关键趋势包括以下内容 ︰

  • 增加的数据卷被捕获并存储 ︰ 根据 2011 年 IDC 数字宇宙研究,'2011 年,创建和复制的信息量将超过 1.8 信息量......在短短 5 年间增长了9倍。' 这种增长规模超过合理的传统的关系型数据库管理系统或甚至典型硬件配置支持基于文件的数据访问能力。
  • 数据增长加速 ︰ 仅仅 1 年后,2012 IDC 数字宇宙研究 ('数字到 2020 年的宇宙') 假设,'从 2005 年到 2020 年,数字宇宙将增长 300倍,从 130 艾字节到 40,000 千兆兆字节或 40 兆千兆字节 (超过 5,200 千兆字节每一个男人、 妇女和儿童在 2020 年)。从现在到 2020 年,数字宇宙会关于双每两年。
  • 增加数据卷推入网络 ︰ 根据思科年度视觉网络指数预测,2016 年,每年全球 IP 流量预计将 1.3 信息量。 网络流量的增加是越来越多的智能手机、 平板电脑和其他互联网准备好设备,日益壮大的互联网用户、 增加互联网带宽和速度由电信运营商和扩散的 Wi-Fi 可用性和连接提供所致。更多的数据被注入到更广泛的沟通渠道创建用于捕获并及时和协调一致的方式管理这些数据的压力。
  • 增长分析的数据资产类型的变化 ︰ 而不是较为传统的方法为捕获和组织结构化数据集,数据科学家设法利用非结构化数据访问或从各种各样的来源获得。其中一些来源可能反映最小元素的结构 (例如 Web 活动日志或呼叫详细记录),而有些则是完全非结构化或甚至限于特定的格式 (例如合并文本、 图像、 音频和视频内容的社交媒体数据)。若要提取出这种噪音的可用信号,企业必须加强其现有的结构化的数据管理方法,以容纳语义文本和内容流分析。
  • 备用和不同步的方法,便于数据交付 ︰ 在结构化环境中,有的数据采集或交换,如大容量文件传输通过磁带和磁盘的存储系统,或通过文件传输协议的离散任务,明确划分在互联网上。今天,数据发布和交流充满了不可预知的高峰和低谷,与来自广泛的连接的来源,如网站、 事务处理系统,甚至“开放数据”的数据来自政府来源和社会媒体网络如推特的数据。这创造了新的压力,快速获取,吸收和分析,同时保持货币和一致性的不同的数据集。

对分析结果的实时集成的需求不断上升:有更多的人有扩大的各种各样的角色,谁是消费者的分析结果。的增长是特别明显的,在公司的终端到终端的业务流程,增强了充分整合的分析模型,以优化性能。作为一个例子,一个零售企业可以监控的库存单位(SKU)数以万计的实时销售在零售地点数百,和日志刻由分钟销售趋势。提供这些海量数据集到一个社区的不同业务用户同时分析提供了新的见解和能力,从来没有在过去:它允许买家审查采购模式,以更精确的决定,产品目录,产品专家认为替代手段捆绑项目在一起,库存专业人员分配货架空间更有效地在仓库,价格专家在不同的零售地点直接在其他用途。最有效的情报需求分析系统必须处理,分析,并提供结果在一个定义的时间窗口。

1.3 降低准入门槛

使业务流程所有者能够利用中很多新的和创新方面的分析总是似乎出现了对于大多数公司来说遥不可及。创建信息膨胀的宇宙似乎非常吊着广泛规模分析功能,但最大的公司的买不起。

有趣的是,大多数情况下,很多技术列为'大数据'并不新鲜的。相反,它是打包方式可访问的组织方式,直到最近受到限制预算、 资源和技能的限制,这些技术的能力,是典型的小企业。使大数据概念如此引人入胜的是,新兴技术使一个广泛的分析能力与一个相对低的进入门槛。

正如我们将看到,商业智能和分析的技术方面已经发展到一点的广泛的企业可以部署能力,在过去被限制到最大的公司拥有同样的大笔预算。考虑在表 1.1 中的四个方面。

在环境的变化,使大数据分析吸引所有类型的组织,而市场条件使其实用的发展,商品化的简化模型相结合,更广泛的调色板的数据管理工具,和低成本的实用计算已经有效地降低了进入的门槛,使更多的组织开发和测试出性能应用,可以容纳海量的数据量,在结构和内容广泛。

表 1.1 在采用高性能的对比方法

方面

典型场景

大数据

应用开发

利用大规模并行处理应用程序开发的专业开发人员熟练在高性能计算、 性能优化和代码优化

简化的应用程序执行模型,包括分布式的文件系统,应用程序编程模型、 分布式的数据库和程序调度被包装在 Hadoop,可靠、 可伸缩、 分布式和并行计算开源框架内

站台

使用高成本的大规模并行处理 (MPP) 电脑,利用高带宽的网络和大量的输入/输出设备

创新的方法,创建可扩展的和弹性的虚拟化平台利用集群的商品硬件组件(无论是从本地资源的周期收获或通过基于云计算的实用程序计算服务),再加上开放源码工具和技术

数据管理

有限的或基于关系数据库管理系统(RDBMS)文件使用标准的面向行的数据布局

数据管理的替代模型

(通常称为NoSQL或“不仅SQL”)管理信息以最适合特定的业务流程需要提供多种方法,如内存中的数据管理(快速通道),柱状布局,加快查询响应,和图形数据库(社会网络分析)

资源

需要大量资金投入购买高端硬件,并在内部安装和管理

部署在虚拟化平台Hadoop允许中小企业利用云计算环境中,系统的能力,无论从成本和实用的角度来看,都是非常友好的底线

1.4注意事项

虽然市场情况表明,进入的实施大数据解决方案降低了的门槛,它并不执行这些技术和业务流程是一个完全简单的任务。那里是陡峭的学习曲线,为开发大数据应用程序,尤其是当走开源路线,要求投资在时间和资源,以确保大数据分析和计算平台是为生产做好准备。尽管它很容易地试驾了这些技术作为'评价'的一部分,一个可能好好思考一下几个关键问题投入大量的资源和精力在缩放的学习曲线,比如 ︰

  • 企业新技术和新兴技术纳入本组织,测试了,没有傲慢的官僚机构审核允许的方式对齐可行性:?如果不是,什么可以采取步骤来创建一个适合的引进和创新的技术评估的环境?
  • 在评估采用大数据技术的可行性时,你是否考虑过你的组织是否面临业务挑战,其资源需求超过现有的或计划的环境的能力?如果没有,你预期的环境会在短期或长期,变化更加以数据为中心的要求进行分析和报告的必要资源的增加?
  • 价值:有一个期望,由此产生的可量化的价值,可以使由于大数据资源和权证的技术开发和产品化的投入?你如何定义明确的价值和方法测量的措施?
  • 可积性 ︰ 是否有任何限制或障碍从技术、 社会、 组织内的或政治 (即,政策导向) 会阻止大数据技术正在充分集成为操作体系结构的一部分的观点吗?什么步骤需要采取评估的手段,可以将大数据集成作为企业的一部分吗?
  • 可持续性 ︰ 虽然进入壁垒可能低,所需费用与维护、 配置、 维护技能,和调整中发展的敏捷程度可能不会持久组织内。你会如何计划基金继续的管理和维护大数据的环境?

在第 2 章,我们将开始为回答这些问题,为我们探索类型的业务问题,适合于大数据解决方案的标准范围。

第二章 业务问题适合于大数据分析

第 1 章中,我们确定一些关键市场驱动因素为评估如何大数据技术可能会证明是有利于组织,包括 ︰

  • 加速增长的数据量要消耗;
  • 混合结构和非结构化数据的愿望;
  • 为启用可扩展的高性能分析降低进入门槛;
  • 通过利用商品硬件降低运营成本;
  • 可伸缩的应用程序的简化方案拟订和执行模型。

在过去,获取和部署高性能计算系统仅限于大型组织愿意徘徊在前沿技术。然而,上述市场条件下的收敛性增强了高性能计算的吸引力,许多不同类型的机构现在愿意投资在努力设计和实施大数据分析。这对那些组织的预算以前不足以容纳投资是真实的。

2.1验证(反对)炒作:组织健身

即使如大数据分析的兴奋度达到了白热化的程度,它仍然是技术驱动的活动。以及我们推测在第一章,那里大量的需要作出决定之前需要考虑的因素关于采用这种技术。但所有这些因素需要考虑;只是因为大数据是可行的在本组织内,它不意味着它是合理。

除非有明确的确定价值主张的过程,否则,它将保持一种时尚,直到它击中了炒作周期的失望阶段。在这一点上,希望可能会落空。

当它变得清晰,在技术的基础上的投资是不接地的预期明显的业务改进。 剩余内容已隐藏,支付完成后下载完整资料


资料编号:[147029],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。