数据挖掘在连锁零售超市商品销售中的应用研究
(Research on Application of Data Mining to Sales of Goods in Chain Retail Supermarkets)
摘要
由于近年来消费者需求多样性的增加,商品销售已经变成以顾客为导向,而不是以供应为导向。销售人员需要对市场上消费者行为的变化进行敏锐和灵敏的反应,这样他们就能快速重新排列产品的展示和促销项目的选择,以获得在决策中的优势。
本文从2007年11月开始收集了340万条记录。 本文所提出的方法涉及将数据挖掘与OLAP(联机分析技术)结合以找到数据维度中的关键关联并将其应用于连锁超市。使用相同的条件来查询数据并与来自不同地区的结果进行比较的。结果显示了不同地区的显着差异。 例如,在台北的天目(旅游天堂),休闲用品显示出高度相关性。 另一方面,在台湾南部的云林(乡村生活),与日常生活必需品和食品的相关性很高。
多维购物篮分析方法可以分析超市中的时间,顾客和产品等多维度的销售相关性。 其还为销售人员提供不同地区的消费者行为或习惯信息。 因此,销售人员可以计划本地区的营销策略和项目组合,以增加销售收入。
关键词:连锁超市,数据挖掘,购物篮分析,关联规则,OLPA(联机分析技术)
- 介绍:
连锁零售超市的主要目的是为社区顾客提高服务并满足常客对产品组合的需求,如便利、高品质、多样化和卫生。因此,连锁零售商与供应商合作,建立新的生产中心,以提高生产效率,并通过联合营销、采购和生产过程来保证新鲜度。
为了在市场上领先,连锁零售商必须在大都市地区经营尽可能多的商店,因此,收益迅速下降,商店之间的竞争的增长高于预期。零售商不得不在不同的商业区域找出不同的特点并重新排列他们的产品组合,特别是高附加值的产品和服务。例如,高消费区段的消费者习惯于在零售超市里购买新鲜的农产品和商品。然而,如果附近有传统的市场,那么新鲜农产品的供应应该减少。
连锁零售商的核心竞争力逐渐取决于产品和服务更好的质量和多样性,而不是商店的数量。随着客户需求的迅速变化,连锁零售商不得不为连锁商店提供更复杂的渠道和提供更多的精致服务,以扩展最大可能的利润额。为了区分市场定位,一些功能商店逐渐进入市场,特别是为未成年提供特别的服务,如快餐超市,新鲜有机农产品商店或食品配送服务商店。为了管理这些商店,零售商必须增强价值链中信息,性能,质量和服务的连接。
POS系统在连锁零售超市中得到了广泛的应用,但从POS数据库中获取的大量原始数据无法被有效地分析和转化成有用的信息,如产品与销售收入的相关性。本研究利用数据挖掘技术分析数据,建立多维数据挖掘框架以找出数据维度对连锁零售超市的主要原因和影响。采用多维市场购物篮方法,对营业时间、顾客、产品和其他数据维度之间的销售收入关联进行了分析。在本研究中,设计了标准分析程序分析产品组合的相关规则,并探索可能性,可信度,最低重要性和其他信息。通过分析客户的购物交易数据,确定可能的联合销售产品,并开发了联合促销产品组合策略。例如,购买A牌苏打水的顾客通常同时购买了B牌牙膏。有用的信息可以帮助促销人员及时作出市场决策。
本研究使用联机分析技术(OLAP)和数据挖掘技术。OLAP使数据规范化,并设置多维度数据集。采用市场购物篮法和关联规则法来寻找优化产品组合和有效的促销规则。
OLAP是一种数据分析工具,它可以快速地在不同的维度上收集统计数据,并显示原始的查询结果。维度数据是由有限的属性所描述的数据集。事实表表示规范化数据,存储各种事实和细节值。多维数据集基本上是基于多维数据库结构的数据存储。多维数据集是决策和OLAP的基础。因此,OLAP常常使用多维图来显示数据。
市场购物篮分析(MBA)探索基于交易数据的联合营销产品的有效规则。此外,它还能帮助每个超市确定特定的促销产品组合。
交易数据库包含多个记录,每个记录在一次购买中显示多个项目。关联规则由 X=gt;Y表示,X和Y表示一次购物中的一组产品组。其表示如果客户购买了X商品,他们也会购买Y产品。
如果相关规则保持不变,则可信度阈值是关键因素。如果X U Y和X都是频繁的模式,那么X=gt;Y的可信度阈值是X可信度阈值除以X U Y可信度阈值的商。如果这个值大于用户定义的最小可信度阈值,那么X=gt;Y关联规则成立。
- 研究方法
本研究中使用的数据是2007年11月收集的。报道了在台湾北部和中部的71家超市340万分销售收入记录。这些记录首先被规范化,并建立了相关关系表。然后,探索关键数据维度的原因和影响。最后,将多维数据集作为数据挖掘的基本存储单元建立起来。在上述步骤之后,将会有产品的基本信息,产品分类,销售收入,业务时间,客户和其他超市的基本信息。通过试验数据挖掘和连锁零售超市的相关规则获得最小的可信度阈值。图1中显示了工作流图。
研究数据花了两周时间收集,一共340万分记录被导入到微软SQL server数据库中。建立关联表。然后,用OLAP模拟数据分析操作,生成分析报告。数据处理流程如图2所示。
图1研究工作流程图:
图1研究工作流程图
所有数据都被导入到维度表中,包括客户主表,产品主表,销售收入表等。销售收入多维数据集的事实表如图3所示。
因为这两家商店的商业区不同,所以选择了第1002号店和1058号店。一个商店在大都市(台北天木),另一个在农村地区(云林)。同样的数据挖掘模型用于分析商店的销售数据,生成并比较结果以确定差异。此外,对不同商业区域的不同营销策略的影响也可以进行分析和比较。
用先验算法分析关联规则。该算法使用最小可信度阈值作为查询条件。0.4的概率被定义为最小可信度阈值,这意味着每2.5次有1次符合规则。分析了1002号和1058号店的数据,得出0.4的概率为关联规则的最大概率值。如果低于0.4的概率,关联规则将大幅增加且很难确定。最小可信度阈值确定为0.4的概率。
- 试验结果
在本研究中,SQL Server业务智能开发工作室提供了相关规则算法并用于分析2007年11月的销售数据。第1002号店和1508号店被挑选出来分析相关的规则。第1002号店在台北天木,第1508号店在云林。最小可信度阈值的概率为0.4。只选取了周六的数据,目标产品包括食品,零食和商品。
图2数据处理工作流程图
第1002号店的结果显示没有明显的销售关联规则。只生成了2条规则,而可信度概率大于0.4,彼此相互依赖。主要相关产品是零食。1508号店的结果表明,也没有明显的销售关联规则。只生成了2条规则,而可信度概率大于0.4,而这些规则中的大多数都是相互依赖的。主要的相关产品是日常用品。
2007年11月的销售数据被取样,关键维度被用于数据挖掘相关规则。用相同的条件来比较不同地区的结果。结果表明台北天木的小吃高度关联,云林的日常用品是主要产品。
在台北天木有两条规则,在云林有51条规则。可信度指数在0.4以上。农村地区的商店有更多的产品关联规则,顾客更喜欢购买日常用品。另一方面,都市的顾客更偏爱进口零食或者新产品,产品的关联性更低。多维数据集数据结构缩短了每个商店营业时间,顾客和产品的销售相关性分析时间。其还揭示了不同地区和不同时间段的顾客行为和习惯信息。在上面的信息中了,销售人员会计划一个地区的产品组合促销策略,因此销售收入将会增加。
图3 OLAP多维数据集表
超市销售中数据挖掘的研究与应用
(The Research and Application of Data Mining in Supermarket Sale)
Meng Dan1, Li Jinghong2
- 中国北京,北方工业大学,信息工程学院,100041
- 中国北京,北方工业大学,信息工程学院,100041
摘要
本文提出了在超市销售管理中,数据挖掘应用存在的一些问题。超市销售是一种直接向终端消费者销售商品的门市销售方法,因此超市销售是生产商和消费者的中间节点,其目标是大众消费者。消费者关系管理(CRM)是一个在合适的时间,以合适的价格,向合适的消费者提供合适的商品或服务的过程,其目的是满足消费者的需求。数据挖掘(DM)是一种不断提取和展现新信息的过程。通过分析特殊数据,最终发现有效的,异常的,未知的和便于理解的信息,从而发现潜在价值。DM同样有助于企业成功运营和制定正确的决策。
关键词:数据挖掘;超市销售;消费者关系管理
- 超市销售的特点
超市销售是一种直接向终端消费者销售商品的门市销售方法,因此超市销售是生产商和消费者的中间节点,其目标是大众消费者。该定义决定了超市销售的特点,如下:
- 对于消费者,例如个体消费者和团体消费者,两者的购买能力是不同的,两者和生产商和批发商的关系也是不一样的。
- 对于商品,除了特殊的垄断情况,一般的超市都具备大量各种各样的商品。
- 对于供应商,因其关系到商品的货源,所以有关商品的信息非常庞大。
从消费者购买行为上来看,随着物质生活和财富的增长以及生活水平的一步步提高,在整个消费过程中呈现出三个阶段:① 在理性消费阶段中,消费者除了关注商品价格外,还关注商品的质量,换言之,就是消费者总是希望以低价买到高质的商品。② 随着加工质量和生活水平的稳步提高,消费者不仅关注低价高质的商品,同时他/她也开始关注商品使用的形象,品牌,设计和便利。这个阶段称为“意识消费”。③ 随着超市从卖方市场向买方市场进行改善转型,各种同类商品和同类商家开始出现,在购买和消费的过程中,消费者开始越来越关注商品的丰富性和令人满意性。消费者期望一对一的服务。这个阶段称为“心灵消费”。在同一阶段中,企业的管理概念需要进行相应的改变:起初,企业处于卖方市场,他们会销售完所有的商品,但是随后,竞争变得越来越激烈,企业的商品销售变得困难。因此,企业在关注销售情况的同时也尽量提高商品质量。结果是,销售的空间增加了,而利润却降低了。这并不是企业所希望的,所以他们尝试加强内部管理,降低成本,而且删除了不必要的商品或销售品;但是成本不可能无限制地减少,所以如果企业想要获得更高的利润,就必须重点关注利润的来源——消费者。
对于中国的超市,大多数消费者的价值选择存在于第三阶段,但是企业的管理概念仍然停留在第二阶段,这就导致了“供应和需求之间的矛盾”。为了解决这种矛盾,超市管理者需要关注消费者关系管理(CRM)。信息技术的应用加速了传统商业的发展,并且实现了企业管理的自动化和现代化。所以企业可以以最低的成本,最佳的服务和最快的管理响应来运营企业。目前,全球的超市信息管理一直在不断改进,从销售管理系统(例如:电子货架,POS系统,购物MIS系统)到电子数据交换(EDI),电子选定系统(EDS)和一些综合MIS,例如CRM,循环管理等,提供了连锁的管理系统。数据及数据挖掘等先进技术的采用使得更为复杂和智能的DSS管理能够实现。对于全球连锁的企业管理来说,CRM能够非常有效地加强其竞争能力,利用数据仓库(DW)和数据挖掘(DM)来提高运营流程,加强消费者服务,提高销售额来占据市场。这些经验都值得中国超市的借鉴。
- 消费者关系管理(CRM)的含义
消费者关系管理(CRM)是一个在合适的时间,以合适的价格,向合适的消费者提供合适的商品或服务的过程,其目的是满足消费者的需求。CRM关注于消费者,试图提高消费者的满意度和忠诚度,从而更大程度地留住消费者,并且获得更多的潜在客户。因此CRM实现了企业销售将主要重点放在消费者的技术和管理。具体来说:
- CRM是一种管理概念:其核心理念是将消费者看作是企业的重要资源。
- CRM是一种管理机制:这种新型管理机制可以应用在一些有关消费者的领域中,例如,销售,服务,技术支持等。从而,消费者可以获得快速而完美的服务,而企业能够增加销售,降低成本。
- CRM是一种软件和技术:其集合了最先进的信息技术,包括互联网,电子商务,多媒体,数据仓库,数据挖掘,专家系统,人工智能,呼叫中心等。
- 基于数据库的CRM解决方法
CRM与传统的MIS系统相关,但是有明显的不同。传统的MIS通常被用于协助处理日常运营,降低重复性工作。CRM是一种在应用中需要特殊技术的决策支持系统(DDS),例如,DW,OLAP,DM技术等,并且向企业提供决策支持。
- DW:存储和合成决策主观数据,向DDS提供数据存储和组织集成,它通过集成,传输,合成和组织,将基底数据转换为整体的数据视图。
- OLAP:以多维方式进行数据分析。从DW中的集成数据开始,构建面向分析的多维数据模型,然后利用多维分析方法从不同视图来分析和比较多维数据。
-
DM:挖掘DB和DW中的信息。以DW中丰富的数据和多维数据库为基
全文共7825字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[17140],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。
您可能感兴趣的文章
- 2.3港口吞吐量预测外文翻译资料
- 使用多标准移动通信分层遗传算法的阻抗 匹配网络的宽带优化外文翻译资料
- 移动RFID标签阅读与非重叠串联阅读器在输送带的应用外文翻译资料
- 利用数字图像进行的全场应变测量方法外文翻译资料
- 自然灾害中并发事件的多种应急资源的分配外文翻译资料
- 基于主机的卡仿真:开发,安全和生态系统影响分析外文翻译资料
- 实现基于Android智能手机的主机卡仿真模式作为替代ISO 14443A标准的Arduino NFC模块外文翻译资料
- 探索出行方式选择和出行链模式复杂性之间的关系外文翻译资料
- 信息系统研究、教育和实践的基本立场及其影响外文翻译资料
- 仓储和MH系统决策模型的设计优化与管理外文翻译资料