发现零售顾客购物行为的时间规律外文翻译资料

 2022-07-06 18:49:43

英语原文共 26 页,剩余内容已隐藏,支付完成后下载完整资料


发现零售顾客购物行为的时间规律

Riccardo Guidotti, Lorenzo Gabrielli , Anna Monreale , Dino Pedreschi and Fosca Giannotti

摘要:本文研究了零售市场供应链客户的时间购买行为的规律。大多数研究购买行为的文献都集中在顾客购买的东西上,而忽略了时间维度的重要性。因此,现有技术不能捕获每一个顾客的时间购买模式。这些模式应该描述客户的时间习惯,突出显示顾客通常在购物时与支出金额、购买的物品数量和其他类似的信息。这种信息可以用于不同的范围:设置时间折扣以使顾客的购买在时间上更加规律,在顾客喜欢的日期和时间窗口中设置个性化折扣,为购物时间安排等提供建议。为了达到这个目的,我们引入了一个从个人零售数据中提取的框架,这个框架可以用来总结客户在购买时是否有特殊的购买行为。个人档案描述了一套规则和特征化的购物行为模式,以及这些模式发生的顺序。我们展示了如何通过为其个人档案提供集体视角来比较不同的客户,以及如何根据这些可比较的档案对客户进行分组。通过分析包含数以百万计的购物会话的真实数据集,我们发现,对所有客户的时间购买行为进行汇总的模式是有限的,并且它们以有限的方式顺序遵循。此外,我们认识到常客的特点是有少量的时间购买行为,以及变化的顾客特征是各种各样的时间购买行为。最后,我们将讨论如何通过客户实现个性化服务以及零售市场链如何根据时间购买规律提供量身定制的折扣。

关键词:时间购物档案; 个人集体分析; 客户细分; 零售顾客购物行为分析; 集体视角

1介绍

大量零售数据的可用性激发了具有挑战性的问题,只有通过对与顾客购物环节相关的不同方面的深入而准确的分析才能解决问题。零售数据是一种复杂的数据类型,包含不同的维度:顾客购买什么,何时购买,在哪里购买,这与购买的花费或购买的物品的数量有关。分析一组维度而不是另一个维度的选择取决于要研究的现象类型。考虑到所有的维度都可能导致非常复杂的模型或弱泛化。了解顾客如何安排购物时间的最重要的因素显然是时间因素。文献中的大部分作品都集中在顾客购买的东西上。他们中只有少数人利用时间维度来丰富他们主要基于购买的商品的模型。然而,为了提取一个有助于理解购买时间习惯的顾客模型,它已经考虑到了它自身所考虑的所有购物环节的不确定性。因此,利用文献中提出的方法,不可能捕捉到每个客户的时间购买模式,将其时间习惯与其他信息(如支出金额和购买物品的数量)联系起来。这种对顾客的了解是很重要的,因为可以根据顾客的时间和系统的行为,为顾客提供不同的营销策略,并根据购物时间安排建议和提高顾客意识,为顾客提供新的创新服务。据我们所知,以前的工作不仅仅关注时间维度,而且还将其作为构建个人时间购买配置文件的主要构件。我们并不是说忽略所购物品或购物地点在研究上会有优势,但我们表明,只观察时间维度对于完全理解顾客购物时所采用的不同时间和费用是至关重要的。

在本文中,我们感兴趣的是了解客户是否以及何时通常进行零售购买。购物行为的这些时间方面哪一个更系统?哪些是时间模式的常规序列?为了达到这个目的,我们提出了一种能够描述个体客户的正常和特征时间行为的时间购买配置文件。事实上,个人是位于单一购买和整个顾客群体之间的关键因素。每个人都有自己的规律和习惯,勾勒出她的行为,并使她成为大众的一个独特的部分。对个体的分析为理解在集体层面的购买行为中常见的规律模式提供了基础。因此,我们的目标是定义个人和集体时间配置文件,以用于分析顾客购物环节的时间维度。具体而言,我们的模型支持客户细分,该细分考虑购买的时间要素,并允许在新的观点下对个人进行探索性分析。我们使用已定义的方法框架进行不同的案例研究,目的是发现客户的时间购买模式,并将客户的配置文件分组,以识别具有相似时间行为的客户群体。

这项工作的主要贡献如下:(i)我们将时间购买概况定义为一组时间足迹和足迹序列,概述消费者是否以及何时通常购买,并提供提取这些概况的方法;(ii)我们定义了一个整体的视角,以使个人和不可比较的个人资料具有可比性,从而可以分析不同顾客分享的购物习惯;(iii)我们将整个分析框架工作应用于一组案例研究中的一个真实数据集,其中一个包含了针对9.1万个客户的7年零售数据;(iv)我们从个人和集体观点来研究如何将顾客分成明确的群体。

我们的方法论框架使我们能够发现不同的客户对不同时间方面的分割。特别是,我们的研究揭示了三种主要典型的集体行为,以它们何时去购物中心为基础来表征整个顾客集合:日常消费行为可以捕捉每天的购物行为;一店消费行为,描述一周包含主要的购物环节的规律性;还有一种偶然的消费行为,描述了与非常小的支出金额有关的不习惯性购物活动。在一店消费行为中,在支出金额方面进一步分类分析:低于50欧元的正常消费行为,典型支出在50欧元到100欧元之间的高消费行为,消费行为高于100欧元的高消费行为。通过分析个人和集体层面不同购买行为的数量,我们确定了两类客户,常规的和变化的:具有大量时间购买行为模式的顾客被分类为变化的顾客,而具有少量时间购买行为的顾客被分类为常规顾客。最后,我们发现了各种各样的经常性序列,解释了消费者在时间观点上如何组合和遵循他们的购物行为。

论文的其余部分安排如下:在第二节中,我们讨论相关的文献;个人档案是在第3节中定义的,而在第4节中,我们描述了提供集体视角的方法;在第5节中,通过案例分析说明了所提出的模型和方法的数据分析的有效性;第6节讨论了所提议方法的可能应用;最后,第七节报告结论和未来研究方向。

2相关工作

虽然文献中的大多数文章都只考虑与购买的物品有关的方面,而没有具体关注时间维度,但本文所提出的顾客购买行为的分析使用了时间维度作为一个基本的构建块。在文献中,有各种各样的文章分析并且试图预测顾客的行为。为了达到这个目的,他们通常会考虑与购买物品有关的方面,而不是时间:顾客经常购买的商品,在商店里关注的商品以及顾客行为在他们购买商品时的变化等等。据我们所知,没有一篇论文只分析顾客购物时段的时间维度,以了解顾客是否和何时通常进行特征化和常规购买。

3个人时间购买档案

我们提出的用于提取时间购买概况的分析过程假定为输入零售数据,即是描述一组客户的购物活动的一组购物会话。在图1中,我们总结了本节中介绍的定义和符号。由于在这项工作中我们没有考虑购物地点或购物篮的内容[3],我们将购物会话s建模为元组s =(客户,时间戳,数量)(参见图1-(a))对于每个客户,我们通过引入时间采购单元(简称单位)的概念来总结一组购物会话的时间信息,定义如下:

定义1(时间购买单位)给定时间周期tau;,客户c的一个时间购买单位U是一个矩阵Uisin;R ttimes;d,其中d是tau;在dle;d时的日间间隔数, t是每个时间间隔考虑的时间窗口的数量,并且U ij估计第j个时间间隔的第i个时间窗口中购买的相关性。

时间购买单位,它不是一个购物会话的集合。它是一个对象,以矩阵的形式对一组购物会话进行建模,该矩阵包含客户在特定的离散时间间隔内所花费的金额,并在指定的时间间隔内购买。每隔一段时间,我们就会指出任意一天的集合,例如单日,周日,周末等,而在时间窗口则指的是任意小时的集合,例如一小时,上午 - 下午等。给定一个周期tau;,每个单位U捕获顾客购物会话在时间tau;离散化到特定时间槽的相关性。相关性可以通过与购物环节相关的任何价值来表示:花费的总金额,购买的物品数量等。图2举例说明了两个例子:在每周的(左边)的每一天分别被认为是独立的,并且与使用的钱是相关的(图1-(b)),而在(右边)这一边是周末和工作日,而相关性是购买的物品的数量。时间粒度和相关类型取决于分析的目的,并在实例化框架以分析真实数据集时设置。 在我们的案例研究中,我们采用了与单位相关的花费金额。

给定客户c,她的时间序列购物会话序列S =(s 1,...,s n),时间窗口粒度t,日间间隔粒度d以及时间段tau;的宽度,则S可以是 分割成m≦ n的有序单元序列Ŝ=(U(1),...,U(m)),其中每个时间购买单元U(i)集合关于t和d的一组购物会话。

我们的目标是为每个客户总结包含在Ŝ中的信息,描述客户的典型时间行为。为了定义个人档案,我们需要提取客户c的“独特”时间购买行为,即她的购买足迹。

根据客户c的单元序列,我们可以根据时间对齐的概念和考虑的相关值,检测与距离函数delta;相似的单位组。因此,给定G组的相似单位,我们定义一个时间购买足迹F(简称为足迹)作为组G的代表。每个足迹F捕捉表征客户的时间行为。我们定义时间购买足迹如下:

定义2(时间购买足迹)给定一个序列Ŝ=(U(1),...,U(m))和距离函数delta;:R ttimes;dtimes;R ttimes;d→R定义时间购买足迹组Ɠ = {G 1,...,G k}作为alpha;的分割。Ŝ划分为不相交的相似足迹集,给定一个群G = {U(1),...,U(q)},我们将时间购买足迹命名为G的质心F. F是矩阵Fisin;R ttimes; d这样

我们用Ƒ= {F(1),...,F(k)}来表示客户的一组足迹。 请注意,为了提取足迹,我们不考虑Ŝ中单位的顺序。 图1-(c)显示了以星期几为日期间隔和上午 - 下午 - 夜间粒度作为时间窗口的足迹示例:单元格越黑,相关性越高,与此情况下的数量相对应。

给定客户的群体Ɠ 和足迹Ƒ,我们可以将Ŝ中的每个时间购买单元替换为代表它所属的组的足迹。 我们命名新序列时间购买足迹序列(简称为足迹序列,参见图1-(d))。 例如,给定Ƒ= {F(1),F(2)},Ɠ= {G 1,G 2}其中G 1 = {U(1),U(4)},G 2 = {U 如果Ŝ=(U(1),U(2),U(3),U(4)),则相应的覆盖区序列为fnof;=(F(1),F(1) ),F(1),F(2))。我们将时间购买足迹序列定义为:

定义3(时间购买足迹序列)给定一个客户c,她的单元序列Ŝ,她的群体Ɠ和她的足迹Ƒ,我们将根据Ɠ将时间购买足迹序列定义为序列fnof;代替Ŝ单位的对应足迹在Ƒ。

算法1:提取个人档案

输入:时间排序的购物会话的S序列,每个覆盖区覆盖的时间段的tau;-宽度,要在覆盖区中设置的d日期间隔,要在覆盖区中设置的t时间窗口,rel-相关函数 ,delta;距离函数

输出:P-时间购买配置文件

1 Ŝlarr;分割成单位(S,tau;,d,t,rel)

2 Ɠlarr;检测组(Ŝ,delta;)

3 Ƒlarr;{D(i)| D(i)=得到质心(G i)forall;Giisin;Ɠ}

4 fnof;larr;构建序列(Ŝ,Ɠ,Ƒ)

5返回Ƥ= {Ƒ,fnof;}

最后,我们将客户的时间购买配置文件(配置文件,参见图1-(e))定义为:

定义4(时间购买配置文件)给定一个客户c,她的单位序列Ŝ,以及距离函数delta;,我们将c的时间购买剖面定义为Ƥ c = {Ƒ,fnof;},其中Ƒ是从delta;中导出的足迹,使用delta;检测,fnof;是相应的足迹序列,

提取个人时间采购档案。算法1概括了提取个人简档的过程。第一步是将时间顺序购物会话序列S分割成时间购买单元序列,给定d天间隔,t时间间隔, 每天间隔的窗口以及函数rel返回的相关值(图1中的(a)到(b)的第1行中的段入单元函数)。单位序列Ŝ涵盖宽度为tau;的时间段。 给定Ŝ和距离函数delta;,检测组函数(第2行,图1-c)应用聚类方法在delta;上找出相似单位的组。 根据分析的目的,可以选择适当的聚类方法和距离函数。请注意,距离函数delta;必须允许提取质心。 一旦检测到单位组G,从每个组中获取质心函数(第3行)提取表示客户足迹的质心F(i)。 然后,使用函数构建序列(第4行),考虑到Ŝ,G和F,构建足迹序列fnof;。最后,由算法(line5)所返回的时间购买配置文件Ƥ由一组独特的足迹Ƒ和独特的序列形式fnof;构成的。算法1的计算复杂度由实现聚类算法的检测组函数的复杂度决定。

4个人档案的集体视角

不同客户的个人资料不具有可比性,因为每个客户可以有不同数量的足迹来表达不同的行为。因此,为了比较不同客户的个人资料,我们需要为他们提供一个集体视角。给定客户b和c的配置文件Ƥ b和,Ƥ c,这意味着要制作可比较的覆盖区域Ƒ b和Ƒ c以及覆盖区序列fnof; b和fnof; c。我们首先指定如何通过定义集体时间购买足迹(简称集体足迹)来比较足迹,如下所示:

定义5(集体时间购买足迹)给定一组个人足迹{F c}和一个距离函数delta;:R ttimes;dtimes;R ttimes;d→R,我们定义了集体时间购买足迹组= {L 1, ...,L k}作为{F c}划分成不相交的相似足迹集合,并给定一个单独的足迹组{= {F(1),...,F(q)},我们命名集体时间 购买足迹的L的质心,即Cisin;R ttimes;d,使得

我们命名Ƈ= {C(1),...,C(k)}所有客户的集合足迹。 给定一个客户c,她的足迹F c,集体足迹Ƈ和集体组Ł,我们用客户集体足迹表示Ƈ c = {C(1),...,C(q)}Ƒ c ,其中Ƈ csube;Ƈ和forall;C(h)isin;Ƈ cexist;F(i)isin;Ƒ c st F(i)isin;L h,L hisin;L,C(h)是L h的质心。

我们强调,我们使用表达客户集体足迹来表示单个客户的集体视角,并表示所有客户的集体足迹。

考虑到集体足迹集合Ł和所有客户的集体足迹Ƈ,我们可以将{lambda; fnof; c}中包含的每个单独足迹序列替换为代表它所属集体集体的客户集体足迹。 因此,对于每个客户,她的足迹序列lambda; fnof; c被映射到等价的集体时间购买序列lambda; Ĉ c(简称集

全文共6027字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[10178],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。