预测客户终身价值的改进Pareto/ NBD方法外文翻译资料

 2022-09-06 10:42:20

英语原文共 23 页,剩余内容已隐藏,支付完成后下载完整资料


预测客户终身价值的改进Pareto/ NBD方法

摘 要

重视客户是任何商业活动的核心问题。客户终身价值()是这个客户对公司未来收益的折现值。为了计算,需要预测客户的交易数量将与这些交易的利润的未来值。用模型,与客户未来交易的数量可以预测,而然后计算折扣产品数量和预期收益之间每交易。一般情况下,交易的数量和每笔交易的未来利润是分开估计的。本研究提出了替代方案。并且,我们发现,交易数量和利润之间的关系可以被用来增加的预测精度。这一点可以从一个零售银行部门新的经验情况下得到证明。

1 介绍

重视客户是任何商业活动的核心问题。个人客户的价值是非常重要的,这是最有价值的,值得密切关注,并且对于那些检测出少有价值的,公司应减少关注度。总体来说,针对一组已知价值的客户的营销活动,可以更有效地缩减预算。客户是重要的资产,因此,必须精确评估。

在一些客户关系管理文献的论文中都有讨论客户价值,例如Dwyer[1997],Berger和Nasr[1998],Rust等人[2004]和Malthouse和Blattberg [2005]。顾客的价值一直以来被定义为他/她的生命周期内的历史财务价值。然而,Reinartz和Kunar[2000]并不认可这种定义,因为他们发现,生命周期与客户的盈利能力并不一定相关。相反的,Rust等人[2004]强调,营销战略应着眼于利用客户基础的总价值来预测的未来财务回报。支持这个观点的人中,Gupta等人[2004]亦表明,一个公司的盈利,即它的价值,是这个公司的客户终身价值()的函数。定义为客户对公司产生的未来收益的贴现值。问题是,当未来交易的时间和利润不知道时,在非合同环境预测未来的利润,如Mulhern [1999]和Bell等人[2002]所讨论的那样。

模型,经过Schmittlein 等人[1987]介绍,被几位作者[例如Mulhern,1999;Niraj等人,2001;Jain和Singh,2002]用来预测在非合同关系的客户未来活动的一种强大的工具。实际中的例子,如Schmittlein和Peterson[1994],Reinartz和Kumar[2000]和Fader等人[2005a]。因为模型只能预测一个客户的活动的概率和交易数量,为了使之包含交易的利润以及用来估计,故而做了一些调整。因此,的子模型被Fader等人[2005a]使用。由这个改进后的模型进行预测,一个关键的假设是一个客户的交易数量和交易相关的利润之间是相互独立的。我们将进一步修改模型,而不是依靠这种独立性假设。

本文的目的是提出一个改进的 的预测模型。在实证研究中,使用由零售银行家所提供的客户证券交易订单,我们将表明,新提出的方法比传统的模型具有更好的预测性能,而且它也优于标准的回归方法。

本文基本架构如下:在第2节中介绍了客户终身价值的概念之后,第3节中描述了以前用来预测的子模型。第4节中提出了一种改进的模型,我们称之为模型。第5节中列举了实例,在实例中将不同的模型的预测性能进行比较。

2 客户终身价值的定义和原则

如今,人们可以看到一个扩散的估值方法,使用“客户终生价值”或“客户权益”。概述,看到Pfeifer等人[2005]。本文遵循Gupta等人[2004]定义客户的价值,即在未来的每一段期间,客户所产生利润率的折现期望总和。

是个人客户未来将要进行的交易的函数。严格地说,所有未来的交易都应该考虑。然而,为了比较我们的预测与实际数据,我们将取一个有限的范围。因此,在范围中顾客的是

其中是折扣率,假定为常数。因此它是净现金流的总数的折现,其中是净现金流,是净现金流量(即总收益减去总成本)由于客户在时间周期的活动,一个客户的显然是随时间变化的。不过,我们不会在符号中引入时间的关系,因为在我们的实证研究的时刻是相同的所有客户。

在给予过去的购买信息的情况下,本文研究了的预测。在最小二乘意义上,最优预测是:

在最近的一篇综述建模,看到Gupta等人[2006]。大多数论文预测[例如Schmittlein and Peterson,1994;Venkatesan and Kumar, 2004;Fader等人,2005 ]都是使用二步方案。首先他们预测未来每一个人的交易数量。例如Fader等人[2005],研究CD零售商的销售,首先预测光盘的未来购买数量。然后,估计个人每笔交易的平均利润。这些值估计在客户的水平,如果未来数的交易和每笔交易的利润的产品折扣和总结,它产生的每个近似顾客。第3节评论这种方法。第4节修改此方法,动机的实证证据表明,交易的数量和每笔交易的平均利润是彼此独立的。

3 客户终生价值预测

本节将描述的预测常用的方法。首先,对于未来的交易数量的估计,使用模型(下一节中描述)。接下来,另一个模型提供每次交易的平均利润估算方法。然后将 当做一种已知未来交易数量和每次交易的平均利润的折扣产品来计算,这种方法就是我们所说的模型。

3.1 子模型描述

我们将描述Schmittlein[1987]等人提出的模型。根据该模型,由过去的观察,可以估计子模型的参数。然后,我们就能够一个能够预测未来活动的客户。所有的预测都是在相同的时间点,即当前时间或 “现在”。

对每个客户来说,过去三种采购行为的测量是必须的。第一种购买信息即为序列。这是公司的每个客户从进入公司的开始直到现在之间的时间。如果我们用表示在时间之后客户所产生的交易数量,那么直到当前时间,该客户所产生的交易数量则为。后者的值称为频率以及模型所需的第二采购变量。在本文中,我们用速记符号记为。注意到第一次交易发生在开始的时刻,因此从客户和公司之间的关系开始,直到“现在”的交易总数为。模型所需要的第三个即最后的采购信息就是开始的日期到最后的购买日期之间的时间。这个值被称为近因并且记为。较近期的是上一次购买的,更高的就是,。客户的采购信息包含三个观测值:,和 三个不同的队列,频率和近因,对每个,其中N是总样本大小。

模型的上下文中,只要这个客户做交易,就称一个顾客是活跃的。即一旦不再活跃,客户不会再做任何交易。这里有五个假设有关购买进程和客户保持活跃的时间。首先,活跃的客户的购买行为服从参数为的泊松分布。我们将在中证明这个假设。 让顾客的非活跃状态的时间被表示为。如果客户在仍处于活跃状态(因此有),故而在时间段内,购买数量服从泊松分布:

第二个假设就是每个客户的活跃状态服从死亡率为的指数分布:

由于参数和在不同的客户之间是不同的,模型的第三个假设建立在客户的异质性上。假设是不同客户的购买率服从伽马分布。

则。第四个假设就是根据客户的不同,死亡率服从参数不同的伽马分布:

则。最后,购买率和死亡率的分布被认为是彼此独立的。人口参数,,以及均未知且需要被估计出来。

在本文中,人口参数,,以及均通过极大似然估计来估计。在Fader和Hardie[2005]看来拥有购买历史的独立客户的似然函数为

其中,,

其中:

并且其中为超几何函数,即为幂级数的形式:

其中是一种符号,表示一种提升因子,即出了极大似然估计,还可以使用矩量法,但是Reinartz and Kumar[2003]证明矩量法所得到的结果与极大似然估计的结果是相似的。

一旦参数被估计出来了,可以估计客户活跃的概率,并且可以预测这个客户未来将产生交易的数目。在当前的时刻,考虑到频率,近因以及客户的序列,客户处于活跃状态的条件概率的估计为:

子模型还提供了(无条件)交易数量客户的期望值会随着时间的推移,

然而,相对一个独立的客户的终生价值,我们更愿意去估计这个值表示,在给定近因、频率以及客户群时,直到时间的尽头,客户 所产生的交易数量的条件数学期望。如Fader and Hardie[2005]所证明的,这个期望的值为:

其中是等式的似然估计并且表示标准伽马分布。在未来的第个时间阶段交易数量的期望是

Fader[2005b]等人提出了一种更为简单的实现方法,即模型,该模型考虑的是分布而不是分布。只是改变轻微的模型的假设,这种方法甚至可以在中实现。然而,在本文中,由于其作用,我们将使用参考文献中的传统的模型。

3.2 子模型

到现在,在模型中,需要用来预测CLV的每笔交易的利润还没有被介绍到。由Fader[2005a]等人提出的模型能够达到这个目的。这个模型估计平均每一个客户的交易利润。一笔交易的利润就能够被视作它所产生的净现金流。我们用表示客户所产生的每笔被观测到的交易的利润,并设从客户与公司关系的开始直到时间内,客户所产生交易的平均利润为。注意到当时,有:

这是货币价值,是直到当下客户每笔交易的平均利润。

Fader[2005a]等人在他的模型中的另一个假设(记为)是,对于每一个独立的,每笔交易的利润于交易的数量无关。此外,在子模型中,我们假设每笔交易的期望利润不随时间变化而变化并记为。因此,货币价值就是的样本估计。进一步假设(记为假设)均为分布,其形状参数以及尺度参数分别为,。最后假设(记为)的值服从形状参数为尺度参数为的分布。因此我们就可以导出子模型的总的似然函数,其中有三个未知参数:

最后,一旦通过估计出这些参数,客户每笔交易平均利润的条件数学期望就是:

这是利润以及的总体均值估计的加权平均。子模型的更多细节等方面,详见Fader[2005a]等人的著作。

3.3 模型的描述

大多数论文中,例如Schmittlein and Peterson[1994],Venkatesan and Kumar[2004]以及Fader[2005a]等,运用相同的原则预测。一旦通过估计出在未来某个时间段的交易数量,他们把这个数乘以通过求出的平均利润的期望。于是就可以求出:

这种预测需要的近因(通过方程求),频率(通过公式求)和货币价值(,通过公式求)。它适合著名的(近因、频率和货币)框架。

我们的实证研究中,当预测的值,我们将首先应用于本节所述方法。这种模式被称为模型。下面,我们将假设每次交易的平均利润可以独立估计,与交易数量无关。所得改进的方法被称为模型,在下一节概述。

4 预测的改进方法

在我们将讨论的第5节实证应用中,我们将表明,独立性假设即交易次数和每次交易的平均利润独立是值得怀疑的。在Fader等人[2005a]著作中,实证分析中作者发现了一个和之间的相关的的平均值。但他们接受的独立性假设,认为这个值是非常小的。新的方法需要考虑的交易次数和每次交易的平均利润之间的可能依存关系。这种依赖性将设计在客户的水平,占人口的异质性。此外,我们不需要一个恒定的与时间无关的每笔交易期望利润。由此产生的模型被称为模型。

我们假设客户的交易次数和每次交易的平均利润能够通过模型求解

在这里,表示依赖系数,其估计方法将在下一段给出。方程表明每次交易平均利润的期望值的偏差,与交易数量有着相同的偏差。在这里,交易数量期望值以及货币价值分别由模型和模型提供,分别用方程和数量。

这个想法是,一个客户的货币价值取决于他/她所产生的交易数。这种依赖关系可以在客户是不同的。有大量的期货交易客户可能具有较高的货币价值,但也可能产生相反的结果。因此我们模型的依赖系数作为一个解释变量的函数,即前面所讲的队列、近因和一个客户活跃的概率的函数。其中,最后一个变量最有意义因为一个客户更可能是保持活跃,一般情况下客户每笔交易平均利润及其交易数量之间具有正相关性。因此

在中令并且插入中的收益率:

其中。估计该回归方程的参数估计的参数,以及,因此也是对的估计。

在时间段内,每笔交易平均利润可以被估计,方程表明。

的估计值即为收益率:

观察到的过去的交易数量(频率)记为,记为客户的队列,公式中即为的估计值。可以看到现在就是时间段。通过,用来计算时段序列的客户的,在模型下,可表示为

5 实证分析

第一个实证应用中,我们使用一个由比利时零售银行提供的新的数据集,并在5.1节中详细描述。在5.2节我们的经验表明,在这个数据集中,交易数量和每笔交易的利润之间是显著相关的。第二个实证应用中,我们研究数据集中的预测,这个数据集已经被Fader等人[2005a]用作为一个基准数据集。在这些数据集中,采用不同的模型的预测的精度是不同的。在5.4节中,它会变成为零售银行的数据集,新提出的模型预测结果最好。对于数据集,在交易次数和每次交易的平均利润的相关性很弱的时候,所有方法预测精度都一样。

5.1 描述的零售银行家数据集

零售银行的数据集是由比利时的金融服务机构提供。数据集包含客户股票交易数据从2000年1月到2005年十二月。客户总体是在经纪业务没有专业活动比利时居民。460566名客户所产生交易总数为11068877,

这些客户可能已经购买(或出售)的股票、债券、基金、衍生品等。计算每笔交易的利润时,由行业规则,可当做保证金金额的1%的交易交换。当计算时,我们将每月的时间段工作。贴现率是以比利时的金融服务机构,2004财务报表披露的加权平均资本成本的年利率8.92%,每月折扣率。

在客户的总基地,我们选择那些一月2001和十二月2003之间的第一次交易。预测将在2004年1月1日。剩下的两年

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[147023],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。