英语原文共 14 页,剩余内容已隐藏,支付完成后下载完整资料
2.汽车销售和服务数据
如前所述,保修数据包括索赔数据和补充数据。本研究中所使用的数据集也包含了超出保修期的维修服务,因此我们将理赔数据作为服务数据参考。补充数据不会随时间而改变。在我们的案例中,由销售数据充当这个组分。
在进一步深入之前,了解车辆的哪些属性有助于满意度提升是有帮助的。J.D.Power and Associates的一项研究列出了顾客满意的关键因素。
- 在不同车辆子系统下中遇到问题时车辆的质量和可靠性(24%)。
- 包括设计、舒适性、特点等的车辆诉求(37%)。
- 包括燃料消耗、保修和售后服务或维修费用在内的所有权成本(22%)。
- 包括服务质量,服务时间等在内的经销商服务满意度。
可以看出,质量、可靠性和服务相关的满意度对整体满意度的影响程度接近50%(包括所有权成本的一些贡献)。在本文中,我们主要关注质量、可靠性和服务满意度,因为它们可以通过从销售和服务数据中获得的字段故障信息进行量化。表2表现了这类在销售和服务数据中发现的典型字段,可以用来评估此类满意度。
目前还不清楚表2中的数据字段如何直接使用。因此,我们首先从组合销售和服务数据中提取出某一特定特征x,从而使某一特定客户/车辆的CSI可以通过数学函数f来近似。
我们称CSIvehicle为CSI模型,用于预测给定车型的客户满意度。从制造商的角度来看,CSI模型(f)可以对所有的顾客的观点进行具有确定性的总结,这有利于辨别有较高感知质量的汽车模型,更重要的是,它指出了不同车辆模型各自较突出的问题。通过从文献中获取线索,我们可以对函数f添加一定条件,使其满足上述预期。假设客户满意度的频率分布是一种通常向左倾斜且对称连续的形状。此外,界内也广泛认为,这个分布往往是(两个或)三个不同人群(不满意,满意和非常满意的顾客)满意度的(两个或)三个近正态分布的收敛。本文提出的工作是基于这一假设的。它的直接意义是,对于给定的车辆模型,大多数客户对车辆模型的总体感知(满意度)是相似的。如图1所示,这导致了CSI分布的低方差。基于这类CSIs模型假设的的函数f,也会使所有客户的平均预期变得更有意义,从而得出对正在考虑的车辆模型的总体满意值。这就是我们如前所提的上溯法的含义。通过统合与车辆模型对应的所有客户的CSI值,可以获得该车型具有代表性的CSI值。
3. 特征提取
表2中的字段虽然代表了客户的满意度,但不能直接用于数学函数。为了对CSI进行建模,我们找到了六种特征量,可以用联合销售和服务数据来计算每一辆车的特性。更多的特征可以让研究更详细。这些特征与满意度的关系也可以通过逻辑方法建立如下:
chi;1:客户的访问次数。每辆车的VIN或车辆识别码都是独一无二的。通过计算特定VIN在服务数据集中出现的次数,可以确定拥有该车辆的客户的访问次数。更多的访问意味着更低的客户满意度,因此依赖度可以被建模为
chi;2:客户无法获得车辆的总天数。客户的等待时间是修复开始日期和交付日期之间的时间长度。我们将这些差异和访问次数加起来,得到chi;2=。等待时间越长,对满意度的负面影响就越大,建模为
chi;3:所有服务/维修费用之和。这些费用包括劳动力成本、部分成本和杂项费用(如果有的话)。在给定时段内,车辆的总开支可以以chi;3= 的模型得到。从逻辑上讲,它遵循
chi;4:多次访问之间的平均时间间隔。第一次访问的时间是服务数据中最早(售后)访问日期和车辆销售日期之间的日历差异。此后,从服务数据中可以获得后续访问的时间间隔。累积时间间隔的平均值除以访问次数。算术上便是:
chi;4的值越大意味着更长的无故障车辆使用时间,这点提高了客户满意度。因此,我们有
chi;5:两次访问之间的平均里程数。如同时间间隔一样,没有问题的车辆行驶的里程数可以从销售和服务数据的里程表读数中得出:
我们可以很容易地得到:
chi;6:问题严重性等级的总和。每个车辆访问都与一个修复代码ri相关,它定义了故障类型。所有修理代码由领域专家分别定义在1(较小问题;比如燃油品种改变)和5(重要问题;引擎替换)之间。由于严重性评级对CSI有负面影响,我们有
注意,chi;4和chi;5的特性是平均值,而其余的特性只是单纯的求和。从OEM的角度来看,过高估计CSI的成本通常比低估它的成本要高。由于时间的总和以及每次访问之间的间隔对CSI的估值都有很大的影响,平均地看他们的访问次数可以降低对特定客户的顾客满意度的高估的可能性。
4. 单一车辆CSI模型
上面提取的特征量仍然不能直接使用,因为它们在不同的范围内变化。为此,我们需要一个预处理步骤。在这一步骤中,我们将讨论每次为一个车辆模型获得一个优化的CSI函数的过程,然后在下一节中,我们将讨论一种方法,以得到一个多车辆CSI函数。
4.1质保信息的预处理
通过分析我们在这项工作中使用的五种车型的服务数据,表3显示了一些特定车型特征的统计数据。显然,直接使用这些特征量来构造函数f将导致CSI模型存在偏差,因为从数值上而言,不同特征量会对CSI有不同的影响。因此,我们通过标准化程序将特征映射到范围[0,1],
其中C为车辆模型的总客户数。这类线性归一化的特点之一是不会影响频率分布。
其次,基于我们之前建立的不同的逻辑相关关系,引入以下特征转换以简化评价体系,以便chi;i值的增加对应更高的CSI,
这个变换让我们可以通过单调的CSI函数体现每个chi;i的变化,在这个处理中,我们将chi;i定义为转换后的特征量,与上一节中引入的chi;i相反,它被称为提取特征。我们在方程中加入了一个常数,以上两公式确保了车辆CSI在具有最小的对应量chi;i时不接近无穷大。
4.2 CSI函数的数学结构
为了得到CSI函数的数学形式,我们现在定义一个函数形式。
这里函数f并非先验,我们只把它确定为具有六个变换特征的单调函数。当然,我们对CSI函数有一些期望。如前所述,我们的主要目标是构建一个CSI模型,这个模型对于给定数据的给定车辆模型具有较低的方差(如图l所示)。其次,这个模型应该足够可调,以便区分在市场上感知质量具有明显差异的两种或更多的车型。这是我们的次要目标。这里我们引入一个参数数学模型,以便满足特征之间相互作用的特性。这个模型的参数算法可以同时满足两个目标。我们的假设模型包括6个项,我们定义为Tl。它的每一项都对应不同的变换特征,
这里的beta;il是布尔决策变量,它决定第l项中第i个转化特征的存在(当B=1)或不存在(当beta;il=0)。当beta;il=1,alpha;il表示相应的指数。
六个相乘的项可以依次相乘或叠加。如前,布尔变量决定了要增加哪些项和要添加哪些项。我们采用1对应加算,0对应乘算的逻辑。这些中间布尔变量由gamma;l表示。由于CSIvehicle对每个提取的特征Chi;i的依赖性已经被合并到转换的特征量中,所以不考虑反向操作(除法和减法)。通过6个关系,我们确定5个额外的布尔决策变量。可以使用二进制字符串表示41(36beta; 5gamma;)个布尔变量。
图2给出了本文所采用的描述方案的一个例子。每个第7位是变量gamma;,它定义了第Tl和Tl 1项之间的算术运算。遵循通常的运算符顺序(乘法和加法),对CSI进行评估。当一个项评估为可合并时(即当beta;ilforall;i时),在进一步的计算中它就被忽略了。图示的字符串计算为。
这种建模方法类似于一种遗传编程模块,其具有作为终端组的T{Chi;iforall;i}和作为功能组的F{times;,+},而不引入与这种通用系统存在的计算成本。
4.3 对优化问题的阐述
为了实现客户级别的CSI模型,我们现在的主要目标是获取优化的CSI函数,以便在对不同的客户进行评估时,能得到低方差的分布结果。一个较窄的CSI分布意味着同客户更大的一致,由此获得的总体满意度将更加合理。这点可以通过把所有客户的CSI值的方差(或标准差)最小化处理来实现。然而,有两种情况可能导致错误解。
首先,由于指数函数是非负的,因此方差的最小化会使它们趋近于零,从而在标准化后产生严重的CSI分布右偏。为了避免这种情况,我们引入了第二个“辅助目标”,将分布的偏态最小化。其次,布尔变量的存在可能导致beta;il=0forall;i(实际可能极小),l值导致零方差的不理想分布。下面的约束集用于防止这种情况。
这基本要求每个提取的特征Chi;i至少在其中一个项中使用。然而这个处理有其实际意义,因为6个提取特征是唯一可以从销售服务数据中获得的信息,我们希望得到的CSI模型能够引用这些信息。
这种优化是利用遗传算法(GA)进行的。上面讨论的二进制表示模型的正基于这种思路设计的。下述公式给出了从车辆模型的客户C的销售和服务数据中,寻找客户级CSI模型的双目标优化方法。
其中CSInrvehicle为第j个客户的CSIvehicle的标准化值。在0和1之间的标准化是线性的,用的是最大和最小值的CSIvehicle,j。注意alpha;il的任意值上限。任何其他值都可能被使用。
- 多个车辆CSI模型
上述客户级别的CSI建模技术满足了我们获得低方差和低偏度CSI分布的主要目标。然而,如表4所示,获得的CSI模型在车辆模型之间存在差异,因此并没有为比较或排序工作提供一个合适的环境。如前所述,我们的第二个目标是修改4.3中的问题公式,这样就可以使用单个CSI模型来尽可能清楚地区分两个或更多的车辆模型。为此,我们考虑在车辆模型的不同组合中,调节平均CSI值之间的绝对差值使之最大化。由于这可能非常耗时,所以我们先减少了为每个车辆模型获取特定CSI函数的计算工作量。客户级CSI模型的结果告诉我们,最好的CSI模型是在膝区获得的。因此,我们可以通过将方差和偏态目标转化为额外的约束,从而将检索范围限制在全部5种车辆模型的膝区。从图3中可以看出,5个车型的客户级CSI模型对应的5个有效前线的膝区有sigma;lt;0.05,|g|lt; 0.25。目前提出的多车辆CSI建模的单目标优化问题可以表述为。
这里,m和n代表了推导的多车CSI模型的车辆模型的指标。sigma;m,mu;m和gm分别是第m个车型(拥有Cm个客户)的标准化CSI值的标准偏差、均值和偏度。对于五种车型,我们可以使用其中任意组合来获得相应的多车型CSI模型。相应地,可以利用进化优化算法(EA)来解决上述问题。通过将需要考虑的所有车型的销售和服务数据输入。
在接下来的讨论中,我们将车辆模型的任何组合称为训练集(TS)。为简单起见,我们将训练集描述为车辆模型的TS{车辆模型列表}和相应的CSI模型,CSI{车辆模型列表}。例如,包含模型2、3和4的训练集是TS{2、3、4},其对应的CSI模型将被称为CSI{2、3、4}。
- 总结与讨论
由于每个车辆模型都涉及大量的客户,并且使用基于人口的方法统计,所有的优化运行成本颇高。举例而言,在一台3 GB 4核处理器的机器上,解决4.3的方程并完成106个估值,需要48小时以上。当多个模型一起用于解决5小节中的防尘时,处理器的负担更高。由于对一个客户的CSI的评估是独立于另一个客户的,所以在不影响EA运算的情况下,可以进行并行处理。这项工作所需的所有优化运行都是在NVIDIA Tesla C1060图形处理单元上完成的,它包含30个使用CUDA架构的对称多处理器。不同客户的CSI函数的计算分配给设备中同时运行的多个线程。这能够以与客户总数成比例的系数减少计算时间。
本研究中的五种车型已从不同的细分市场中确定,如表1所示。这些模型已经在市场上经历了一段时间和调查的印证。不同于J.D. Power和Associates的美国客户满意度指数和调查,消费者报告调查基于三个方面评估顾客满意度:性能、安全性和可靠性。在本文提出的方法中,我们使用了CSI建模的服务数据,消费者报告可靠性评级,这些为评估提供了很有相关性的判据。根据2010年4月的消费者报告研究(CustomerReports),我们得到了五种车型的可靠性等级排序。
也就是说,这意味着模型5的总体顾客感知最差,其次是模型3,如是后推。模型2和4的消费者满意指数是相似的,它们在全部五种模型中具有最好的整体可靠性评级。在本节中,我们首先详细讨论了由TS{1、2、3}组成的多车型CSI建模的结果,并比较了CSI的排名。随后,我们总结了所有可能的模型组合结果,并选择了基于统计检验的最佳CSI模型。
6.1 针对TS{1、2、3}的CSI模型提供的一个说明性示例
对于TS{1、2、3}求解的GA参数,人口大小和批次分别设置为500和10,000。约束处理通过惩罚参数较少的方案来实现。通过求解5小节方程获得的模型1、2和3中最优CSI模型有:
优化后的CSI模型CSI{1,2,3}现在用于评估TS{1,2,3}中的所有客户的CSI值。图5显示了这些车型的标准化CSI分布。对TS{1、2、3}中的所有客户进行标准化处理。
正态分布曲线拟合于图5的曲线分布上,以清楚地显示各特
全文共6115字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[14207],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。