内容摘要:本文根据现实情况指出国内中小企业营销面对的四个基本问题,并据此提出一个基于会员制的数据挖掘系统解决方案。此方案由Logistic模型、RFM聚类分析、事件触发模型和关联规则这四种数据挖掘技术构成。在介绍其中各技术的基本原理和建模方法的同时,给出一个应用事例。通过运用会员制策略收集顾客相关资料并利用数据挖掘技术加以分析,制定具有目标指向性的营销活动,以提高企业的营销水平。 现阶段,国内广大中小型企业正面临着自身发展的瓶颈。在围绕增加销售收入所设计的营销策略中,企业倾向于把重点放在开发新客户方面,而忽略了对旧客户的维护。这种情况导致企业难以培养有忠诚度的顾客,大量流失潜在的优质客户,从而陷入对客户不断开发、不断流失的恶性循环。部分企业借鉴外国同行经验,采取会员制策略,但其数据库只收集最基本的会员资料,营销手段单一,如分发广告信息、消费打折等活动,而忽略了对会员本身的分析,如人口和心理特征、消费行为等,造成了浪费企业执行成本、不恰当的信息令顾客与企业关系恶化等后果。同样利用会员制收集信息的便利性,在北美和欧洲,基于数据挖掘技术的数据库营销已经发展日趋成熟,大小企业都先后加入到这一行列中(罗茂初等,2007)。
本文提出一套基于会员制的数据挖掘系统解决方案,通过运用相应的数据挖掘技术解决营销活动中的四个基本问题,加深企业对顾客的认识,从而有针对性地制定营销策略。 会员制信息的数据挖掘方案 (一)营销活动的四个基本问题
在为会员制定营销手段的过程中,必须回答以下四个基本问题:
一是什么是影响会员对营销手段做出回应的显著因子?如何寻找出最可能对营销手段做出回应的会员?二是企业所拥有的会员可以分为哪几类?每个种类的会员的特征有什么不同?三是哪些事件(或日子)能联系会员与企业的产品,成为营销活动开始的契机?四是会员的消费习惯和购物次序如何? 只有完整回答以上问题,企业才算得上了解自己的会员,营销手段才能做到有的放矢,切实地提高企业的营销能力。
(二)系统实现框架
为了解决上述问题,系统由四种数据挖掘技术构成。其中Logistic回归模型用于寻找影响回应率的显著因子。RFM聚类分析通过提取会员新鲜度、消费频率和消费金额三个指标值进行聚类分析,划分会员种类。而事件触发模型是企业寻找特殊营销事件开展的重要工具。关联规则挖掘通过分析会员的购物篮寻找出各商品之间潜在的关系。企业可以据此决定商品的摆设、捆绑销售策略和优惠销售策略等营销手段等。系统框架结构如图1所示。
(三)建模方法
1.Logistic回归模型。由于Logistic回归分析所建立的预测模型是根据过去的营销数据记录计算获得,因此有一定的滞后性。具体做法是:从上一次营销活动记录中选取出所有可能影响会员做出回应的变量为自变量,用会员是否回应的结果作为因变量,用0表示没有回应,1表示有回应。这样通过Logistic回归计算所得的结果是一个会员对于营销活动做出回应的概率。筛选出通过显著性检验的变量,所获得的预测模型则可用于实践。
2.RFM聚类分析。RFM具体定义:R—新鲜度,指会员最近一次交易是在多久以前。时间距离越近,企业和会员的关系就越“新鲜”。通常按天数划分最近一次交易时间。F—消费频率,指会员在一定时间间隔内和企业交易次数。时间间隔一般取半年或一年。M—消费金额,指会员每次平均消费金额。
RFM的指标各项数据通过营销记录表定期(如每半年)自动生成。然后应用于聚类分析。此处选择K-Mean clustering,即直接聚类,该聚类分析算法如下(辛爱莉、衣龙海、张林,2008):
设要把数据库中所有会员分为K组。
第一步为任意选择K位成员,以他们指标下的各项数据作为每一组的中心;第二步为计算其他成员指标下的各项数据与每个组的中心的合成距离。合成距离的计算取几何距离公式:,一个会员离Ki组的中心越近,他就属于该组。第三步为将所有成员根据距离分配到各个组后,重新计算各组的中心。方法为取每个组所有成员的特征平均值。重复第二步。重复第三步。
循环以上步骤,一直到计算出的中心与上一次计算的中心完全相等,则循环结束。所获得的结果就是最后分类,每组的中心代表这个组的特点。 3.事件触发模型。该模型主要作用是增进会员对企业的感情和提醒会员于特殊时间购买本企业相关产品。
事件分成两类:常规事件和突发事件。常规事件包括会员生日和有营销机会的节日。突发事件是指事前无法预料的,能为企业进行营销所用的特殊事件。
部分参考节日:元旦,农历新年,情人节,三八妇女节,清明节,劳动节,儿童节,端午节,父亲节,母亲节,七夕,中秋节,国庆,重阳,冬至,圣诞节等。
部分参考事件:开学,企业新品推荐,运动会或重大比赛,商业演出,募捐活动等。
实施方法:为根据RFM聚类分析所划分的会员群设计各自对应的宣传文案和营销策略,在事件发生的倒数第三日通过电子邮件发送,倒数第二日通过手机短信发送,以确保有效到达率。适当环境可考虑使用直邮。统计回应记录及会员的反馈意见。事后分析,作为本次营销活动的总结和下次策划的参考。
此外,特定行业应针对其顾客的消费和行为的规律事先制订相应的触发模型。
4.关联规则。在关联规则的挖掘算法中,以Agrawal等人提出的Apriori算法最具有影响力和最为常用。Apriori算法利用了频繁项集的基本原理:若项集X是频繁项集,则X的任意子集也必定是频繁项集;反之,若X有一子集不是频繁项集,则X也必然不是频繁项集。
设产品集C={Cj,j=1,2,……,n},每次交易事件Ti=i1C1+i2C2+……+inCn,其中ij取值为0或1。此处的加号是和的意思,并非直接相加。 交易集为U={Ti|i=1,2,……,m},所以可抽象出矩阵:
设support(Cj)=/m,若support(Cj)≥min_support_1,将Cj加入到集合Z中。重复上述步骤,直到Z包含所有符合条件的Cj。假设共有k个符合条件,重新编号为D1,D2……Dk。其对应的ij亦同时跟随变化。两两交叉组合,共计k(k-1)/2个。
设support(DpDq)=ipiq/m,若support(DpDq)min_support_2,令Mpq=DpDq,输出到关联候选集A和集合Z中。 重复上述步骤,直到Z包含所有符合条件的Mpq,并删除集合中所有的Cj。把Z内的项两两交叉组合,并循环以上方法,直到集合Z为空集。
此时开始用置信度排除出重要的关联规则:由A,B两个项生成的关联规则有两个:A→B和B→A ;由A,B和C三个项生成的关联规则有三个:A,B→C;B,C→A和C,A→B。如此类推,N个项可以生成N个关联规则。当检验只有两个项DpDq的关联规则时,设confidence(Dp→Dq)=iqip/iq,confidence(Dq→Dp)=iqip/ip,若confidence()≥min_confidence,则把该关联规则输出,否则删除。
为简化计,可把min_support和min_confidence先设定为一固定值。特殊情况下再作调整。同理检验由更多项生成的关联规则。其中confidence(A→B)=P(AB)/P(B),此时A为由一个以上的单项组成的复合项目,B依然为单项。
若需要进行多层关联规则分析,只需扩充C集,其他仍然按以上步骤分析。多层关联规则(孙景、李峰,2008)有助于发掘出特定商品与品类之间的潜在关系。 应用示例 设某运动用品店收集到26位会员的消费记录。其中性别是1代表男性,0代表女性的虚拟变量,回应项中1代表有回应,0代表没有回应。现抽取性别、新鲜度、消费频率和消费金额作Logistic回归,结果如表1所示。
由表1可知,消费频率是影响会员是否做出回应的重要因子,消费频率越高,回应的可能性越大。因此,应该按此思路设计营销手段,争取顾客多次回头,如积分升级计划,每周(月)的优惠活动等,务求通过增加顾客的消费频率提高销售收入。
提取新鲜度、消费频率和消费金额三个变量项作直接聚类分析,在置信度为90%的条件下,获得表2。
以消费频率和消费金额为主要划分标准,把26位会员分成普通组和重点组。普通组成员的特征是消费频率较低,消费金额较小,因此营销的主要目的是增加此组人群对企业的好感以及依赖,培养忠诚度,使其转为重点组成员;重点组成员的特征是消费频率较高,消费金额是普通组的2倍以上。因此,提供最优质的服务与适当的让利优惠是维系此组成员必不可少的手段。 会员生日、学生假期、重大比赛或者明星活动是有利于运动店启动事件营销的契机。
产品集={球服,篮球,球袜,纪念品,其他装备},又收集到如下的会员交易集
U=T 根据前部分的计算公式,假设min_Support_1=30%,则A={(球服,篮球),(球服,球袜),(球服,纪念品),(篮球,其他装备)},同时生成Z={(球服,篮球,球袜),(球服,篮球,其他装备),(球服,篮球,纪念品),(球服,球袜,纪念品)}。继续计算,假设min_Support_2=20%,则(球服,球袜,纪念品)加入到A集中。此时A={(球服,篮球),(球服,球袜),(球服,纪念品),(篮球,其他装备),(球服,球袜,纪念品)}。
通过置信度筛选出强关联规则。假设min_Confidence_1=60%,保留(球服→球袜),(球服→纪念品),(篮球→其他装备),(其他装备→篮球)为强关联规则。综上所述,我们发现了六个可供使用的强关联规则:A={(球服→球袜),(球服→纪念品),(篮球→其他装备),(其他装备→篮球),(球服,球袜→纪念品),(球服,纪念品→球袜)}。
针对这些关联规则,可以设计如下营销手段:球服摆放于显眼处,球袜摆放在其相近位置,并且可用优惠价购买球服与相对应的球袜;开发对应球服的纪念品,如运动手表、背包、水壶及相应队伍的明星人物模型等;篮球与其他装备打包搭配销售。 讨论与结语 针对各个企业的特殊性,在本解决方案基础上应相应增加原始数据库的资料,以确保企业可以掌握足够多的信息进行数据挖掘。同时要及时做事后测评和总结,不断累积应用数据挖掘技术的经验。此外,必须结合过往经营活动的经验,以筛选不合理的挖掘结果。最后,在企业有一定条件时,应该增加本系统的挖掘功能,通过建立更多不同种类的数学模型来更深入了解顾客群的情况。
本文从现实的可行性出发,提出了一套基于会员制的数据挖掘系统解决方案,希望能有助于中小企业合理地运用会员制进行数据挖掘。本方案以四种数据挖掘技术为核心,通过对四个基本问题的解答获取有效的数据挖掘信息,设计有针对性的营销手段,从而切实地提升企业的营销水平。 参考文献: 1.罗茂初等.数据库营销[M].经济管理出版社,2007 2.辛爱莉,衣龙海,张林.聚类算法在电子商务客户细分中的应用[J].商场现代化,2008(530) 3.AGRAWAL R,IMIELINSKI T,SWAMI A.Mining Association Rules between Sets of Items in Large Databases[M].Washington DC:Proc.ACMSIGMOD Int.Conf.,1993 4.孙景,李峰.银行企业客户交易中的行业关联分析[J].上海金融,2008(1) 注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文
|