基于消费数据的大型百货商场会员购买力模型研究
作者:孙洪波
来源:《价值工程》2019年第18期
龙源期刊网 http://www.qikan.com.cn
龙源期刊网 http://www.qikan.com.cn
龙源期刊网 http://www.qikan.com.cn
龙源期刊网 http://www.qikan.com.cn
龙源期刊网 http://www.qikan.com.cn
龙源期刊网 http://www.qikan.com.cn
龙源期刊网 http://www.qikan.com.cn
龙源期刊网 http://www.qikan.com.cn
龙源期刊网 http://www.qikan.com.cn
龙源期刊网 http://www.qikan.com.cn
龙源期刊网 http://www.qikan.com.cn
龙源期刊网 http://www.qikan.com.cn
龙源期刊网 http://www.qikan.com.cn
龙源期刊网 http://www.qikan.com.cn
摘要:本文主要基于获取的商场会员信息数据、商场销售流水表、会员消费明细表、商品信息表,通过Oracle数据处理与分析,剔除异常数据,为后续处理做准备。通过分析商场的会员消费特征,会员与非会员消费特征的差异,有针对性的为商场管理者提供营销建议;建立了基于会员性别、入会时长、年龄和消费频次的评估会员购买力的多元线性回归模型,并对模型的每个参数进行了检验。
Abstract: This paper is mainly based on the acquired mall member information data, shopping mall sales flow meter, member consumption schedule and commodity information table. Through Oracle data processing and analysis, the abnormal data is eliminated to prepare for subsequent processing. By analyzing the characteristics of member consumption of the mall and the difference between the consumption characteristics of members and non-members, the marketing suggestions for the mall managers are proposed; the multiple linear regression model for assessing member purchasing power based on the membership gender, the length of membership, the age and the frequency of consumption are established and each parameter of the model is tested. 关键词:消费特征;会员信息;销售流水;购买力模型
Key words: consumption characteristics;member information;sales flow;purchasing power model
龙源期刊网 http://www.qikan.com.cn
中图分类号:TP311.13; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; 文献标识码:A; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; 文章编号:1006-4311(2019)18-0243-06 1; 研究背景
伴随着大数据以及人工智能的爆炸式发展,我国零售业正在从O2O阶段迈向线上线下深度融合的OMO阶段。在这样的背景下,零售企业唯有通过不断创新营销来提升品牌力和吸引客户,才能更好地迎接新商业模式的到来。
在大数据时代,通过获取的商场数据分析消费特征,并以此为基础进行会员精准营销,已经是一种很常用的会员营销手段。在会员管理营销系统中,为每个会员打上个性化标签,则成一项基础工作。比如某会员经常来店铺购买零食,则可以给该会员打上“吃货”、“零食”等标签。在零售行业中,电商的飞速发展严重冲击了零售运营商,造成商场会员的大量流失,促使大型商场通过实施营销策略重视对现有会员的针对性管理,以此维系与会员之间长久的、稳定的关系,为零售运营商带来稳定的销售额和利润。
因此,有必要通过分析零售业会员消费特征和建立会员购买力模型,为零售运营商策略的制定提供数据支持。本文以获取的某大型百货商场会员的相关信息为基础展开。 2; 研究方法
首先,依据某大型百货商场会员的相关信息,分析會员和非会员的消费特征并进行比较,以研究会员与非会员群体的差异,得出会员和非会员给商场带来的经济效益差异。其次,在分析会员购买力的影响因素的基础上,利用消费金额刻画会员的购买力,建立多元线性回归模型,并对该模型进行参数检验。
本文主要以Oracle数据处理为基础,辅以Origin进行可视化。解题过程并不需要建立复杂的数学模型。技术路线如图1所示。 3; 模型假设与准备
①假设既有数据,假定会员的购买力只与会员性别、会员消费时的年龄、会员入会的时长以及会员在商场的购买频次有关。②根据既有数据,假设会员最后一次消费记录即为会员的退出日期,否则无法评价会员何时退会。③假设会员入会时年龄小于18岁和大于80岁的数据为异常记录。
解题过程的数据准备主要是进行数据预处理,本课题的数据预处理工作主要包括:①将附件中的数据导入Oracle数据库中;②删除会员信息表中会员出生年月为空;③删除会员入会日期早于会员出生日期的记录;④删除会员入会时年龄小于18岁以及大于80岁的记录;⑤删除消费数据中销售数量为负值的记录。
龙源期刊网 http://www.qikan.com.cn
4; 商场会员消费特征分析
要分析会员的消费特征,可根据会员信息数据和会员消费明细表,以会员卡号为数据融合字段,从会员的年龄、性别、不同会员的购买力、购买频次等信息的基本统计特征入手,通过Oracle数据库统计相关信息再进行可视化。要比较会员与非会员群体的差异,可根据销售流水表和会员消费明细表,以商品编码为数据融合字段,两者做差集得出非会员消费明细,进而对两者的消费特征进行比较,以得出会员和非会员给商场带来的经济效益差异。
①首先在会员信息表中添加字段会员入会时年龄,以会员入会登记时间减去会员出生时间即可得到会员入会时的年龄。根据获取的年龄结果,剔除年龄小于18岁和大于80岁的记录,进行会员年龄分布统计以及会员性别统计。
通过图2和图3可以看出商场会员主要分布在20~30岁之间,随着年龄的增长会员数量呈现先增后长的趋势,其中会员数量分布最多的年龄段为26~30岁,该类群体大多为刚毕业不久的青年人員注重保养和养生,购买力较强,属于商场重点推销对象。
②将会员消费明细表和会员信息表通过会员卡号进行融合,统计不同年龄段、不同性别在消费金额、消费商品上的特征。
通过图4可以看出随着年龄阶段的增长,消费金额同样呈现先增后减的趋势,但通过图5比较可以明显看出,虽然20-35岁的会员数量居多,但是其消费金额并非最多的,反之,36岁-55岁的会员虽然数量并非最多,但其消费金额却占比较高,充分体现了年轻人由于经济基础相对薄弱,其购买力相对较弱,而年长者由于具有足够的社会经验和经济基础,购买了相对较强。
通过图6和图7可以看出,该商场会员中女性会员占绝大多数(80.74%),而其消费总金额占比更高,高达86.52%。男性会员数量占比19.26%,而其消费金额占比13.48%。所以女性消费者应该为该商场的重点推销对象。
③为求得会员和非会员信息的消费情况,利用消费流水表统计总消费金额为1222599720.4元,利用会员消费明细表统计会员总消费金额为1204268449.39元,两者相减即为非会员消费金额,为18331271.01元。
从图8中可以看出,商场中的销售来源绝大部分是来源于会员,其中会员为商场带来的经济效益高达98.5%,而非会员仅占1.5%,所以商场应重点发展会员。
④提取非会员消费明细表,将非会员消费明细表与商品信息表通过商品编码字段进行融合,得到含有商品名称的非会员消费明细表,再利用会员消费明细表和非会员消费明细表,提取会员和非会员在商品类别购买上的差别。
龙源期刊网 http://www.qikan.com.cn
会员和非会员在商品购买上也有较大差别,其中会员购买的商品类别有7384类商品,非会员购买的商品类别仅有249类商品,其中排名前50的商品及其销售数量如表1所示。从表1中可以清晰看出,购买商品数量排名靠前的几件商品中,非会员的主要购买特价和促销商品较多,而会员购买正价商品较多,体现出明显的消费观念差异。此外,购买商品排名情况可为商场管理者在进货、促销等方面提供建设性指导参考。
⑤通过提取会员和非会员在不同价格区间上的商品购买数量,获取不同价格区间会员和非会员在商品销售数量的差异。
从不同价格区间会员与非会员购买商品数量的分布上来看,两者变化趋势相同,都是价格在0-1000的商品购买数量最多,随着价格的升高,购买商品的数量也相对减少。该分析结果可指导商场管理者对不同价格区段的商品进行针对性的促销。
⑥利用会员消费明细表和非会员消费明细表,提取会员与非会员在一天内不同时段购买商品数量的差异,结果如图11、图12所示。
从图11和图12中可以看出,会员与非会员同样是在下午14:00-17:00期间购买商品数量较多,符合常人的购买习惯,不同的是,会员在夜间00:00-02:00有少量消费,而非会员在此期间并无任何消费,此外,会员消费开始时间较早,早09:00便开始有消费行为,而非会员此期间仍然没有消费行为。根据此分析结果,商场管理者可重点集中在下午时段进行促销活动。
⑦利用会员消费明细表和非会员消费明细表,提取会员与非会员在一年内不同季节购买商品数量的差异,结果如图13、图14所示。
从图13和图14中可以看出,会员购买商品时在一年内分布较均匀,其中1月、3月、5月、8月、11月商品购买数量相对较多。而非会员1月份和2月份春节前后购买商品数量明显增多,商场管理者可据此在春节附近针对非会员做一些对应的促销活动,此外,非会员在4月、8月、11月购买商品数量相对较多。 5; 会员购买力多元线性回归模型
要分析会员的购买力,首先应获取会员消费时的年龄、会员的入会时长以及消费频次等数据。首先将会员消费明细表和会员信息表通过会员卡号字段进行融合,然后进行统计分析。会员消费时的年龄为消费年月月出生年月之差,会员入会时长为消费年月与入会年月之差,会员消费频次为会员卡号出现的次数总和。
假设会员的购买力与会员的性别、消费时的年龄、消费时的入会时长以及消费频次有关,建立消费金额与性别、消费年龄、入会时长和消费频次的多元线性回归模型进行回归:
龙源期刊网 http://www.qikan.com.cn
其中,Y为消费金额,即会员购买力,X1为消费年龄,X2为入会时长,X3为性别,X4为消费频次,b、A、B、C、D为模型参数,利用origin进行回归后得回归方程为: 其中各个参数的标准差及统计检验结果如图15、图16、图17、图18所示。从输出结果图15中可以看出,模型拟合优度较好。从输出结果图16中可以看出,在给定的显著性水平α=0.05的情况下,回归方程显著性F检验的概率p=0远小于α,说明回归方程的线性关系非常显著。从输出结果图17中可以看出,各个参数的残差也基本分布在0值两侧。 6; 结论
①本文中的会员购买力多元线性回归模型比较简单,以面向应用为主,并不需要复杂的理论推导,有利于推广应用。
②本文所使用的主要工具为Oracle,使用简单的sql语句解决复杂的实际应用,有效避免了复杂理论模型需要大面积编程的难题,处理易于操作和修改。
③本文在分析结果的同时,分别根据结果对商场管理者提供了针对性营销建议,有利于理论研究成果的应用转化以指导实际营销运营。
④由于在刻画会员购买力模型时考虑因素不够充分,导致模型精度不高,后期可重新进行自变量的选取,采用向前选择法、向后选择法、逐步选择法等进行回归,以获取更好的预测模型。
参考文献:
[1]朱道元,等.数学建模案例精选[M].北京:科学出版社,2003.
[2]姜启源,谢金星,叶俊优.数学模型[M].四版.北京:高等教育出版社,2010. [3]Oder R R, Price C R. HGMS: Mathematical modeling of commercial practice[C]// American Institute of Physics, 1976:641-643.
[4]Rivera R, Burnaev E. Forecasting of Commercial Sales with Large Scale Gaussian Processes[C]// IEEE International Conference on Data Mining Workshops. IEEE Computer Society, 2017:625-634.
[5]King N, Bax T J. Using Grocery Store Point-ofSale Date to Correlate Consumer Purchase Habits to Nutrition Targets:, US20160133140[P]. 2016.
[6]Dorismond J. Supermarket optimization: Simulation modeling and analysis of a grocery store layout[C]// Winter Simulation Conference. IEEE, 2017:3656-3657.
龙源期刊网 http://www.qikan.com.cn
[7]Pasichnyk R, Maslyyak B, Vitsentiy V. Modeling of products sale velocity and products recommended structure on the basis of a data reduction method[C]// Intelligent Data Acquisition and Advanced Computing Systems: Technology and Applications, International Workshop on. IEEE, 2001:238-241.
[8]秦靖,劉存勇.Oracle从入门到精通[M].机械工业出版社, 2011.
[9]秦靖,刘存勇.ORACLE从入门到精通:视频实战版[M].机械工业出版社,2013. [10]王秀峰.数据分析与科学绘图软件ORIGIN详解[M].化学工业出版社,2008.
因篇幅问题不能全部显示,请点此查看更多更全内容