专本科毕业论文范文

专科、本科毕业论文范文

当前位置:首页>毕业论文范文>专本科毕业论文范文
全部 256 专本科毕业论文范文 51 MBA毕业论文范文 84 MPA毕业论文范文 56 其他毕业论文范文 65

【管理学专业】基于K-Means聚类的烟草零售客户价值分类模型研究

时间:2023-03-21   访问量:1506

摘要

客户价值分析是企业实现精准、差异化营销的重要前提,同时也是客户关系管理的重要组成。本文按照国内烟草商业企业的客户分类实际需求,从客户价值、客户交易行为等角度建立动态化的烟草终端零售客户分类指标体系。在此基础上,以某烟草商业企业为例,基于该企业的零售客户交易数据,采用K-Means聚类分析技术对其客户进行分类研究。针对K-Means聚类算法对原始数据敏感性较高的问题,提出了基于数据库操作技术的数据清洗和集成方案。最后通过多维交叉分析的方式对K-Means聚类分析的烟草零售客户分类结果进行考察验证。通过研究发现,该烟草商业企业的终端零售客户可分为12类,并能够通过其价值贡献,以及不同品类和在不同月份的烟草商品订购交易行为,实现对客户的有效分类,为烟草商业企业提高其营销决策及客户关系管理水平提供决策依据。

关键词:烟草零售客户;客户价值分析;客户分类;K-Means聚类;客户关系管理

Abstract

Customer value analysis is an important prerequisite for enterprises to achieve accurate and differentiated marketing, and it is also an important component of customer relationship management. According to the actual needs of domestic tobacco commercial enterprises' customer classification, a dynamic tobacco terminal retail customer classification index system is established from the perspectives of customer value and customer transaction behavior. On this basis, taking a tobacco commercial enterprise as an example, based on the retail customer transaction data of the enterprise, K-Means cluster analysis technology is used to classify its customers. Aiming at the high sensitivity of K-Means clustering algorithm to original data, a data cleaning and integration scheme based on database operation technology is proposed. Finally, the classification results of tobacco retail customers by K-Means cluster analysis are examined and verified by multi-dimensional cross analysis. Through research, it is found that the terminal retail customers of the tobacco commercial enterprise can be divided into 12 categories, and through their value contribution, as well as the ordering and transaction behavior of tobacco products in different categories and in different months, the effective classification of customers can be realized, which can be used for tobacco commercial enterprises. Improve its marketing decision-making and customer relationship management level to provide decision-making basis.

Keywods: Tobacco Retail Customers; Customer Value Analysis; Customer Classification; K-Means Clustering; Customer Relationship Management


一、引言

按照国家卫生健康委2021年发布的《中国吸烟危害健康报告2020》(以下简称《报告》)显示,我国的烟民数量已经超过3亿人,占全球吸烟者的31.92%。同时我国的烟草生产及消费量也长期位居世界首位,常年保持在30%以上。按照我国的烟草行业管理规范,目前主要实施的是“寓禁于征”的国家烟草专卖制度,即由国家垄断烟草的生产及经营相关活动。在此背景下,我国的烟草行业近年来得到了快速发展,已经成为国家利税收入的重要组成。2021年,我国的烟草行业总纳税额达到1.2万亿,约占我国总税收的9%左右。

但是,与此同时也要看到,随着我国改革开放的不断深入,尤其在2001年我国加入世界贸易组织之后,烟草行业一方面面临着国外烟草企业进驻国内所带来的市场竞争与压力,另一方面也需要在全球化进程中逐步融入到全球经济体系中。所以,对于国内的烟草商业企业而言,如何提高其市场竞争力、稳固市场地位,是近年来需要解决的重要问题与挑战。在这其中,引入和实行更为科学有效的管理方法和理念,提升和优化客户关系管理水平与质量,是国内烟草商业企业塑造和巩固核心竞争力的重要路径之一。

从企业发展的角度来看,客户是企业各项经营管理活动的本源,也是企业获得经济利润与社会效益的基础性资源。因此,如何发展和维护好企业与客户之间的关系,充分挖掘客户对企业发展可能带来的价值,长期以来都是国内外理论与实业界高度关注的命题,并逐步发展成为客户关系管理(Customer Relationship Management,CRM)的相关理论与方法论体系。CRM客户关系管理的核心是对客户进行准确科学的价值评价,并按照价值评价结果进行群体分类,在此基础上为企业的经营管理活动提供差异化、精准化的决策依据和策略支撑,例如提高市场营销的成效、客户满意度等。随着CRM客户关系管理理论与方法论的不断发展,以及在实业界的广泛应用,在市场经济环境下,企业的管理体系已经逐步从原来的以质量为中心向以客户为中心的方向转变。

对于烟草商业企业而言,终端零售客户是其主要的目标客户,这些分布在市场各个角落的终端零售客户组成了整个烟草营销体系的神经末梢,是烟草商业企业实现社会经济效益的重要载体。因此,如何提高和优化广大终端零售客户的关系管理水平与质量,对于烟草商业企业提高其市场竞争力而言有着重要的现实意义。近年来随着我国烟草营销市场化程度的不断提高,以及行业内的供给侧结构性改革的不断深化,发展和建设包括烟草生产企业、烟草商业企业、终端零售客户在内的“三位一体”的现代化烟草市场营销体系受到了业内的高度关注。从技术环境来看,随着分布式计算、云技术、数据挖掘等大数据技术的快速发展与应用,为我国的烟草营销体系的数字化转型与终端零售客户管理体系的优化提供了技术层面的储备,有利于烟草商业企业优化终端零售客户的关系发展与维护,以及广大终端零售客户经营理念和水平的革新与提高。

本文主要研究烟草商业企业的终端零售客户动态分类构建及应用问题,这是由于在CRM管理体系中,客户分类或者客户细分是一切管理活动的基础和前提,对于烟草商业企业发展和维护与广大终端零售客户之间的关系,实现战略协同发展,创造更大的经济和社会效益与价值,提升在自身的市场竞争力而言起到至关重要的作用。在研究中,主要通过建立烟草终端零售客户的分类模型指标体系,并利用某烟草商业企业的终端零售客户动态数据,采用数据挖掘中常用的聚类分析法进行终端零售客户的分类,从而利用客户群体的分类结果,为该烟草商业企业的烟草市场营销策略的规划、制定、实施提供决策支持和建议,并进一步提高其市场核心竞争力。

二、烟草零售客户动态分类指标体系分析与构建

(一)烟草零售客户动态分类指标体系分析

1. 现行烟草零售客户分类标准及问题

为了更好地服务和管理烟草终端零售客户,CRM客户关系管理在我国各地的烟草商业企业中受到了越来越广泛的重视和应用。其中,针对零售客户的分类是重要的管理前提和基础。以某烟草商业企业为例,目前该企业在对终端零售客户的分类中,主要以客户的经营业态、经营规模、市场特征3个方面进行客户群体划分,并按照客户所属群体的不同施以相应的客户关系管理策略和方法。

在具体的烟草终端零售客户分类标准中,经营业态是指烟草终端零售客户的商业经营模式,某烟草商业企业目标将零售客户的经营业态分为便利店、超市(包括小型、中型、大型3类)、商场(包括小型、中型、大型3类)、网吧、自助服务点、餐厅、宾馆酒店、娱乐场所等19类。经营规模主要是从烟草终端零售客户的卷烟采购数量进行划分,某烟草商业企业根据客户卷烟采购数量,按照“2:6:2”的比例将零售客户的经营规模分为“大”、“一般”、“小”3个类型。市场特征主要是指烟草终端零售客户所属市场的特点,某烟草商业企业目前主要是从卷烟消费水平及能力的角度,将其划分为农村(具体细分为经济水平较好、一般两个子类型)、城市、乡镇地区3个类型。在此基础上,又进一步按照客户所在商业环境细分为城市中心商圈、城市普通商圈、城市集中居住区、城市零散居住区、工业区、边远山区、乡镇、农村等42个子类型。

根据上述烟草终端零售客户的分类标准,某烟草商业企业在对其经营能力进行评价分析时,主要在每年年末从上述3个分类标准及客户的当年度卷烟零售情况,对客户进行粗略的分类,并对零售客户下一年度的烟草零售情况进行预测,从而合理地安排和计划企业的营销策略。然而,从实际的市场营销情况来看,目前该烟草商业企业的终端零售客户分类标准仍存在着客户分类不准确、分类指标不清晰等问题。例如,在经营业态和经营规模的分类标准中,大型商业体的经营业态下,其经营规模通常也相对较大,这就使得在客户分类中存在着相关指标概念重复的问题。同时,部分分类指标的概念界定也相对模糊或者存在交叉等,一个零售客户可能同时可被划分到多个经营业态下,例如星级宾馆酒店都拥有餐厅等。另外,即使被划分到同一个群体的不同零售客户之间也可能存在着明显的外部市场环境和条件的差异。例如,相同经营规模、经营类型下的终端零售客户可能会由于其所处的市场环境的不同,而在卷烟采购及零售过程中出现非常明显的商业行为差异等。所以,通过目前的终端零售客户分类标准得到的客户分类结果通常存在着准确性不足的问题,无法真正体现出客户的价值信息。

2. 烟草零售客户分类标准的优化

在CRM客户关系管理中,对客户进行分类的主要目标是按照分类结果施以针对性的差异化、精准化管理策略和方法,其核心是从企业的角度对客户价值的评价和分类。针对某烟草商业企业的终端零售客户分类标准中存在的问题,通过对该企业的多名客户经理进行调研,结合我国的烟草行业零售市场现状分析,认为在对烟草终端零售客户进行分类指标的构建时,应重点从其能够为烟草商业企业带来的价值角度进行构建,同时还应参考客户在不同时间、烟草商品品类采购量等行为性因素,从而实现对终端零售客户的价值衡量和定位。所以,本文在对烟草零售客户分类标准的优化过程中,主要从客户价值及其行为两个角度出发进行界定。具体而言,在对烟草终端零售客户的价值分析中主要使用目前学界最常用的RFM模型作为评价指标,RFM模型包括客户消费的间隔(Recency)、频率(Frequency)、金额(Monetary)3个维度,分析客户能够为企业带来的商业价值。由于RFM模型在国内外企业的客户价值分析中应用非常广泛,并得到了理论和实业界的高度认可,因此本文沿用这一方法。对于烟草终端零售客户的行为特征,本文主要聚焦于烟草商业企业最为关注的客户交易行为层面,利用某烟草商业企业的烟草交易业务数据库中的相关数据进行提取。

(1)客户价值分类标准

Arthur Hughes研究所提出的RFM模型是目前针对客户价值评价的最常用权威模型与方法,本文采用某烟草商业企业2021年的营销数据,并以2022年1月1日为研究时间点,将RFM模型中的消费间隔、频率与金额定义为如表1所示的形式。

表1 烟草终端零售客户价值分类指标(RFM)定义表

image.png

在表1中,RFM模型对应的分类指标名称分别定义为OLT(Order Last Time)、OTT(Order Total Times)、OTA(Order Total Amount),具体是通过烟草终端零售客户最近12个月的卷烟订购订单数量及金额作为消费频率和消费金额指标,并将客户距离当前最近的卷烟订购时间间隔天数作为消费间隔指标。

同时,本文通过对烟草行业的营销情况进行分析,由于烟草商业企业的配货周期最低以周为单位,所以对于OLT指标而言,本文将客户在同一周内的订单均视为同一时间点,以当周周一为起点计算OLT指标。

(2)客户行为分类标准

客户行为分类标准通过烟草终端零售客户在实际经营过程中的交易行为进行界定,数据源为某烟草商业企业的烟草交易业务数据库。通过对客户交易数据相关表中的属性结构进行分析,结合对某烟草商业企业营销部门的交流沟通,得到零售客户订购的烟草商品品类及订购量是烟草商业企业规划和制定营销计划时的关键要素。因此,按照烟草商业企业营销计划及实施的特点,选择的客户行为分类指标如表2所示。

表2 烟草终端零售客户行为分类指标定义表

image.png

                                        注1:i取值范围为[1,5],j取值范围为[1,12],分别表示5类烟草品类商品以及1到12月

                                        注2:1到5类烟草商品主要按其批发价格从高到低进行分类,品类编号越高,批发价格也越高

在表2中,本文选择过去一年作为终端零售客户行为的分类周期,原因是通过对终端零售客户订购数据的分析后发现,以年为单位作为分析周期一方面能够很好地将客户经营的相关影响因素进行全面考虑,另一方面其数据分析复杂度相对适中。另一个需要考虑的问题是指标SKiA(Smoke Kind i Amount)和OMjA(Order Month j Amount)的数据选择,可选的数据包括了烟草商品订购数量(条)和订购金额两类。但是直观地可以看到二者之间存在一定的相关性,通过SPSS对其相关性进行分析可以印证上述观点,其中SKiA在分别取订购数量和订购金额时,其相关矩阵如表3所示。

表3 各品类烟草商品订购数量与金额的相关矩阵表

image.png

按表3所示,SKiA在分别取订购数量和订购金额时,同一品类的烟草商品订购数量及金额之间的相关系数分别达到0.795、0.862、0.797、0.841和0.942,表明其之间存在多重共线性的关系,选择任一类型数据均可实现对烟草终端零售客户的行为分类。通过对烟草商业企业市场营销工作的相关情况分析,结合对某烟草商业企业营销部门的调研情况,得到客户的订购数量对于烟草商业企业的市场营销规划与实施影响更为突出,因此在本文中将SKiA和OMjA分别定义为客户在过去一年中订购的5个品类烟草商品的数量,以及1到12月订购的烟草商品数量。

(二)烟草零售客户动态分类指标体系构建

通过对烟草零售客户动态分类指标体系的分析,本文主要是从客户价值、客户行为2个维度进行考虑,其中客户行为又可从烟草商品品类、各月份烟草商品的订购数量进行划分,所以可以得到本文的烟草零售客户终端分类指标体系如表4所示。

表4 烟草终端零售客户价值分类指标体系

image.png

相对于某烟草商业企业原来的终端零售客户分类标准,表4中的分类指标体系更能契合企业市场营销及客户关系管理的决策需求。同时,其中的分类指标可直接通过该企业的进行提取,并且根据终端零售客户的烟草商品订购情况,随时处于不断的变化之中,所以按照该指标体系进行分类,还能够实现动态化的效果,更能客观准确地反映出客户的价值及行为特征,并提高该烟草商业企业的营销和客户关系管理决策效率。

三、烟草零售客户动态分类模型分析与构建

(一)理论与技术基础分析

本文的烟草零售客户动态分类模型是在表4的分类指标体系基础上,基于某烟草商业企业交易相关数据表进行基础数据提取和预处理,通过聚类分析的方式对客户进行分类。因此,相关的理论与技术基础主要包括聚类分析、数据库操作技术等。

1. 聚类分析概述

聚类(Clustering)是一种常用的数据挖掘技术,聚类能够通过一定的技术手段从一个数据集中挖掘出具有实际应用价值的潜在信息或知识。具体而言,聚类是通过分析与考察数据的某些属性信息,通过相似度测定的方式,将属性相似的数据分别划分到一个或多个数据子集中。聚类通常是一种无先验知识的无监督学习过程,即大多数情况下不需要事先知晓可能得到的子集划分数量。

不同的数据属性相似度衡量标准对于聚类分析结果有着显著的影响。通常情况下,聚类是通过对数据集特征空间中的数据点之间的距离进行度量,常用的度量方法包括明可夫斯基距离、二次型距离、余弦距离、二元特征样本距离等。本文在分析中采用了SPSS中的K-Means聚类算法,其距离度量方法采用的是欧式距离,即明可夫斯基距离的一种特殊形式。假定x和y分别表示数据集中的两个数据,n表示所需度量的特征数量,即特征维数,则明可夫斯基距离度量方法可以表示为如下形式:

  image.png                                              (1)

当式(1)中的q=2时,即为欧式距离:

           image.png                                     (2)

K-Means聚类属于划分聚类算法,即对原始数据集进行类簇划分,每个类簇至少包括一个数据点,每个数据点仅被划分到一个类簇中。其他划分聚类算法还包括了Pam聚类、Clarans聚类等。除了划分聚类之外,其他常用的聚类算法还包括了基于层次、基于密度、基于网格等聚类算法。

K-Means聚类算法的基本流程包括如下步骤:

(1)确定类簇数量k,并输入原始数据集image.png,其数据点数量为n;

(2)根据参数k,在image.png中随机选择k个数据点作为类簇中心数据点,定义为image.png

(3)利用式(2)对D中的n个数据点分别计算其与image.png之间的距离,其中image.png,并将其标记为属于距离最小的类簇j;

(4)D中的n个数据点均处理完成之后,将各个类簇的中心点更新为属于该类簇的所有数据点的均值;

(5)重复步骤(3)和(4),直到达到退出条件,则得到的类簇即为聚类结果。

在上述步骤中,退出条件通常包括了各类簇中心点达到稳态、迭代次数达到预期最大值、最小平方误差MSE达到预期标准等。从K-Means聚类算法的流程可以看到,其处理过程相对简单,且执行效率相对较高,算法复杂度为image.png。但是同时也可以看到,K-Means聚类之前需要确定 值,这就需要一定的先验知识。另外,K-Means聚类算法还易限于局部最优或者无法收敛,即对数据噪声及孤立数据点相对与其他非划分类聚类算法更为敏感。所以为了提高聚类效率与成功率,本文的烟草零售客户动态分类模型中针对零售客户交易数据中的噪声数据和孤立点数据进行了清洗处理。

2. 数据库操作技术

在本文的烟草零售客户分类模型中主要以某烟草商业企业数据库中与客户交易相关的数据表,例如定义了客户信息、烟草商品订购单等。由于其中的订购单数据量较大,因此在模型中涉及到大量的数据库操作,其中的主要技术是数据库SQL(Structured Query Language)结构化查询语言技术。SQL是目前大多数商业数据库均支持的一种标准化的数据库操作语言,可以实现对逻辑数据库、数据表及其中的元组进行查询、添加、删除、修改、合并等各类操作功能。

本文按照表4中的分类指标体系创建用于烟草终端零售客户分类的数据表,在此基础上从某烟草商业企业数据库中的多个数据表中检索和提取相关数据,将其保存到新的数据表中,其中主要涉及到SQL中的SELECT(检索)、CREATE TABLE(创建表)、INSERT(插入)等基本操作指令,以及数据合并过程中的JOIN指令等。

(二)模型的逻辑流程分析

按照烟草终端零售客户的分类应用需求,以及K-Means聚类算法的基本原理,本文的分类模型逻辑流程如图1所示。

image.png

图1 烟草终端零售客户分类模型逻辑处理流程

在图1中,基础数据采集、数据清理、数据集成3个步骤属于数据的预处理过程:

(1)基础数据采集

通过SQL中的SELECT指令对烟草订购业务相关数据表中的客户数据、烟草订购单数据等进行跨表检索,并创建新的用于客户分类的自定义数据表,将检所得到的基础数据通过INSERT指令保存到自定义数据表中。其中自定义数据表的结构定义按照表4中的分类指标体系进行结构与属性定义,数量共计21个,包括了RFM模型中的3个指标、5类烟草商品品类订购数量、各月份的烟草商品订购数量,以及客户的ID标记等。

(2)数据清理

针对数据采集结果中的空值、异常值等进行补全、剔除等清理操作,例如由于烟草终端零售客户退货而导致的订购数量为负值的情况等,需要根据实际场合按照其现实意义进行处理,或者将存在空值的交易数据进行剔除等。

(3)数据集成

在完成了数据清理之后,由于在实际中存在部分终端零售客户已经停止零售服务的情况,其具体表现通常包括订购数量偏少、长期未能继续订购等。因此,在数据清理完成后还需通过订购次数、最后订购时间等属性的分析,将已停止零售服务的客户进行剔除。经过上述处理之后,即可得到用于聚类分析的烟草终端零售客户的有效交易数据。

本文的烟草终端零售客户动态分类模型采用SPSS中的K-Means聚类功能实现聚类算法功能,在具体聚类过程中,本文主要基于表4中的分类指标体系,按照RFM模型、客户价值、客户交易行为3个维度分别进行聚类。在此基础上利用聚类分析结果构建对应的三维数据模型。最后,通过多维交叉分析的方式最终得到烟草终端零售客户的分类结果集合。通过上述聚类处理模型,能够从多个维度对终端零售客户进行综合分析和评价,同时聚类过程分别从各个维度进行处理,得到的聚类结果对于某烟草商业企业的营销规划和实施工作也更具参考价值和决策辅助作用。

四、烟草零售客户动态分类模型的应用

按照图1中的烟草终端零售客户分类模型的逻辑处理流程,利用某烟草商业企业的烟草商品订购交易数据进行客户分类应用研究,包括了数据预处理、聚类处理、多维交叉分析等步骤和环节。

(一)数据预处理

本文的烟草终端零售客户动态分类模型主要使用了某烟草商业企业烟草商品交易数据库中的客户信息表(JY_Client_Info)和烟草商品订购单信息表(JY_Client_Smoke_Order_Info)两个数据表。在JY_Client_Info信息表中定义了终端零售客户的店铺ID编号、名称、地址、经营级别、市场类型、业态类型、营业规模以及结算方式等客户基本信息;在JY_Client_Smoke_Order_Info信息表中定义了终端零售客户的烟草商品订购数据,包括客户ID、订购日期、订单抬头信息、烟草商品信息(包括所属品类级别)、订购数量信息、价格信息、总金额等。在数据采集过程中,首先通过如下SQL指令进行烟草商品订购信息及关联客户信息的检索,并将其插入到自定义数据表中,其名称为Client_Order_Temp_Info:

        SELECT * INTO *.dbo.JY.Client_Order_Temp_Info FROM

        JY_Client_Info

        WHERE JY_Client_Info.Client_Shop_Id IN (

        SELECT DISTINCT Client_Shop_Id FROM JY_Client_Smoke_Order_Info)

通过上述SQL指令可以将所有存在烟草商品订购行为的客户数据进行提取,并将其插入到自定义的Client_Order_Temp_Info数据表中。随后,按照Client_Order_Temp_Info信息表的结构定义,通过SQL指令中的SUM、MAX、COUNT等运算函数,利用上一步中得到的数据插入结果,分别计算表4中的20个烟草终端零售客户价值分类指标,包括客户价值(RFM)、客户行为,并将计算结果更新到自定义的Client_Order_Temp_Info数据表中。在完成上述处理之后,按照图1中的模型处理流程,还需针对其中的已停止零售服务的客户信息、空值和异常值情况进行清洗和集成处理。在具体处理中,通过SPSS中的直方图功能,对上述数据处理结果中的终端零售客户烟草商品订购次数、最后一次订购日期与订单总金额进行运算,得到如图2所示的结果。

image.png  

图2 终端零售客户烟草商品订购次数、最后一次订购日期与总金额直方图

图2中的Order_Total_Amount表示客户的烟草商品订购总金额,Order_Last_Times和Order_Last_time_Day分别表示客户的烟草商品订购次数、最后一次订购日期。从图2中可以看到,在经过数据采集得到的烟草终端零售客户烟草商品订购单数据中,存在着一定比例的超过半年未进行订购的客户。根据某烟草商业企业的烟草专卖规章制度,当地的烟草终端零售客户的订烟周期通常为一周,如果超过半年未发生订购行为,则终端零售客户的烟草零售资质会被强制注销。因此,在数据清洗及集成时,将此类客户的交易数据进行剔除,不纳入聚类分析过程。

通过上述数据预处理操作之后,最终得到用于后续的烟草终端零售客户分类处理的客户数量共计13408个。

(二)聚类处理

在聚类分析中,利用SPSS分别从客户价值(RFM模型)和客户交易行为两个维度(包括5类烟草商品订购数量、1到12月份烟草商品订购数量)进行聚类,以实现对客户的动态分类。

1. 基于客户价值(RFM模型)的聚类分析结果

将表4中的OLT、OTT、OTA作为输入参数进行聚类,得到表5所示的结果:

表5 基于客户价值(RFM模型)的聚类分析结果

image.png

根据表5,在基于客户价值(RFM)的聚类分析中,将烟草终端零售客户划分为4个类簇,客户数量分别为9个、1206个、241个、11952个。其中第1类和第3类客户的订购单数量相对较多,且单次订购的平均金额也相对较高,属于高价值客户。第2类客户的交易数量和单次交易金额中等,第4类客户表现最差。从实际情况来看,某烟草商业企业目前的终端零售客户中大多数属于经营规模相对较小的便利店、小型超市等,烟草零售额及单次订购金额都相对较小,上述聚类分析结果与实际情况比较相符。

2. 基于客户交易行为的聚类分析结果

采用类似的方法将表4中的SK1A、SK2A、SK3A、SK4A、SK5A作为输入参数,利用SPSS进行聚类处理,得到的结果如表6所示。

表6 基于5类烟草商品品类订购数量的聚类分析结果

image.png

在表6的基础上,从5类烟草商品品类的角度进行统计,得到不同品类烟草商品的订购数量分布情况如表7所示。

表7 5类烟草商品品类订购数量及占比情况统计结果

image.png   

根据表7可以看到,第3品类的烟草商品最受市场欢迎,订购量的总占比将近6成,其次是第1品类和第2品类,但与第3品类相比差距非常明显。第5品类最不受市场欢迎,其是占比只有1.49%。所以从这个意义而言,应加大第3品类烟草商品的市场推出力度。进一步结合表6的聚类分析结果,可以得到在5个类簇中,客户主要零售的烟草商品均为第3品类,这与表7的统计结果相符。同时,第4和第5类簇中的客户订购占比最高,均达到3成以上,第3类簇中的客户订购占比最低,仅为3.87%。

采用类似的方法将表4中的OM1A、OM2A、OM3A、OM4A、OM5A、OM6A、OM7A、OM8A、OM9A、OM10A、OM11A、OM12A作为输入参数,利用SPSS进行聚类处理,得到的结果如表8所示。

表8 基于客户各月份的烟草商品订购数量的聚类分析结果

image.png

在表8的基础上,进一步对各月份的烟草商品订购数量进行统计,得到表9所示的结果。

表9 各月份烟草商品订购数量及占比情况统计结果

image.png

根据表9所示,不同月份的烟草终端零售客户的订购数量存在较大波动,其中订购量较大的月份在1月,总占比达到了16.02%。而3月到10月份的订购量波动不大,基本保持在10%上下波动,2月和11月、12月的订购量相对偏低,尤其在12月份,其订购量仅占到总订购量的3.53%。因此,对于某烟草商业企业而言可以加大在1月份的烟草出货规模。结合表8中的聚类分析结果可以看到,第2类客户的数量虽然较少,但是其总订购量占比却达到6成以上,客户数量最多的第3类客户的订购量总占比却只有2.01%。第4类和第1类客户群体的订购量处于中等水平。

(三)多维交叉分析

基于聚类处理的结果,对某烟草商业企业的13408个终端零售客户进行类簇划分,理论上可以得到80个(4×5×4)分类结果。然而结合实际的数据数据进行多维交叉分析后可以得到其中大多数类簇并不具有实际应用意义,最终得到的客户分类结果共计14类,如表10所示。

表10  多维交叉分析结果

image.png

表10中的RFM、SMOKE_KIND、ORDER_MONTH分别表示表5、表6和表8中的3个聚类分析结果中的客户群体划分编号。从表10中可以看到,最终得到的11类客户群体的烟草商品订购特征如下:

1. 第1类:此类客户的平均订购金额、总订购金额、1类和3类烟草商品订购数量、1月份的订购数量均非常高,数量仅有3个;

2. 第2类:与第1类客户的交易行为较为类似,但是1类烟草订购比例相对更低,但3类烟草商品订购比例明显提高,数量仅为7个;

3. 第3类:此类客户的烟草商品订购数量相对较低,但是1类烟草商品订购比例非常高,同时1月份的订购数量明显较高,数量仅有49个;

4. 第4类:与第3类客户的烟草订购行为特征较为类似,但1月份订购量相对偏低,数量为472个;

5. 第5类:此类客户的烟草商品订购主要集中在第3类烟草商品中,但商品总购量相对偏低,数量为167个;

6. 第6类:与第5类客户的烟草订购行为特征较为类似,但商品总购量有了明显提高,数量为94个;

7. 第7类:此类客户的烟草商品订购量明显较大,且主要集中在第1类和第3类烟草商品上,数量仅有17个;

8. 第8类:与第7类客户的烟草订购行为特征较为类似,但商品总购量明显偏低,在商品订购类型分布及金额方面基本相同,数量为153个;

9. 第9类:此类客户的烟草商品订购金额、订购数量等相对较低,在总订购量中的占比也比较小,单对第1类和第3类烟草商品的需求量相对较高,数量为3011个;

10. 第10类:与第9类客户相比,其订购数量及金额明显提高,但在总购量中的占比同样非常小,数量为658个;

11. 第11类:与第9类客户相比,其订购数量及金额明显下降,同样在总购量中的占比非常小,数量为4069个;

12. 第12类:此类客户的烟草商品订购金额、订购数量、在总订购量中的占比非常低,对烟草商品的需求级别也相对较低,数量为2536个;

13. 第13类:与第9类客户的烟草商品订购行为特征比较类似,但在总订购量中的占比明显降低,同时对于第1类和第3类烟草商品的需求量也明显增加,数量为1477个;

14. 第14类:与第13类客户的烟草商品订购行为特征比较类似,但在总订购量中的占比明显提高,同时对于第1类和第3类烟草商品的需求量也明显增加,数量为695个。

(四)分类结果分析

K-Means聚类算法对于数据集中的异常数据点非常敏感,容易导致在聚类运算过程中陷入局部最优解。针对这一问题,根据表10中的烟草终端零售客户分类结果,对其中的客户数量明显偏少的群体进行特征分析和验证,进而得到更为准确可靠的客户动态分类结果。本文将占比在1%以下的聚类结果视为异常群体,从表10中可以看到主要包括了第1、2、3、6、7类客户群体:

1. 第1类:该类客户数量仅有3个,且通过对其烟草商品订购数据进行检索和分析,得到其订购特征十分明显,3个客户在2021年的全年订购金额平均值达到7934.28万元,明显高于其它客户群体,达到某烟草商业企业所有烟草终端零售客户平均值的28.4倍。进一步分析此类客户的5类烟草商品订购数量可以发现,其订购的烟草商品中,第1类的高价烟草商品占比均值达到70%左右,其次是第3类烟草商品,占比均值为18.2%。从月份上来看,此类客户在1月份的订购数量和订购金额占比均值达到40%左右,与其他群体的客户有着非常明显的差异。

2. 第2类:该类客户的数量仅有7个,在2021年的全年订购金额均值达到11649.98万元,是平均值的41.7倍。在烟草商品品类订购方面,此类客户的第1类高价烟草商品占比均值为53.8%,第3类为39.4%。从月份上来看,此类客户在1、6、9月份的订购量最大,均达到了20%以上,同样与其他客户群体差异十分明显。

3. 第3类:该类客户的数量为49个,在2021年的全年订购金额均值为4532.57万元,同时第1类高价烟草商品的订购量总占比的平均值达到了80.3%。从月份上来看,此类客户的订购高峰期主要集中在1月份,其订购数量和订购金额占比均值达到64.8%,同样与其他客户群体差异十分明显。

4. 第6类:该类客户的数量为94个,在2021年的全年订购金额均值达到2033.57万元,同样明显高于平均值。在烟草商品订购品类方面,第3类中档烟草商品的订购单占比均超过了70%,但是在月份分布方面的特征不是特别明显。

5. 第7类:该类客户的数量仅有17个,在2021年的全年订购金额均值达到9448.62万元,同时对于第1类高价烟草商品的订购需求量十分大,订购占比均值达到70%左右,同时订购量也明显高于其它客户群体,但是在月份分布方面的特征同样不是特别明显。

基于上述分析可以看到,基于RFM模型的客户价值聚类分析对于第1、2、7类客户的分类效果相对较差同样基于各月份的烟草商品订购行为的聚类对于第6和第7类客户的分类效果也相对不合理,,而基于烟草商品品类的聚类分析结果相对较为合理。针对上述烟草终端零售客户的分类结果,某烟草商业企业可以针对数量占比明显偏低,但订购数量和订购金额相对较高的特殊客户群体分配专门的客户经理,为其提供个性化的订购服务,以满足其相对特殊的订购需求。对于其他客户数量相对较大群体,则可以按照其订购金额和数量的高低,以及交易行为特征,适当调整企业的烟草商品营销策略,从总体层面提高企业的烟草商品营销质量和整体经济效益。

五、结论

本文通过对某烟草商业企业2021年的终端零售客户交易数据进行整理统计,并通过K-Means聚类算法对其进行客户动态分类,得到基于RFM模型能够在很大程度上实现对客户价值的有效分类,从而能够按照其对烟草商业企业的经济贡献程度将其划分到不同价值水平的客户群体中。但是,却无法对终端零售客户的交易行为进行有效的分类。所以,本文通过将基于RFM模型的聚类分析和按照烟草商品品类订购、各月份的订购交易行为数据的聚类分析进行融合,从客户价值和客户交易行为两个方面进行聚类分析,从而能够有效地实现对烟草终端客户的分类。同时,本文的烟草零售客户分类模型是基于过去一年的烟草商品订购数据进行聚类分析,因此其分类效果还具有一定的动态性,对于国内烟草商业企业的市场营销管理及客户关系管理水平的提升具有积极的参考价值,


参考文献

    [1]李晓萍.K-means算法对综合商场客户价值分类的研究[J].电子技术与软件工程,2021(24):122-124.

    [2]刘潇,王效俐.基于k-means和邻域粗糙集的航空客户价值分类研究[J].运筹与管理,2021,30(03):104-111.

    [3]贾晓康.浅谈新形势下卷烟零售终端转型升级路径[J].商业文化,2021(03):26-27.

    [4]陈巧玲,叶周良,陈海勇.客户价值模型在烟草行业的研究与应用[J].中国新通信,2020,22(17):119-121.

    [5]黄飞杰,郎旭明,尹健康,张卫东,唐靖.聚类集成算法在客户细分模型中的应用[J].西南科技大学学报,2020,35(01):75-80.

    [6]闫磊,刘旭,徐斌.基于客户价值的卷烟零售客户分类研究与应用[J].价值工程,2019,38(25):89-90.

    [7]饶敏.烟草行业零售客户职业化体系及其构建[J].企业改革与管理,2018(24):211-212+214.

    [8]车学军.新常态下县级烟草公司与零售客户伙伴关系构建研究[J].知识经济,2015(21):34-35.DOI:10.15880/j.cnki.zsjj.2015.21.026.

    [9]全志.烟草零售客户档案动态分类信息化研究[J].信息通信,2013(05):127-128.

    [10]高径,宋涵,孟宏利.影响烟草零售户满意度服务因素研究[J].网络财富,2010(05):44-46.

    [11]Brady Lund,Jinxuan Ma. A review of cluster analysis techniques and their uses in library and information science research: k-means and k-medoids clustering[J]. Performance Measurement and Metrics,2021,22(3).

    [12]Duy-Tai Dinh,Van-Nam Huynh. k -PbC: an improved cluster center initialization for categorical data clustering[J]. Applied Intelligence,2020,50(prepublish).


声明:本站毕业论文范文资源均由鼎诚文创收集于互联网,如有侵权,请联系删除!

上一篇:【法学专业】疫情防控与公民权利保障立法研究

下一篇:【项目管理专业】市政道路路面摊铺碾压施工技术分析

在线咨询

点击这里给我发消息 售前咨询专员

点击这里给我发消息 售后服务专员

在线咨询

免费通话

24小时免费咨询

请输入您的联系电话,座机请加区号

免费通话

微信扫一扫

微信联系
返回顶部