今天给大家分享的项目作品是来自参与用户凤城的作品,主题是基于人、货、市场的电商平台数据分析。分析思路非常清晰,可视化报表部分做得很好,对数据分析新手很有学习价值。
风景介绍
业务背景:小峰是一名新入职的BI工程师。试用期,导师给了小峰一份电商数据,让他给出一个合理的分析结果。
分析目的:小峰通过分析两年内电商平台的销售和发展情况,找出平台发展的相应结论,并给出相应的改进建议。
分析工具:FineBI
分析思维
首先我们明确本次分析的目的是对电商平台相关数据进行分析,发现问题并给出相关建议,决定从传统的人、货、市场角度进行分析。
领域维度
我们分析平台销售的健康和分布。可以得出平台销售额的分布特征和增长趋势。
然后通过对商品的分析,了解平台、品类销量、产品价格在哪里,从而优化ABC分类,了解平台产品的定位。同时我们也知道产品体验需要通过评分来优化,尝试定位产品评价低的原因。
然后通过对会员的分析,了解到会员的增长趋势和分布情况,发现大量会员也分布在巴西沿海。同时,我们还通过AARRR模型和RFM模型了解了会员的转化率和消费属性,确定了重要价值客户的比例和地域分布。客户的分层有利于精准营销。
同时,通过对会员订单的分析,可以了解会员的消费时间、消费方式、平均支付时间。同时,通过会员的评分,可以知道会员的潜在诉求。
其他分析——物流分析,最后分析了平台的物流情况,发现物流不及时的比例很高,物流时间过长,但同时物流成本占订单成本的比例很高,人的消费和接受的服务不成正比。同时,通过低评价与物流时间的不及时比例验证了这一猜测,确定低评价现象与物流服务有关。
最后,基于以上结论和现象,提出了一些改进建议。
整体分析脑图如下:
数据整理
基础数据表有以下九种,如下图所示。AAARR模型表,巴西各州辅助表,表关系和区域经纬度表是我通过其他渠道获得的辅助数据表。
主要的自助数据集宽表有:订单核心各维度的聚合宽表和RFM模型表。
数据整理过程:
第一步:获取:登录kaggle,下载公共数据集。你需要**去开一个kaggle账户。(想去Kaggle参加比赛的朋友可以找我要爬墙工具)
第二步:清洗:为了保证源数据的准确性,对上述9个EXCEL基础数据进行重复数据删除和异常值处理(如数据重复检查、前后时间值、金额正负等。),由EXCEL配合相应的函数完成。因为比较简单,这里不做过多描述。
第三步:导入到FineBI,为每个EXCEL表创建一个张宽表作为维度表,方便操作。(方便添加字段或维护单个表格),为后续制作大而宽的表格奠定了数据基础。
第四步:制作主宽表(1)在订单核心的各个维度上聚合宽表。
a、以Olist_order_dataset为核心表,链接所有维度表,创建订单核心中每个维度的聚合宽表。表之间的血缘关系如下。
b、选择订单核心表,通过左右合并依次与各个维度表合并。
c添加过滤,过滤出2017年到2018年的数据。
D.新增栏目是否通过物流预计到达时间和实际准时到达时间的对比?
E.添加新老成员。
F.订单核心的每个维度的聚合宽度表已经创建,其雪花模型如下所示。
第四步(2):制作主宽表(2) RFM模型表
A.首先,获取由订单核心的每个维度聚合的广义表所对应的字段。
b、新增一列,消耗时间天数,然后计算平均消耗时间天数,以此判断R值。
同理,用会员消费频率计算平均会员频率,用这个比值计算F值;通过会员的消费金额,计算出会员的平均消费金额,进而计算出M值。
c、合并R、F、M,拼接R、F、M。
用IF函数定义中文的RFM
至此,相关数据处理完毕,数据整理告一段落。
完成分析报告
A.整体框架:整体排版是根据故事的叙述进行排版,具体如下:任务背景,明确目的-->“场”分析-->“货”分析-->“人”分析-->:其他分析-->总结。
B.图表选择:图表选择见本图表:
c、分析思路及相应结论
市场分析:通过季度销售趋势图和环比,以及各状态金额分布分析,了解平台销售趋势和分布,平台销售是否健康,重点销售区域。
1)发现相较2017年,2018年的销售金额和销售量呈环比上升趋势,最近两季度略微下降,趋向平稳。平台客单价在175Reals/单浮动。说明平台整体的态势还是向上发展的。2)了解到订单来源主要来自巴西沿海各州,其中圣保罗州,里约热内卢州,米纳斯吉拉斯州为订单量产出州TOP3,而反观巴西内地产出偏低,小风猜测这也许巴西经济中心集中在沿海各州有关。
货分析:
通过帕累托分析品类销售情况,散点图探究品类宽度和销售关系,再通过价格带分析,了解平台产品定位。通过评价占比了解产品满意情况,通过产品完整性分析验证猜测。
商品分析:
通过品类销售的帕累托分析,散点图探究品类宽度和销售关系,再通过价格带分析,了解平台产品的定位。通过评估比例了解产品满意度,通过分析产品完整性验证猜测。
1)发现health_beauty,watches_gifts,bed_bath_table这三个品类为该平台热卖品类,且18年销售均大于17年,呈上升趋势2)通过散点图分析,确认了宽度越宽的品类往往销售额也越高3)列出TOP10销售的产品,得到平台价格带定位在0-100 ,主要面向低端客户群体4)1-2分的低评占了评价的18%,平台服务有很大提升空间,探索其低分原因不是由产品本身不完整性导致的
人分析:
分析平台会员走势了解平台会员健康情况,通过地图分布了解会员分布情况,通过AARRR模型了解会员转化率,通过环形图了解新老会员销售情况。利用RFM模型给会员分层并确定重要价值客户分布。利用会员行为分析了解会员下单时间,付费方式和平均付款时间,还知道会员低分占比及评论时间趋向。
人的分析:分析平台会员的趋势,了解平台会员的健康状况,通过地图分布了解会员的分布,通过AARRR模型了解会员的转化率,通过环比图了解新老会员的销售情况。利用RFM模型对成员进行分层,确定重要价值客户的分布。利用对会员行为的分析,了解会员的下单时间、付费方式、平均付费时间,以及会员占比低、评论时间的趋势。
1)发现2017年至2018年会员总体呈上升趋势,但2018年第三季度呈现下滑状态。2)通过会员各州分布和城市分布发现,会员主要集中在圣保罗州,里约热内卢州,主要分布城市为sao paulo riode janeiro3)一般电商模型为AARRR模型,发现平台转化率在98%左右。4)发现重要价值客户占会员体系的17%,而重要价值客户也凭借着自己的高客单,高销量为销售额提供了主要贡献。5)会员下单主要集中在11点,16点,20点,喜欢用credit_card作为支付手段,平均付款时间在6.46小时。6)发现会员评分4-5分约占78%,总体好评居多,但1-2分也占据着13%,存在一定风险,可以适当优化,会员评论时间集中在11-12,21-23时间段。
其他分析:通过物流准时度分析,物流时间占订单时间分析,平均物流天数分析,物流运费金额在总金额的占比,来评估顾客物流服务投入产出比,通过低评的非准时占比和物流时间来验证猜测。其他分析:通过物流准时性分析、物流时间占订单时间分析、平均物流天数分析、物流运费占总金额的比例来评估客户物流服务的投入产出比,通过低估不及时比例和物流时间来验证猜测。
1)顾客对物流服务的投入产出比低下,造成较大不满2)低评确实是由物流因素引起
对应建议:相应建议:
d、整体颜色是深色调布局,浅色布局已经很难处理了。后来再试一次,统一调整字体和大小让图片看起来更整齐美观,在结论处对相应的指标做颜色识别。比如好的指标是红色,差的指标是绿色,整个优化采用局部美化,完成后整体优化的方法。
网站推荐:材质调色板:http://***.***terialpalette.com/,平板UI颜色:http://flatuicolors.com/
E.作品展(有点模糊,原图太大放不下,只能压缩,只能看了。有兴趣的可以下载PDF观看)
摘要
经验分享:带着目的去分析,一步一步按照分析框架去做,享受分析的过程。
本文来自无言温柔天然对象投稿,不代表舒华文档立场,如若转载,请注明出处:https://www.chinashuhua.cn/24/560911.html