[面试问题]
一个社交APP在第二天、第七天、第三十天分别有52%、25%、14%的新用户。
请模拟一下,如果每天新增6万用户,第30天会有多少日活?请使用Excel进行分析。
[分析思路]
第一天留存用户数(第二天)=第一天新增用户数*第二天留存率。
第二天活跃用户数=第二天新增用户数+第一天留存用户数。
第三天活跃用户数=第三天新增用户数+第二天留存用户数(第二天新增用户数*第二天留存率)+第一天留存用户数。
…
第30位活跃用户=第30位新用户+第29位留存用户+第28位留存用户+…+第一天保留的用户数
也就是说,
第30天的活跃用户数=1-29日每天的留存用户数(第1天留存用户数+第2天留存用户数+…+第29天的保留用户数)+第30天的新用户数
现在我们只需要计算1号到29号每天的留存用户数,第n天的留存用户数=第n天的新增用户数(6万)*第n天的留存率。所以现在的问题是要知道日留存率是多少。
那么,问题来了。标题的留存率只有三种(第二天、第七天、第三十天的新用户留存率分别为52%、25%、14%)。
如何根据现有留存率预测剩余天数的留存率?
很简单。用Excel 1分钟就能搞定。
1。用现有数据制作散点图
2。向散点图添加趋势线
趋势线有几种类型。应该添加哪种类型的趋势线?
一般来说,正常的滞留曲线是一条先快速下降,然后缓慢下降,最后逐渐稳定的曲线。
所以滞留曲线的形状会类似下图:最初,在震荡期快速下降;选择期开始慢慢下降;选择期是稳定期之后,留存率会进入一个相对稳定的阶段。
保留曲线的形状非常接近幂函数,所以这里我们用幂函数来拟合保留曲线。同时勾选“显示公式”和“显示R平方值”。最后得到以下曲线,函数公式y = 0.5227x^-0.385,R = 0.9997。可以看出,拟合的幂函数形状与上图中保留曲线的形状几乎相同。
扩展:
你肯定想知道这条趋势线有多可靠?
这涉及到趋势线的R平方值。r的平方值是介于0和1之间的数值。趋势线的R平方值为1或接近1时最可靠。如案例所示,R的平方值达到0.9997,可以说这条趋势线非常可靠。
为了获得最准确的预测,为数据选择最合适的趋势线非常重要。
那么,在什么情况下,我们应该选择什么样的趋势线呢?
指数型:指数型趋势线适用于速度增加越来越快的数据。
线性:线性趋势线是简单线性数据集的最佳拟合线。如果数据点组成的趋势接近直线,则数据应该接近线性。线性趋势线通常表明事件以恒定的速率增加或减少。
对数:如果数据一开始增加或减少很快,但随后很快变得稳定,那么对数趋势线就是最佳拟合曲线。
多项式:多项式趋势线是数据波动较大时使用的曲线。
幂:幂趋势线是一种适合以特定速度递增的曲线。但是,如果数据中有零或负数,则不能创建幂趋势线。
移动平均线:移动平均线趋势线用于平滑数据的轻微波动,从而更清晰地显示数据的变化趋势。(常用于股票、基金和汇率的技术分析)
3。计算第n天的留存率
拟合保留曲线后,我们可以根据拟合的函数公式(y = 0.5227x^-0.385).)计算第二天到第30天的保留率
也就是把x=1,x=2…x=30分别代入函数公式。在这里,我们可以借助Excel的幂函数找到结果。如下图所示,可以看到根据模型函数公式计算出的留存率,即模型留存率与给定留存率(黄线)几乎完全一致。
4。计算30天后的日常生活
通过以上步骤,我们得到了日留存率。接下来我们可以计算一下第30天的日活用户数。
第一天留存用户数(第二天)=第一天新增用户数*第二天留存率。
第二天活跃用户数=第二天新增用户数+第一天留存用户数。
第三天活跃用户数=第三天新增用户数+第二天留存用户数(第二天新增用户数*第二天留存率)+第一天留存用户数。
…
第30位活跃用户=第30位新用户+第29位留存用户+第28位留存用户+…+第一天保留的用户数
也就是说,
第30天的活跃用户数=1-29日每天的留存用户数(第1天留存用户数+第2天留存用户数+…+第29天的保留用户数)+第30天的新用户数
(1)下图,Excel的第一步是题目的设置,每天新增用户6万。
在下面的步骤2中计算从1号到29号每天的留存用户数,也就是第n天的新增用户数(6万)乘以第n天的留存率(F列对应的留存率)。
(3)下图第3步对这一列的值求和,就是第30天的活跃用户数=第1天到第29天每天的留存用户数+第30天新增用户数。
5。摘要
Excel中预测分析的两种方法:
1)如何预测时间序列数据?使用预测工作表
2)其他数据如何预测?先画散点图,再添加趋势线和公式。
本文来自一九九几的她投稿,不代表舒华文档立场,如若转载,请注明出处:https://www.chinashuhua.cn/24/524978.html