用户画像,即用户信息标注,是大数据精细化运营和精准营销服务的基础。大数据时代,用户的所有行为都可以被***和分析。用户画像是通过分析用户的基本信息、特征偏好、社交属性等维度的数据,描绘出用户信息的全貌,并从中挖掘用户的价值。可以帮助数据“起死回生”,提供个性化推荐、精准营销、个性化服务。
一、人像的基础
1.1标签类型
用户画像建模其实就是给用户“贴标签”,一般分为三类:
●统计标签:最基本最常见的标签,由用户注册数据和用户访问数据计算得出。
●规则标签:基于用户行为和规则生成,通常由更熟悉业务的运营人员和数据人员确定。
●机器学习挖掘类标签:由机器学习挖掘生成,根据用户的一些行为或熟悉程度进行预测和判断。比如根据用户购买化妆品和护肤品的次数,用户的性别是女性。
1.2数据结构
该系统的基础设施包括Spark、Hive、HBase、Airflow、Redis和Elasticsearch。下图显示了用户画像中的数据仓库架构。
①数据仓库的ETL处理流程是通过ETL过程将日常业务数据、日志数据、埋置数据等数据处理成相应的原始数据层(ODS)、数据仓库(DW)和数据集市层(DM)。
②用户画像不是数据生成的来源,而是通过对ODS层、DW层、DM层的数据进行二次建模得到的数据和用户相关的数据。在ETL过程中,将用户标签写入Hive,不同的数据对应不同的数据库应用场景,然后将数据同步到MySQL、HBase、Elasticsearch等数据库中。
Hive:存储用户标签、用户群体和用户特征库的计算结果。
MySQL:存储标签元数据,监控相关数据,将数据导出到业务系统。
HBase:存储在线实时数据
Elasticsearch:支持海量数据的实时查询和分析。
③用户标签在Hive中处理后,部分标签通过Sqoop同步到MySQL数据库,为BI报表展示提供数据,多为视角分析数据和圈子服务数据;另一部分标签同步到HBase数据库,用于在线个性化推荐产品。
1.3用户画像模块
在构建用户画像方案时,将以下八个模块作为一个整体来考虑。
用户画像主覆盖模块
●用户画像基础知识
理解并明确用户画像中包含的模块,设计数据仓库架构、开发流程、表结构、ETL设计。主要是明确规划的大方向。
●数据指示器系统
建立数据指标体系,按照业务条线进行梳理,包括用户属性、用户行为、用户消费、风险控制等维度的指标体系。
●标签数据存储
设计完数据索引系统后,再考虑不同的应用场景使用哪些存储方式。
●标签数据开发
关键模块。数据开发包括统计、规则、挖掘、流计算和人群计算的开发。
要点:数据调研,与业务方确认数据口径,标签开发投放。打通人像数据和各种业务系统之间的通路,提供接口服务。
●开发性能调整
数据开发上线后,为了缩短调度时间,保证数据稳定性,需要对标签脚本和调度脚本进行迭代重构和优化。梳理现有的与标签开发、调度、告警验证、同步到服务层等相关的脚本。,找出可以优化的地方,迭代优化。
要点:减少ETL调度时间和调度过程中的资源消耗。
●作业流调度
标签化、人群计算、数据同步和业务系统、数据监控预警脚本开发完成后,需要调度工具进行全程调度。
要点:满足固定调度、监控预警、故障重试、各调度任务家的复杂依赖等要求。
●用户画像的产品
面向产品的模块包括标签视图、用户标签查询、用户聚类、视角分析等。
重点:满足业务方对用户精准营销的需求。
●用户画像应用
应用场景包括用户特征分析、短信精准推送、站内消息和推送消息、针对不同用户的客户演讲技巧、高价值用户快速退款等高级服务应用等。
专注:帮助业务方理解和应用用户画像数据,提升用户活跃度和GMV。
1.4开发在线流程
本文来自弑魂战神投稿,不代表舒华文档立场,如若转载,请注明出处:https://www.chinashuhua.cn/24/576675.html