用户行为洞察,让推荐算法精准到爆!
更新时间:2024-11-27 10:58 浏览量:7
推荐算法”是目前比较火的个性化推荐,常用于互联网电子商务、社交媒体、在线视频和音乐服务等领域。这些算法通过分析用户的历史行为数据(如购买历史、浏览记录、评分和搜索习惯等),来预测用户可能感兴趣的产品或内容,并据此提供个性化推荐。
机器学习的一般思路“通过对一部分数据进行学习,对另外一些数据进行预测与判断”。而推荐算法是推荐系统中的核心和关键,推荐算法的选择决定了推荐场景、系统性能。
1) 个性化推荐。
例如,线上商城的“千人千面”、内容型App的信息流,push信息流等。
2) 热门推荐。
例如,视频App上的“热播”、电商网站上的“热榜”。
3) 相关推荐。
例如,线上商城的“看了又看”“买了还买”,视频App上的“相关电影”。
“Better Algorithm or More Data(更好的算法还是更多的数据)?”很多时候,能够快速改善模型性能的不是调优参数,而是纠正其使用的数据。
业界广泛流传着一句话:“数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。”
下图是推荐算法建模的简化流程。
简单来说,推荐算法建模主要包括输入、训练、输出三个阶段。
输入阶段需要采集原始数据,通过特征工程处理成可供模型训练的特征。训练阶段需要选择合适的推荐算法训练特征。输出阶段需要将用户特征灌入模型,获得用户的推荐结果。数据常被比作原材料,而推荐算法则是加工厂,原材料的质量、数量直接决定了训练结果的质量。
数据的划分一般有三种方式1) 根据产生的数据源,可以划分为用户行为、用户属性、社会网络、用户即时场景(上下文)、标的物(物品)属性5类;
2) 根据数据类型,可以划分为数值类、文本类、时间类、图片类、音视频类等。
3) 根据数据结构,可以划分为结构化数据、半结构化数据、非结构化数据等。
在推荐系统中,数据通常会根据产生的数据源来划分
1) 用户行为数据。
用户在产品上的各种操作,如搜索、浏览、收藏、评论、分享、加购物车、支付等一切操作行为。行为数据真实还原了用户的使用场景,反映了用户在该场景下的兴趣状态,分析这类数据可以获得关于用户兴趣偏好的深刻洞察。
根据用户的行为是否直接表明了用户对标的物的兴趣偏好,用户行为数据可以分为显式行为和隐式行为。显式行为是直接展示用户兴趣的行为,如评分。隐式行为则间接反映出用户的兴趣,包括浏览、点击、收藏等。
2) 用户属性数据。
用户人口统计学数据,即用户自身的属性,比如性别、年龄、学历、地域、收入等。此类数据通常稳定不变,其中只有年龄会缓慢变化。
3) 社会网络数据。
用户社会关系数据,包含社会网络数据,比如用户的家庭朋友关系,联系人,社交圈等等。此类数据在社交类产品的推荐场景中尤为重要,比如推荐好友阅读书籍、推荐好友点赞视频等。这部分数据通常需要收集用户手机信息,或者联通手机其它APP数据分析。
4) 用户即时场景(上下文)数据。
用户对标的物操作时所处的时间、空间、状态的总称。比如当前时间、当前天气、当前地理位置等,反馈了用户的决策环境。比如外卖平台会基于时间、配送地址推荐,早上8点会推荐附近的早餐、晚上8点则推荐附近的晚餐。最常见是用在PUSH即时推送上,场景化提升用户转化率。
5) 标物(物品)属性数据。
物品自身包含很多特征和属性,物品属性数据结合用户行为数据后,可以将物品的属性按照某种权重赋予用户,构建用户的兴趣偏好,也就是给用户打兴趣标签。
不难发现,用户行为数据是最重要、最容易收集、最多数量的一类数据,通过和物品属性数据结合可以构造兴趣标签,这在设计推荐系统中至关重要。
此外,随着互联网基础建设的日趋成熟,基于“T+1”(指当天利用前天之前的数据,计算用户的推荐结果,每天更新一次,或“离线计算”的推荐效率不能满足企业需求,实时推荐成为主流。
如何利用洞察数据,影响核心用户行为?一是优化基于商品标签的推荐规则,提升商品搭配度和商品相似度。
举例,当我们发现用户对水杯类商品的浏览次数大幅增加却迟迟没有下单时,就可以初步判断该用户有购买水杯类商品的需求却没有找到理想的款式。
于是,通过商品标签的推送规则,我们就可以在用户的浏览页推送款式、功能、价格等商品标签相近的水杯,以缩减用户的搜索时间,提升商品成交率。
二是优化基于用户标签的推荐规则,提升对用户偏好判断的准确性。
通过埋点数据采集用户浏览、收藏、加入购物车等用户行为数据,更准确地理解用户需求。再通过后台集成的用户标签体系,为用户推荐更加多样化的商品。
举例,一个用户有“20~25岁”“女性”“白领阶层”“单身”标签,最近购买某品牌的连衣裙。
——那么具有相似标签的用户群体,就可以初步推断她们也有很大的可能性在该时间段产生相似的需求,并基于此做出相应的推荐,以唤醒用户潜在的消费需求,提升GMV。
在推荐系统中,数据和算法同样重要。数据和特征决定了推荐系统的上限,高质量的数据和特征可以提升推荐系统的性能,而用户行为数据更是起着举足轻重的作用。
利用数据和算法进行的机器学习分类模型是应用特别广泛的模型,且应用的场景也比较广泛。
02 提升用户价值,全面提升客单价,需要对客户购物行为进行高潜预测为了实现客单价值最大化,在预测客户购买行为之前,我们需要分析三个问题:
1) 最好的客户是谁?想判断下一个阶段最有可能购买商品的客户,首先需要对这类客户进行定义。
2) 最好的客户有什么特征?进行客户价值分层,识别高价值客户的共性特征。
3) 如何获得更多的这类客户?提升销售对高价值客户的关注度,并通过用户流转地图或者会员转移矩阵,将黏性较差的低价值客户转化为中价值客户,将中价值客户培养成高价值客户,以此推动GMV的提升,实现企业业绩的提升。这是我们的最终目标。
——我们需要建立会员高潜预测模型(即高可能性到店消费),然后需要让业务人员能够理解预测模型的原理和意义。
建立高潜预测模型,会有如下三个步骤:
第一步:商业洞察驱动特征构造
利用商业洞察构建高价值客户的初始特征体系。比如,RFM模型经常被用于该步骤的特征构造,分析客户最近一次的购买时间(Recency)、购买频率(Frequency)、消费金额(Monetary)。同时还可以从其他角度出发,比如在食品行业,通常会从会员是否为储值会员、是否曾经退款、购买不同口味商品的数量、购买不同品类商品的数量、购买新品的数量等角度进行特征构造。
第二步:精准算法预测购买行为
我们有了明确的预测目标,将目标定为“预测下个季度全量会员购买的可能性”,基于历史数据,运用算法对全量会员进行综合打分。我们可以选择LR(Logistic Regression,逻辑回归)和LightGBM等分类模型进行比较,分析客户未来的购买可能性与预测变量的相关性,分析重要变量的影响权重,构建出最终的预测模型。
第三步:刻画用户画像和用户行为预测模型
在上百个特征中,AI模型能帮助我们找到20多个核心特征,进而形成消费可能性高低分群。例如,高价值会员的核心特征:曾是或者现在仍是储值会员、RFM、基础特征(性别)、品类相关、促销相关等特征。储值会员特征对未来哪些客户会到店消费的预测力最强,其次是最近购买间隔。
高价值客户核心特征表(部分)
所以在上图中建立预测模型的过程中,所需的数据有交易数据和会员数据两大类。
1)我们基于原始数据,构建出一张大宽表,其中70%的数据作为模型的训练数据集,剩余30%则作为模型的验证数据集
2)模型训练的历史数据经过编码、特征降维等数据预处理之后,植入智能算法进行训练。获得初始模型后,再将预留的30%验证数据集代入模型,检验模型的准确性和有效性,同时生成验证报告[ROC曲线(接受者操作特征曲线)]。
3)针对未来到店购买的人群,我们会使用最新的数据对会员下个季度的购买可能性进行预测打分,识别下个阶段购买可能性最高的会员。
根据特征因子与模型,结合现有的用户行为数据,我们可以对全量会员下个阶段购买的可能性进行评级与打分。这样每位会员对应一个预测概率,我们可以按照一定比例切割,进行用户价值分层。
通过数据分析,我们将0.9分以上的会员虽然只占据全体会员的20%,但覆盖了50%的GMV,那么我们可将此类会员判定为高价值人群;低于0.1分的会员可判定为低价值人群;而处于中间分值会员可判定为中价值人群
——最终以0.9分和0.1分作为切割点,我们能够对全量客户进行有效分群。
如何将数据运用到真实业务场景的用户分层中呢?
比预测模型更重要的是,理解该模型并运用到实际业务场景中,通过模型对客户进行评分然后对用户进行分层,我们就可以得到相应的用户分层组群。
用户分层0~4组对应着由高到低的购买概率,0代表购买概率最高的用户群组,4代表购买概率最低的用户群组。观察每个用户群组的特征数据可知,上次消费距今间隔越短,未来一季度到店的可能性越高,消费频次、消费金额也与未来到店概率成正相关关系。
同时,对特征因子之间的关联性进行分析,还可以洞察用户的其他特征。
例如,上次消费距今越近,购买概率越高;消费频次越高,购买概率越高;消费的品类数越多,购买概率越高等规律。
通过机器学习预测客户购买行为,能够帮助业务人员更精准地识别和定位潜在客户群体,从而进行个性化营销,将中低价值人群转化为高价值人群,为企业带来更直接的增长!
本文由 @ Sherryyyyy 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自 Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务