资讯-淘券派

该把优惠券发送给哪些用户?一文读懂Uplift模型

编辑导语:随着互联网和人工智能的普及化,个性化营销已经渗透到了我们生活中的方方面面。而如何找到真正的营销敏感人群,将更多的预算投入到可以带来“增量”的用户上,以提升整体营销ROI,成为了后时代精细化运营的关键。uplift模型可以很好的解决这一问题,本文将介绍此模型以及其如何应用于智能营销的底层原理。

一、什么是Uplift模型?

用一个简单的例子来介绍此模型。假设我们是个电商平台,一件标价300元的商品,用户的购买率为6%。现有一批预算可以给用户发放10元的优惠券以提升用户购买率。需要给每个用户都发放优惠券吗?答案显然是否定,那么这批优惠券应该发送给平台的哪些用户呢?

此时我们脑海中有四类用户:

  • Persuadables:不发送优惠券则不买,发送优惠券则购买;
  • Sure things:不论是否发送优惠券均会购买;
  • Lost causes:不论是否发送优惠券均不会购买;
  • Sleeping Dogs:不发送优惠券会购买,发送优惠券反而不买。

左上的Persuadables(说服型)类用户被发券后产生了正向变化,从不买转化为购买,干预后购买率得以提升,此部分是我们真正想要进行触达干预的营销敏感用户

而右上的Surethings(确认型)类用户以及左下的Lostcauses(沉睡型)用户无论是否发券均不会改变其原本的购买行为,对这部分用户发送优惠券则会造成资源浪费。右下的SleepingDogs(勿扰型)用户对营销可能相对反感,干预会产生反效果,这类用户我们尽量避免打扰。

Uplift模型要解决的问题就是通过建模预测的方法精准的去对这四类用户进行分群。我们获取到的训练训练数据是不完整的,对于单个用户来说,不可能同时观测到在有干预(发券)和没有干预(不发券)两种情况下的表现,这也是因果推断中的反事实的问题。

可以从用户的角度来对平均因果效应做估计,假如我们有两组同质用户,对其中一组用户发券,另外一组不发券。之后统计这两群人在购买转化率上的差值,这个差值就可以被近似认为是可能的平均因果效应。

Uplift建模需要服从CIA条件独立假设,最简单的解决方式就是ab实验。因为样本在特征上分布较为一致,因此随机实验是Uplift Model建模过程中非常重要的前置条件。若随机实验下各个类别用户组数量性质较相似,则此Uplift模型即可较精准的预测给用户发放优惠券的收益。

首先,我们选取部分用户(小流量实验,样本量足够建模)随机分为实验组和对照组,对照组不发优惠券,实验组发放优惠券,用户最终是否购买为一个0-1变量;

然后,对整体实验数据用户购买行为进行建模;

最后,再用小流量实验训练得到模型对我们需要预测的全量用户进行条件平均处理效应估计,预测其发放优惠券所带来的增益值;

假设有N个用户,用户i在没有优惠券的购买结果为Yi(0),在有优惠券时购买结果为Yi(1),此时发送优惠券对该用户的增益就是uplift score (i)=Yi(1)-Yi(0)。当uplift score为正值时,说明干预项对用户有正向增益作用,也就是上文所提到的Persuadables(说服型)用户。