机器学习在微博 O 系列广告中的应用(zz)

0 / 689

分享嘉宾:张克丰 新浪微博

文章整理:崔媛媛

内容来源:DataFunTalk

出品平台:DataFun

注:欢迎转载,转载请留言。

导读:

O 系列广告是当前信息流广告的主流投放方式,目标是通过对广告主 ROI 进行优化,提高平台整体收益。其核心是通过技术手段智能化的解决广告主对流量的获取。微博 O 系列广告的策略模型我们将其分为智能出价,智能定向和 ROI 模型三个主要方向。智能出价利用机器学习算法对流量智能分配和扣费智能调控,从而满足广告主和平台的利益均衡;智能定向通过深度学习等技术建立 user 和 ad 的匹配连接,满足广告主对流量的智能获取;ROI 模型利用机器学习算法对用户的点击转换进行预估 ( 常见的 ctr 和 cvr 模型 ),是智能出价中扣费和排序的基础。微博业务算法团队将深度学习技术广泛应用在微博的 O 系列广告系统中,大幅度的提升了微博的变现效率。

广告博弈

图片

商业广告系统包含三方博弈,从参与方角度主要包括:用户,广告主,媒体平台。

网民通过媒体平台获取信息,广告主通过投放系统进行商品投放,平台根据其兴趣意图给网民推荐相关的商品。平台的目标是整体经济收益,广告主的目标是获得社会效益的最大化。而广告系统是在维护网民、平台和广告主三方利益平衡的前提下,最大化平台收益。

微博广告产品形态

图片

微博广告的产品形态包括:曝光产品开机报头,信息流产品,视频故事类产品,正文页Banner,评论流广告等。微博广告业务算法部门负责这些广告投放效果上的调优和竞价策略。

广告计费形态

图片

传统的计费方式包括:CPT,CPM,CPC,CPA,CPS。

近期业界主流公司主要应用的信息流广告计费方式是 O 系列广告计费方式,包括 oCPC,oCPM:

O:代表优化目标

oCPC:优化目标是转化,但是按照点击扣费

oCPM:优化目标是转化,但是按照展现扣费

微博主要是以 CPM 和 oCPM 为主。

❹ 目标拆解:系统分析

图片

上图为广告系统的核心技术栈,它是一个漏斗模型,由定向粗排,精排,机制策略3个部分组成,每一层都有对应的优化目标。

从基础角度上来说,有三率:

展现率:show 曝光

点击率:CTR

转化率:CVR

而 CPA 是广告主的转化成本

从技术架构上来说,每个转化目标能对应到一个层级结构。定向召回对应的优化目标是展现率,在召回已经提升了总体展现之后,为了防止在下游模块被过滤掉,会跟下游模块达成目标一致的情况下最大化的优化展现率。在点击率预估、转化率预估的条件下准确的评价当次流量的价值,为流量选择最优的广告,最大化广告的转化。竞价机制是广告最后的出口,负责维护整个平台的生态,包括广告组间如何进行博弈,平台收入如何最大化,这优化的不是短期的平台收益而是一个从长期的状态下来看的平台收益。

回归效果广告的本质,优化目标是专注于对 show、ctr、cvr、cpa 的优化。

下图是广告系统的核心技术栈,下面将从广告召回,模型预估和竞价机制分别介绍下 O 系列广告的应用。

核心技术栈

图片

O 系列广告的核心技术栈包括:

数据中台:数据作为互联网最重要的资产,是算法和业务的基石。数据中台统一了微博所有的商业数据,提供了一套稳定、可扩展的读写框架。

用户理解&广告理解平台:对用户和广告的 profile,广告的内容等通过数据挖掘算法进行特征分析和概念抽取,并进行标签化。

广告召回:通过召回技术完成用户和广告的匹配。召回技术在微博平台包括 CF,语义理解,人群聚类,时序,知识图谱等。

ROI 模型优化:通过对流量上的广告效果预估,衡量出流量对该广告的价值。ROI 模型是一个价值预估模型。在微博平台包括加粉,点击,转化等多个目标。

机制策略:控制广告系统的竞价策略,扣费策略等。通过机制策略的调优,辅助广告主,用户和媒体平台三方的博弈。

两翼:广告业务和策略都需要依赖强大的工程能力,而广告引擎框架和机器学习平台能够为技术迭代插上翅膀,支撑着算法的不断迭代,驱动业务发展。

机制策略:智能出价

图片

首先在机制策略方面介绍智能出价:

微博主要为两种模型:CPM 和 oCPX 模型。

CPM 模型是比较传统的模型,其面临的问题是平台不了解客户真实目标和转化成本,导致无法有针对性的进行优化,此时 ctr 优化只能起到辅助作用。广告主需要一直盯着投放的效果,不断调价,紧盯成本,关键点是平台并没有保证广告主 ROI。

oCPX 模型,X 的意思是既可以是 C 也可以是 M 或者是 A,广告主给出期望的转化成本,平台通过系统的优化保障转化成本,广告主此时关注的是在保证转化成本的同时跑量速度如何,带来多少转化,广告主无需频繁的去调价,平台可以保证广告主 ROI。

可以看出 oCPX 比传统的 CPM、CPC 等模型增加了更多模型智能化的解决方案,所以有句话讲:CPM 靠运营和销售,oCPX 靠算法人力。

接下来介绍一下 oCPX 中重要的策略,智能出价:

图片

每个流量上进行智能出价时,系统会根据转换率计算当前流量下的广告出价,比如 CPC 会计算点击的成本,CPM 会计算这次展现的成本,oCPM 会计算这次转化的成本。但是大多数广告主关注的不是一次的 pv 而是全局的总投放 pv 或者当天的 pv,所以对它们的控制模式分为两种:第一种是实时控制,按照当前转化做扣费;第二种是全局成本控制,按照当天的成本扣费(平台默认广告主关注的是当天的成本),比如说一次转化会很高,出价也会相应的很高,但是由于给广告主历史的投放是已经超出广告主成本那么需要在扣费进行打折。

智能出价核心技术点:根据广告主的投放的成本和这次转化的效果智能计算出价,是一个兼顾全局的+局部的调节,局部算法使用贪心算法,没有考虑到全局的优化,根据广告主今天的转化和历史转化以及消耗情况控制每次的扣费成本,目标是提高广告主的 ROI,同时在保证广告主 ROI 的情况下,让平台整体的收益最大化。

全局算法使用控制系统理论 PID 算法:

智能出价面临的问题是:对于 APP 安装,数据存在较长的延时反馈,比如说用户看到广告和用户安装 APP 可能会间隔1天2天甚至7天,如果在这一次计算他的转化率的时候,没有考虑到部分未来数据的延迟问题,面临的问题是转化率偏低,这一次就扣少了,所以我们会有个归因的推理算法,利用推理模型来预测这个用户有可能转化的成本。

以上介绍的是一个扣费的公式,接下来介绍全局控制算法:

图片

ecpm=广告主的出价pctrpcvr*调价因子

Pid 算法:

举例说明:例如追车问题,中间距离较远,距离较远需要调高速度,比如速度从100调整到120,追一段时间后马上要超过了,这时候我们就要控制下来,需要对加速度进行调节。

成本控制算法在广告系统应用也是类似。比如说广告主的成本是50,扣费的时候有可能扣低了到40,也有可能扣高了到60,那么必须要全天维持在接近50,需要这种控制算法不断的去调每次 pv 的出价,让广告主的成本保持稳定。

定向召回:智能定向

图片

智能定向主要是解决广告主给定创意,不需要选择复杂的定向,系统自动寻找感兴趣的人群,就可以获得好的转化效果。智能定向会对广告主有自己的数据包/已选定向,根据后验的回传数据,智能为当前数据包/定向进行探索和扩展,尽量保持在投计划持续效果不降低。

比如说广告主在信息流产品中选择定向,但是这个定向在充分消耗之后就没有多少转化了,原因是筛选的数据包的可转化用户已经完成了转化,剩下的不感兴趣的也很难再有转化了。广告主通常的投放策略是先把定向选择的很窄,让整体转化率很高,所以整个流量分配很大的问题就是拿不到量,那么平台需要在投放的前期3~4天做定向筛选,在达到一定的 pv 级别,模型稳定,效果置信,可以放开定向,这样很多广告系统在放开后会比原定向增加两三倍的 pv 量,同时效果保持稳定,那么广告主的 ROI 在达到要求的条件下能够获取更多转化,对系统的整个流量的利用率提高了很多。

智能定向通过广告投放累计数据,并提取数据中的规律建立模型,系统进行智能决策。通过模型优化的方式智能决策,实现用户的匹配和广告之间