《百面机器学习》试读 | AI热门应用之计算广告

《百面机器学习》试读 | AI热门应用之计算广告

《百面机器学习》试读 | AI热门应用之计算广告

小编温馨提示

《百面机器学习》试读 | AI热门应用之计算广告

又是一年开学时,相信各位同学在新学期都有新气象,新期待????????

作为好朋友,Hulu也为大家准备了一份惊喜的开学礼物,从本周开始,我们会进行《百面机器学习》相关章节的连载试读,着重介绍人工智能领域的热门应用,请大家持续关注噢~

这么好的活动怎么能没有福利作伴呢?在本周的连载中,留言写下你的阅读感想,我们会选取第五位留言的幸运同学,送上有主创团队“签名开光”的《百面机器学习》书籍一本机不可失,失不再来,大家行动起来~

Now,let's get started!

《百面机器学习》试读 | AI热门应用之计算广告

AI热门应用之“计算广告”

《百面机器学习》试读 | AI热门应用之计算广告

广告是当今互联网商业变现最重要的模式,数字广告是大部分互联网巨头最主要的现金流。根据Google母公司Alphabet 2017年第一季度的财报,广告营收214.11亿美元,占其总营收的86.5%。Facebook的广告收入占比更加夸张,达到惊人的98%,可以说是一家不折不扣的广告公司。

从权威媒体机构Zenith 2017年发布的《全球30大媒体主》排名来看(如图1所示),互联网公司占据了半壁江山:除了Alphabet和Facebook雄霸前两位外,百度排名第4,腾讯排名14;传统媒体中最高的是康卡斯特(Comcast)媒体集团,屈居第三位;排名第20位的央视(CCTV)也成为了中国排名最高的传统媒体主。

《百面机器学习》试读 | AI热门应用之计算广告

图1:全球广告收入最高的30大媒体

数字广告的发展史还要追溯到1995年。当时以雅虎为代表的门户网站把网页当作线上杂志进行售卖,并按照约定的形式进行投放。那时数字广告与传统媒体的广告售卖方式非常相似,只是把内容从线下搬到了线上。

1998年开始,以谷歌为代表的搜索引擎引领了潮流。与门户网站有所不同,搜索引擎的商业变现采用的是与搜索服务相结合的付费搜索模式,即根据用户的即时兴趣(搜索关键词)定向投送广告。这种广告一般采用竞价的方式进行售卖,广告主可以根据用户的实时兴趣对广告投放效果进行优化,因而与门户网站相比,广告的投放效果具有精准度更高的特点。

2005年以后,在线视频业务的流量不断攀升,代表网站有YouTube、HULU等,由于其广告投放模式与传统电视广告类似,不断蚕食着传统电视广告的市场。

互联网广告模式之所以得到各大广告商的青睐,有以下几点原因:

首先,用户花在互联网上的时间越来越多,广告主为了抓住年轻一代用户,必须加大互联网广告的投入;

其次,在线广告的投放门槛很低,只需100美金在Google自助开户后就可以进行广告投放。同时,广告投放容易实现个性化,并经由A/B测试进行量化的评测和优化。随着互联网广告在商业上的蓬勃发展,其背后的算法模型研究也受到越来越多的关注。2008年,在第十九届ACM-SIAM学术讨论会上,雅虎研究院资深研究员Andrei Broder提出了计算广告学(Computational Advertising)的概念,他认为,计算广告学是一门由信息科学、统计学、计算机科学以及微观经济学等学科交叉融合的新兴分支学科,其研究目标是实现语境、广告和受众三者的最佳匹配。

在介绍计算广告的常用算法模型之前,我们先对互联网广告的主要产品类型和商业模式进行介绍。这里我们按照互联网广告的商业模型,将其主要分为合约广告、竞价广告、程序化交易广告等类型。

合约广告

《百面机器学习》试读 | AI热门应用之计算广告

图示是在HULU上观看美剧《实习医生格蕾》(Grey’s Anatomy)浏览器展示视频广告截图

一般在门户网站和视频网站中较为常见。例如,HULU目前绝大部分广告收入来自于合约广告,这是由于用户与视频广告的交互较少,缺乏点击等反馈数据,不宜直接评估后续的转化效果。合约广告的客户通常是品牌类广告主,它们的主要诉求是向公众宣传自己的品牌形象,并不显式评估后续的转化效果。合约广告一般以CPM(Cost per mille,千次曝光成本)进行结算,即每完成一千次曝光流量平台向广告主收取固定的成本。

竞价广告

《百面机器学习》试读 | AI热门应用之计算广告

图示展示了在百度中搜索“深度学习”时返回搜索结果页,其中第一条即为竞价系统所选择的广告(最下方有“广告”字样)

其最重要的形式是搜索广告。搜索广告的标的物是关键词,每个搜索广告可以对一些特定的关键词进行出价。用户输入的查询与广告竞标的关键词进行匹配,检索出所有符合条件的广告,并选择其中的一条或几条广告与搜索的网页结果一起展示(通常广告排在网页之前)。搜索广告一般按点击结算,在用户点击之后按照广告主对该关键词的出价收费,没有点击则不收费,因此点击率预估算法对竞价广告的优化至关重要。

程序化交易广告

《百面机器学习》试读 | AI热门应用之计算广告

图示为在****某个博客页面上,京东DSP通过赢得一次实时竞价机会展示的一个商品广告

能够让广告主更加灵活地选择自己的受众和曝光时机。在每一次展示机会到来之时,广告交易平台(Ad Exchange)将流量的相关信息和竞价请求发送给需求方平台,需求方平台(Demand Side Platform,DSP)根据流量的实际情况代表广告主进行出价,价高者得到本次的曝光机会。程序化交易广告通常以CPA(Cost Per Action,每次行动成本)的方式进行结算,因此需要综合考虑广告预估的点击率、转化率等因素。

不同类型的广告在广告系统设计上有所区别,比如合约广告一般不需要考虑广告的实际效果,所以没有CTR模块;程序化交易广告需要对接广告交易平台等第三方信息,所以需要更多的数据对接模块。但总体来说,广告系统的整体架构是通用的。图2是一个简化的广告系统框架,主要展示了算法相关的模块,而对其他系统模块有所省略。系统由分布式计算平台、流式计算平台和广告投放机三大部分组成。分布式计算平台负责根据海量的投放日志进行批处理计算,得到算法分析和建模的结果,例如用户画像、点击率/转化率建模等算法都是在分布式计算平台上运行,并将得到的用户标签、模型特征和参数等数据更新至数据库中。流式计算平台负责收集和计算有实时需求的用户标签、特征、点击反馈等数据,并将它们实时地同步到数据库中去。当一个请求到来时,广告投放机根据请求对应的用户、上下文等信息以及数据库当前的状态进行广告检索、排序和选择。一次广告投放完成之后,相关的记录将被流式计算平台及时地获取并处理,同时它们也被收集到投放日志中,供分布式计算平台稍后使用。

《百面机器学习》试读 | AI热门应用之计算广告

图2:广告系统架构图

广告系统的各个算法模块,不仅与Spark、HDFS、Kafka等大数据工具息息相关,更涉及到大量机器学习的知识。如果要成为广告算法工程师,除了熟练掌握业务流程之外,还要为各类算法、理论和方法打好坚实的基础,并在实践中不断掌握算法优化的经验,为以后的工作打下坚实的基础。在面试中,关于理论、方法、实践经验等相关的问题都会涉及,针对于广告系统各个模块涉及到的算法和机器学习知识在《百面机器学习》书籍中我们逐一进行了详细多样的介绍讲解,还附有面试题和解答,请各位读者认真阅读。

《百面机器学习》业已上市

首日荣登京东计算机新书榜第1名

15位一线算法工程师的鼎力佳作

124道基于真实场景的原创面试题

内容丰富,讲解详实

无论是求职面试还是在职学习

这都是一本值得珍藏的技术宝典

现在入手,赢在起跑线

点击原文链接了解书籍详细情况及购买方式,现在下单还可以领券优惠,拼手速的时候到啦!

《百面机器学习》试读 | AI热门应用之计算广告

点“阅读原文”了解更多