Computational Advertising 笔记(一)

demonstrate 的 blog
daily blog
Computational Advertising 笔记(一)
[/color]


[color=gray]这部分内容来自 Stanford 大学的这门课程。

计算广告学(computational advertising)的基本问题是为给定的用户在给定的环境下找到最合适的广告,这么简单的一个说法涉及到了三种角色:用户(user),出版商(publisher)与广告商(advertiser)。所谓的 publisher 就是为用户提供“环境”的人,这些环境里面一般以 publisher 自己的“内容(content)”为主,这是吸引用户到这里访问的核心,而 advertiser 希望利用用户访问的机会对自己负责的产品进行有效的推广。常见的场景如

publisher 为搜索引擎提供商,通过自己的搜索服务吸引用户流量,广告商针对某些 query 进行广告投放,这就是前面提到过的 sponsored search;
publisher 为某些 blog、news 提供商,一般通过提供与内容相关的广告信息进行广告投放;
deals、团购信息也可以认为是某种广告信息,很多时候通过用户订阅相关的邮件进行投放;但是团购网也可以看成是某种 publisher 因为这些信息本身也会吸引用户,造成直接的访问。
传统的广告投放途径如杂志、报纸里面都含有广告信息,现在移动设备正在对这些传统的媒体进行转变,新闻等等已经开始通过手机、平板设备进行传递,如 flipboard 又或者 Yahoo! 一直致力于开发的 livestand、苹果的 newstand,这是对这些广告模型的数字化重新实现。所谓的 computational advertising 就像个“皮条客”,将这三者 hookup 起来。这个领域里面非常核心的技术包括 IR(如何检索相关的信息)、microenconomics(如何对 user 的 information need 进行建模)、game theory(如何让不同的 advertiser 进行竞价)、recommender(主动的为用户推递信息)等等。

既然讨论的是广告,我们就得对不同的广告目的进行划分:

brand advertising,这是针对“品牌(brand)”的销售,品牌而不是产品的意思是让用户记住“牌子”,类似于买个脸熟,目的就是在用户心里建立一个“(与其他品牌)可区分的正面的形象”;
直接市场营销(direct marketing),这一般是针对特定商品的,类似于提供给用户购买的渠道(如电视营销),购买的 incentive(马路上发传单,deals 等),目的就是获得用户的直接反应;
那么“computational”主要就是为传统的广告学注入“计算能力”之后如何利用“算法”解决经典问题,其好处有 personalization、适合定量化等。因此 computational advertising 的核心问题是如何建立一个 user、publisher 和 advertiser 的市场能够最大化三者的收益,以及建立这个市场需要的 infrastructure。那么解决这些问题我们需要 representation、definition 和 solution:

representation,如何表示 user、publisher 和 advertiser;
definition,我们需要优化的目标、约束分别是什么
solution,如何快速有效的求解这个(些)优化问题
首先要有市场导向、然后才是 computational advertising,最后是支撑整个 idea 的系统。我们多数 technical 人员对 system 比较有 sense,但是对前面两个可能就不那么有感觉了。广告投放上来看:search、display(细分为 banner、rich media、digital video 和 sponsorship)、分类广告、lead generation 以及 email,似乎 email 上的正在萎缩,分类广告基本停止增长。投放广告的形式主要根据 user 在每个可能情况下的花费时间,如传统媒体现在可能每天平均花费 20-30min,但 mobile 上有 50min,而 Internet 上有 2.5h,最多的一般是 TV 有 4.5h,据此 advertiser 会选择合适的媒体进行广告投递。

从这里我们不难理解,为什么无论是 apple、google 还是 Yahoo! 都希望进入 TV 市场,internet 布局基本已成定局,除了 facebook 现在通过社交网络网罗了 display 类型广告的大量收益以外,各家尚未有新的手段压制彼此;mobile 上 apple、google 可以利用系统上的优势笼络 advertiser。这里浮现出来的更多的商机自然就是数字化后的电视,这是新的大蛋糕,自然每个经营此类业务的公司都不容错过。

那么整个市场可以认为 publisher 为 user 提供了“免费”的服务,而 advertiser 支付着这些 publisher 提供服务的费用以此将自己的广告投放给合适的用户,用户的购买造就广告的成功使得投放广告的业务实现盈利,从而能够进一步支持广告的投递,用户在享受 publisher 提供的服务以外还能够获得一些需要满足的 commercial intents。那么 advertiser 有些什么样的支付形式呢?

CPM(cost per thousand impression),对于 GD(guaranteed delivery)广告常用的方式,这一般是 brand advertising 里面常见的类型,多数广告以 banner 出现;
CPC(cost per click),对于文本广告比较常用;
CPT/CPA(cost per transaction/action),对 shopping、travel 类型比较常用,现在文本广告也有使用(用于减少风险);
OK,下面我们讨论两种常见的 graphical ads。一种 GD 是 publisher 与 advertiser 签订合同保证这类广告能够对特定年龄、位置、收入的人群展示足够多的次数或者足够长的时间,那么主要的问题主要是定价、给定时期内的流量预测以及有效合同对应广告的排位分配等(每个都可以写出来自己的 objective function)。另一种根据 performance 论定的图形广告对应称为 NGD(non-guaranteed display),这时前面这些支付形式 CPM、CPC 或者 CPA 就有用武之地了。简单来说这类型的目标就是优化 CTR(click through rate),一般认为需要两个角度来处理这类问题:

reactive,我们需要有机会探索将各种广告放在不同位置后能够收获多少 CTR,一旦 CTR 已知了我们就可以在每个位置选择 CTR 最高的广告;
predictive,从广告或者相关广告、landing URL 等信息抽取 feature 用来预测如果将此广告放置于某些 page (当然也会抽取 page 侧的 features)上的收益 performance。
我们往往会结合这两部分来建立一个 hybrid system。事实上,如果作为一个 matcher,从这个过程中获取利润,那么它可能会对自己的收益进行优化,此时优化的目标就不单纯是 CTR,而是 click 给自己带来的收益。从某种角度来说广告造成的直接收益还是偏低的,如何将一个用户的 attention 转换成为最终的购买行为(conversion rate 的提高)才是最重要的。

文本广告与 graphical 广告的目的是有所区别的,一般有两种 monetization 的模式:对搜索中某些 query 进行销售(类似于 google adword);或者对 publisher 的内容提供相关的广告投放(类似 google 的 adsense)。直观上来看,什么样的 query 值得销售、如何定义文本的相关性进行 IR 是这两种方式的核心问题。通常 advertiser 会根据某些“事件”创建需要的 campaign,每个 campaign 下都有若干个 ads group,其中又包含了几个 ads:用户可见的有 title、creative 和 URL,不可见的一般包括 advertiser 的 bidding phrase、出价和 landing URL。当某些 query 包含了 bidding phrase 的时候就会导致广告的出现。

如果我们希望作为 match maker 为 user、publisher 和 advertiser、ads network 提供很好的匹配,那么我们的选择必须均衡这四个参与者各自的效用函数:相关性、搜索或展示的收益、ROI(return on investment)以及收益及增长。这个问题里面涉及到海量级的数据、毫秒级别的响应以及提供服务成本必须低于收益。这在 conversion rate 非常低的情况下将会造成很大的 challenge。

那么处理文本广告一些自然的策略如使用 DB (SELECT something FROM somewhere WHERE keywords is like query)或者搜索(对 query 最相关的广告)是最自然不过的策略了。
[size=medium][/size]

猜你喜欢

转载自orange-lpai.iteye.com/blog/1585616