论文背后 Niklas Karlsson 运用反馈控制来应对复杂的广告需求

Niklas Karlsson

工程师们都知道,反馈控制是调整系统并校正以达到预期结果的过程。例如,机器人遇到障碍物后自主重新规划路线。亚马逊广告高级首席科学家 Niklas Karlsson 在最近的工作中采用的正是这种方法。作为一名前机器人工程师,Niklas 运用了该背景以及近二十年的广告科技经验来帮助客户实现复杂的广告目标。

Niklas 拥有美国加州大学圣塔芭芭拉分校和瑞典隆德大学的工程学与统计学高级学位,同时是电气电子工程师学会 (IEEE) 会士。早在本世纪初,Niklas 就已涉足机器人领域,但后来为了寻求转变,他加入了 Advertising.com,助力彻底改造其广告优化系统。对广告科技的兴趣使 Niklas 一直深耕该领域,并于 2022 年 7 月加入了亚马逊。在这里,他谈到了自己的职业生涯和最近发表的论文,该论文发表在 2023 年于新加坡举办的第 63 届 IEEE 决策与控制会议上。

您为什么会加入亚马逊广告

自 2005 年起,我一直深耕在线广告行业。2022 年初,一位招聘人员联系我,询问有没有可能加入亚马逊广告。这个提议很吸引我,其实就是为另一家公司解决我惯常处理的类似问题。在亚马逊工作的前景令我心动。亚马逊的规模、声誉以及远大的领导力准则——崇尚行动、远见卓识、达成业绩,这些引起了我的共鸣。

您的主要研究领域是什么?

我的研究兴趣是反馈控制、动态系统和优化。我在亚马逊的职责是为亚马逊需求方平台 (ADSP) 管理的广告活动提供专业的优化和控制算法,并通过改进 ADSP 造福客户。我们的客户是广告主,他们希望预算花在实现特定广告活动目标上。例如,广告主可能会联系我们,表示每月预算是 $100000,希望实现总转化量或销售额最大化。他们要求在整个月均匀地支出预算,而不是在第一天或最后一天耗尽全部预算。通常,他们还会设置额外的投放限制,例如要求一半的广告展示量面向女性用户,或者限定平均单次转化或展示成本的上限。一次广告展示是指向用户展示一次广告。

广告活动本质上是一个极其高维的多限制优化问题。运用一些精妙的数学方法即可将其分解为更易解决的子问题。这些子问题的解决方案融合了机器学习、反馈控制和统计学领域的前沿技术,最终综合计算出代表广告主针对广告展示量提交的竞价。

向我们介绍您的论文。

我的论文《基于反馈控制的分层多约束广告活动优化》解决了一个以前被忽视的优化问题。广告主通常希望在满足一项或多项投放限制的前提下,实现总转化量等最大化。以往,这些限制应用于整体广告活动预算。但近年来,广告主通常会对整体广告活动预算施加特定投放限制,而其他限制则仅针对子广告活动。子广告活动由独立的广告创意定义,适用预算分配、性别比例、平均单次展示或转化成本等特定于自身的限制。

因此,当前的广告活动目标往往对应分层多限制优化问题。这就引出了有趣且具挑战性的研究问题。先前研究提出的简易解决方案存在重大局限,且与 ADSP 的宏观愿景不符。我的研究和论文通过推导出数学最优解,并设计分散式实施方案,系统性地解决了这个问题。

这篇论文是如何诞生的?

首先,我在亚马逊工作的前几个月对整个 ADSP 优化系统进行了审计。在审计过程中,我找出了优化系统的优势和劣势,并为广告主创造了提升广告活动投放效果的机会。有一个具体缺陷引发了我的深思。虽然我知道可以改进,但我起初并不清楚如何描述问题,也没有想到解决方案。然而,在临近 2022 年底的时候,我处于项目之间的空档期,有更多的时间去思考。这时,我的思路清晰起来,制定了详细计划:首先通过运用数学方法明确定义问题,然后推导出最优解以及稳妥的实施方案。我在 2022 年 12 月完成了论文的初稿,并在接下来的几周里进一步归纳了结果。随着论文的最终定稿,我们开始着手开发原型来演示这个概念,结果非常积极。毫无疑问,这个解决方案应该投入生产并广泛推广,现在已经做到了。

您看到了怎样的成效呢?

首先,这个解决方案立即提升了广告活动预算的使用效率。未消耗的广告预算减少了,广告活动效果通过指标来衡量,比如平均单次转化成本和其他关键绩效指标,而这些指标各自提高了几个百分点。

除了指标有所提高之外,新解决方案还支持旧解决方案无法兼容的其他各种投放限制。为了达到近乎最优的效果,旧系统只能用于仅有支出限制的广告活动。这意味着有单次转化成本、单次展示成本、单次点击成本、浏览率和目标率等限制的广告活动是无法投放的。新系统具有通用性和前瞻性,可以轻松处理任意数量的分层多限制问题。

这种方法有什么值得注意的地方?

新系统与旧系统的区别在于如何将问题模块化,随后如何协同实施多个反馈控制器,从而稳妥而高效地解决各种子问题。

人们着迷于如何将复杂的广告科技问题转化为控制问题,因为这不是反馈控制的传统用法,传统的应用存在于航空航天和机器人领域。但作为一门科学学科,反馈控制的美妙之处在于,它基于抽象,允许在许多应用场景中使用相同的工具。你可以将广告科技问题转化为另一种形式,使你能够使用与开发喷气发动机、自动驾驶汽车和发电厂控制系统完全相同的工具。

在这篇论文中,我采用了一种整体的方法,并尽可能地结合了第一原则推理。这篇论文的大部分内容都是数学,但是一旦熟悉了这些符号,它就会变得非常简单和直观。

您的机器人背景是否推动了您的这种思维方式?

当然。很多人问我,从机器人转到在线广告领域是否是一个很大的转变。我说不是,因为我在机器人领域工作时,采用的是相同的方法。我把一个商业问题变成了一个数学问题;我解决了这个数学问题,然后在真实的系统中实施了解决方案。这就是我现在正在做的事情。这些都与抽象有关。

亚马逊广告担任科学家,对您来说有什么亮点?

我身边有很多精英,他们渴望有所作为。亚马逊科学社区代表着许多学术背景。毫无疑问,有很多计算机科学家,也有统计学、经济学、反馈控制、纯数学和化学等领域的人才。

总的来说,我喜欢广告科技的原因在于它是跨学科的。没有谁无所不知,每个人都有闪光点,你总能从别人身上学到东西,还会遇到很多有趣的问题,等着你去解决。

亚马逊营造了一种真正鼓励你分享新想法的文化。关于这些想法,你会收到很多问题,而且通常会来回反复讨论,你可以据理力争,强调自己的想法有何优点。不要担心,大家非常愿意接受新想法,而且这个过程可以帮助你实际测试自己的想法,并高质量地完成工作。亚马逊是一个支持性很强的企业。

在您的职位上,您是如何对广告进行革新与重塑的?

在线广告已经存在了很多年。我们已经取得了长足的进步,但还有许多工作要做。客观来看,在我进入这个行业时,还没有用户层面的数据,算法也很原始,广告主不清楚自动推广能为他们做些什么。

现在,有大量精细的数据可用于建模和优化,先进的优化和控制算法已经开发出来,新类型的广告格式也已问世。此外,当今的广告主精明且要求很高,他们期望获得良好的投资回报率。尽管在过去 20 年中取得了巨大进步,但我们还有很多工作要做,需要具备各种技能的人才来研究和解决问题。对于那些拥有机器学习、人工智能、反馈控制、统计学和应用数学背景的人才来说,我预计在亚马逊广告或广告行业会有很多令人兴奋的职业发展机会。