中国常春藤联盟院校都参与腾讯广告算法大赛30万大出炉!

  7月30日,2018腾讯广告算法大赛决赛结果出炉:来自大学、哈工大和北邮同学组建的“葛文强”队夺得大赛冠军,赢得30万元金!这次大赛赛题是Lookalike技术,目的是帮助广告主触达最大化相似人群量级,从而高效促进营销目标。主办方介绍,本届参赛选手73%是学生团队

  7月30日,第二届腾讯广告算法大赛决赛举办,十支队伍从超过2万名选手中杀出重围,进入决赛现场。

  决赛队伍经过高手过招、现场答辩之后,最终诞生出今年的冠军“葛文强”队,获得30万金等励。

  除了冠军选手外,腾讯公司副总裁、技术管理委员会主任王巨宏表示,本届大赛参赛选手73%是学生团队,C9院校都参加了算法大赛。

  参赛选手云集的一个重要原因是腾讯海量资源。腾讯社交广告总经理罗征透露,这次大赛目的是提供一个平台,让学生群体可以去体验腾讯做的算法应用,去感受工业界需要解决哪些问题,同时也会为用户和客户带来更多价值,把全链条的技术到应用展示给大家。

  本次获得冠军的“葛文强”队,三名分别来自大学、邮电大学和工业大学,并在初赛阶段获得第一名。

  “葛文强”队告诉新智元,他们三人在组队后,看了无数论文,并且有至少20天是每晚至少一人通宵盯数据,最后终于以初赛第一的成绩进入复赛。

  增强树模型。核心是特征工程,特征工程分为六大块,包括基础特征编码、单特征率、双交叉率、三交叉率、多值变长特征降维、ID特征的(lda, nmf, svd) embedding向量。其中用户特征与广告特征的交叉转换率的特征重要性最高。在率的统计采用5折交叉统计配合贝叶斯平滑的方案。

  神经网络ctr模型。核心是利用网络结构来代替手工特征交叉, 为此“葛文强”以一个DNN神经网络为基础,融合了代表二阶交叉的FM部分、FFM部分、无限交叉的mvm部分、基于游走的图embedding等结构,形成了一个复杂网络。并且在此基础上加了注意力模型,取得了很好的效果。

  第二、三名分别是“三只小蜜蜂”、“SML_21”战队,将10万元及5万元励收入囊中。“神魔咧”、“just-fighting”团队则抱走了另外两座“人气战队”。

  腾讯社交广告总经理罗征表示,早期学计算机算法,课本上的数据是“模拟的”数据,即所谓做算法多是涉及证明。现在做算法在课本上的技巧可以应用大量的数据集,但是也存在与工业界应用的距离。

  因此腾讯举办广告算法大赛的目的是提供一个平台,让学生群体都可以去体验腾讯如何做算法应用,感受工业界需要解决哪些问题。

  腾讯社交广告基于成熟的算法技术能力,运用Lookalike技术,能在精准的前提下,帮助广告主触达最大化相似人群量级,让品牌找到更多“对的人”,从而高效促进营销目标。

  罗征说,Lookalike在广告主应用中非常广泛,并且对他们的效果影响非常大。今年将Lookalike作为赛题,除了有趣、好玩外,一个重要的原则是算法对广告主有很大的影响力。

  AI技术在全链条的应用,Lookalike只是其中一块。算法的应用还可以体现在优化人力配置上,比如广告效果优化和广告审核这类目前投入非常多人力的地方,机器出错率比人类要低。

  腾讯CDG人力资源中心负责人、腾讯集团组织发展部总经理艾兰表示,算法不仅有商业价值,还有包括公益在内更多应用价值。

  腾讯公司副总裁、技术管理委员会主任王巨宏认为,算法决定了前台许多东西,这样的比赛让大家看到华丽的外表其实是由算法决定,算法带来的不仅有商业价值,还有更多其他价值。互联网巨头的一个重要优势就是广告,将来谁能在广告上做的好,就是要看算法。腾讯在产学研合作中有两块:一是做学术基础研究,腾讯也希望有同学在这条上深耕;二是对想做产业的同学来说,腾讯欢迎大家一起,让更多的人体会到产品的价值。

  王巨宏还透露了一组数字:参赛的73%是学生团队,今年C9院校参与人数均超过100。王巨宏也欢迎参赛的学生参与到产业界中来,成为腾讯同事或者合作伙伴。

  “未来,希望通过腾讯链接的服务,让更多的人体会到产品的价值,让大众享受到广告带来的快乐和幸福。”

  互联网广告是大规模AI技术应用最重要的场景之一,不论谷歌、Facebook还是BAT,都在广告业务中投入了大量的研究资源和人力,因为广告场景的很多技术创新都能直接转换为商业收入。

  腾讯社交广告在Lookalike等大规模推荐技术方面,进行了多年积累与探索,结合产品、运营推广,共同驱动社交广告业务高速增长。

  腾讯社交广告专家架构师李长城介绍,TSA的推荐引擎采用了业界主流的向量检索方法(YouTube 2016年发表)。虽然在电商等结构化场景,有一些新的方案提出并取得了不错的效果,在社交广告这种非结构化场景,结合对向量检索中具体问题的优化,该方案仍然获得最好的效果。

  向量检索主要由两部分组成:一是向量内积DNN,通过DNN学习用户/广告 embedding向量,两者的内积表示感兴趣程度;二是近似最近邻(ANN)检索,通过ANN算法大幅缩短检索时间,召回近似top N感兴趣候选。向量检索能够以较低的性能开销获得近似全库遍历的检索效果。实际应用中,也存在很多问题需要优化改进。

  李长城介绍了腾讯社交广告在推荐优化中的几项工作,包括ANN算法选取及细节改进(HNSW优化聚类分层及邻居计算),ANN通过数学变换支持内积度量,建模先验概率提升效果(内积不是距离度量,近邻检索算法不能直接使用,通常会归一化为cos,导致了相应的效果损失),以及共用lookup embedding建立双塔间的潜在特征关联,缓解向量内积DNN不能直接使用user-ad组合特征的问题。

  除了模型算法,李长城也概述了TSA在NLP基础技术、大规模机器学习平台,超大规模稀疏DNN训练等方面的建设与创新。

  腾讯社交广告是国内流量最大、场景最丰富、覆盖人群最为广泛的互联网广告平台。在超大规模数据的支撑下,多种主流AI技术协同优化,共同驱动广告业务高速发展,以及业界前沿技术的应用与创新。

  在注意力经济下,用户的广告判断对实时判断的要求越来越高,需要在用户点进来的时候就判断哪一条广告适合用户看,人类操作无法适应这种实时性要求。罗征说,目前腾讯的微信、QQ、新闻等产品广告中,已经实现了实时判断,用户访问到腾讯的产品时就会实时推荐。

  算法越来越多的改变广告的推荐形式和目标。华扬联众数字实验室总工程师张炎也在决赛中介绍了应用数据模型和关联分析如何连接用户、和广告。

  张炎说,华扬联众采用Scoring 算法,将用户分类,为计算广告群精准定位,并且用实时决策引擎提供数学模型。

  以汽车公司SUV营销为例,前期通过选择广告投放,准备网页内容,UT部署脚本用户流量,Centrixlink使用账户信息在设备上提供初始标签。后期持续发掘最优的广告和用户特征,利用Lookalike对用户进行评分,找到类似人群,实现精准投放。

  另外,AI在广告审核中也发挥重要作用。比如广告创意中的素材有版权归属问题,A广告不能拿了B广告的创意进行抄袭,这种情况下,机器学习做自动化搜索配对,就能够识别广告抄袭行为,原创版权。

  AI虽然能给企业特别是传统企业带来效率提升,但AI建模是一项技术门槛高,只有少数人掌握的技能。腾讯云AI基础产品中心过期域名抢注产品经理郭律表示,优质的机器学习平台能够帮助企业降低获得AI能力的门槛,提高建模效率。并以腾讯智能钛机器学习生态服务平台(TI-ML)为例进行了深度解读。

  TI-ML是基于腾讯云强大计算能力的一站式机器学习生态服务平台,能够对各种数据源、组件、算法、模型和评估模块进行组合,使得算法工程师和数据科学家在其之上能够方便地进行模型训练、评估和预测。

  智能钛机器学习具有可视化操作界面的 TI-ONE 和具有命令行操作界面的 TI-Accelerator(TI-A),能够满足用户不同的使用习惯。在部署方面,除公有云方式外,TI 也支持私有化部署。

  华北豹是唯一一种只生活在中国的大型猫科动物。2005年,门头沟最后一次出现华北豹的身影,现在已经没有适合华北豹的生活了。

  红外相机常用来发现华北豹等,它的红外探头通过温度来动物,但问题在于受温度变化影响,不能精准拍摄目标野生动物,会拍很多没有用的照片。

  泛化智能通过利用计算机视觉来识别动物,把之前动物组织猫盟一周的时间缩短到1小时,能达到98%的准确率。目前,猫盟在华北发现超过29只华北豹。

  至此,2018腾讯广告算法大赛正式落下帷幕,腾讯社交广告将持续探索前沿科技,不断触摸算法科技的未来,期待明年的算法大赛。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

Powered By Z-BlogPHP 1.5.1 Zero

Copyright Your WebSite.Some Rights Reserved.