今日头条推荐算法公开,求高手来破

张俊SEM seo优化124字数 1765阅读5分53秒阅读模式

今日头条的推荐算法,相信是做自媒体朋友最为关心的吧,就在前不几的头条大会上,今日头条资深架构师曹欢欢首次公开揭秘。

1月11日,今日头条在总部举办了一场推荐算法交流会,因为报名人数远远超过了预期,交流会还临时换了场地。文章源自张俊SEM-https://zhangjunsem.com/25618.html

冷启动(新用户首次使用)是否可以通过第三方数据来避免推荐不准?算法应该如何平衡广告内容和资讯内容?推荐的“准”和信息茧房的矛盾,应该如何协调?文章源自张俊SEM-https://zhangjunsem.com/25618.html

今日头条公开算法的基本原理,并接受建言,体现出了一家平台对技术发展的责任感与诚意,这将对算法应用乃至整个互联网行业,起到巨大的积极推动作用。文章源自张俊SEM-https://zhangjunsem.com/25618.html

文章源自张俊SEM-https://zhangjunsem.com/25618.html

420486878308488262
420486878308488262文章源自张俊SEM-https://zhangjunsem.com/25618.html

今日头条副总编辑徐一龙文章源自张俊SEM-https://zhangjunsem.com/25618.html

会议由今日头条副总编辑徐一龙主持。徐一龙在谈到今日头条对行业公开、透明自己算法原理的初衷时说,算法也是一种“法”,都是通过一定的规则和方法,达成预期的一种效果。算法和法律法规一样,如果施行的好,都很高效,也都要求透明。文章源自张俊SEM-https://zhangjunsem.com/25618.html

曹欢欢博士在现场分享了今日头条推荐算法的基本原理,并详细介绍了算法模型设计维度与策略。包括如何在线训练大规模推荐模型,典型召回策略的设计方法,多目标如何融合等核心问题。此外,他还重点讲解了今日头条的内容安全机制及相关举措,公开了风险内容识别技术以及泛低质内容识别技术。文章源自张俊SEM-https://zhangjunsem.com/25618.html

他表示:“算法分发并非是把所有决策都交给机器,我们会不断纠偏,设计、监督并管理算法模型。希望这次分享能让更多的人理解算法,并共同参与到算法模型的制定中来,以改善算法,更好的为用户服务,让算法为社会创造更大的价值。”文章源自张俊SEM-https://zhangjunsem.com/25618.html

 文章源自张俊SEM-https://zhangjunsem.com/25618.html

微信图片_20180111121959
微信图片_20180111121959

现场观众

此次今日头条将算法透明化,并接受建言,属于行业首例。算法原则历来属于公司行业机密,极少有公司会对外公布。今日头条方面表示,人工智能发展带来的挑战,是人类此前没有遭遇过的。当企业发展壮大时,有责任也有义务,与行业一道积极思考与研究新技术可能带来的机遇和风险。

 

据介绍,阿里、腾讯、百度、美团、新浪、网易等科技公司的算法工程师和产品经理都去了。看来大家对今日头条到底用了什么推荐算法,那是相当的好奇。

在当天的交流会上,今日头条资深算法架构师、中国科学技术大学计算机博士曹欢欢带来了题为《让算法公开透明》的分享,首次面向行业公开算法原理。

今日头条用了哪五种推荐算法?资深架构师曹欢欢首次公开揭秘

今日头条用了哪五种推荐算法?资深架构师曹欢欢首次公开揭秘

今日头条资深算法架构师曹欢欢讲解今日头条算法原理

他表示:“算法分发并非是把所有决策都交给机器,我们会不断纠偏,设计、监督并管理算法模型。希望这次分享能让更多的人理解算法,并共同参与到算法模型的制定中来,以改善算法,更好的为用户服务,让算法为社会创造更大的价值。”

今日头条用了哪五种推荐算法?资深架构师曹欢欢首次公开揭秘
今日头条用了哪五种推荐算法?资深架构师曹欢欢首次公开揭秘

据曹欢欢介绍,今日头条旗下几款产品都在沿用同一套大的算法推荐系统,但根据业务不同,每套系统的架构会有所调整。 曹欢欢在现场的PPT里公布了头条使用的五种推荐算法,包括传统的协同过滤模型,监督学习算法Logistic Regression模型,基于深度学习的Factorization Machine,以及DNN和GBDT。 曹欢欢介绍说,现在很难有一套通用的架构模型适用于所有的推荐场景,所以很多公司会做多个算法的组合,比如现在很流行将LR和DNN结合,甚至前几年Facebook也是将LR和GBDT算法做结合。今日头条也基本是一套大算法,根据业务不同再具体调整结构。 在解释了算法之后,曹欢欢进一步解密了头条的推荐如何工作。曹欢欢表示,主要有四类最重要的用户特征,将会输入给算法,影响到推荐算法的工作。

今日头条用了哪五种推荐算法?资深架构师曹欢欢首次公开揭秘
今日头条用了哪五种推荐算法?资深架构师曹欢欢首次公开揭秘

第一类是相关性特征,就是评估内容的属性和维度与用户是否匹配。显性的匹配包括关键词匹配、分类匹配、来源匹配、主题匹配等。像FM模型中也有一些隐性匹配,从用户向量与内容向量的核心距离可以得出。 第二类是环境特征,包括地理位置、时间。这些既是bias(基础)特征,也能以此构建一些匹配特征。 第三类是热度特征。包括全局热度、分类热度,主题热度,以及关键词热度等。热度信息在大的推荐系统特别在冷启动的时候非常有效。 第四类是协同特征,它可以在部分程度上帮助解决所谓算法越推越窄的问题。协同特征并非考虑用户已有历史。而是通过用户行为分析不同用户间相似性,比如点击相似、兴趣分类相似、主题相似、兴趣词相似,甚至向量相似,从而扩展模型的探索能力。

分享过后,曹欢欢在还解答了各位对算法的疑问,包括今日头条如何实现冷启动,广告和内容该怎样平衡,怎样准确地拓展用户兴趣图谱等切实的工程性问题。同时,也听取了大家对今日头条算法的意见和建议。

声明:转载此文是出于传递更多学习交流目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。本站部分图文来源于网络,仅供学习交流,发表作品观点仅代表作者本人,本站仅提供信息存储空间服务,不承担连带责任。如有侵权,请及时联系管理员删除。

weinxin
ynxtwl
加个微信
交个朋友
张俊SEM
  • 本文由 张俊SEM 发表于 2023年8月31日11:12:17
  • 转载请务必保留本文链接:https://zhangjunsem.com/25618.html
新手如何利用内部链接优化SEO(从内部链接开始,为您的网站带来更多流量)
新手如何利用内部链接优化SEO(从内部链接开始,为您的网站带来更多流量) seo优化

新手如何利用内部链接优化SEO(从内部链接开始,为您的网站带来更多流量)

SEO对于每个网站都是非常重要的,因为它可以帮助网站获得更多的流量。然而,对于新手来说,SEO可能是一个非常困难的问题。本文将介绍如何利用内部链接来优化SEO,并为您的网站带来更多的流量。 什么是内部...
网站运营 2 年没见效果?3 步搞定流量低、权重不高难题
网站运营 2 年没见效果?3 步搞定流量低、权重不高难题 seo优化

网站运营 2 年没见效果?3 步搞定流量低、权重不高难题

不少站长投入时间精力搭建网站,可运营 2 年后却发现:流量始终上不去,搜索引擎权重也没明显提升,既没带来预期转化,也慢慢磨灭了运营热情。其实,网站流量与权重不佳,并非 “运营时间不够”,而是忽略了核心...
如何通过网站SEO优化提升网站流量和转化?
如何通过网站SEO优化提升网站流量和转化? seo优化

如何通过网站SEO优化提升网站流量和转化?

中小企业预算有限时做网站SEO优化,核心是“聚焦核心需求、放弃无效投入、用最小成本抓高转化节点”。无需追求全量关键词覆盖或复杂技术优化,重点围绕 “用户找得到、页面留得住、转化接得住” 三个环节落地,...