首页| 论坛| 搜索| 消息
主题:对话大厂算法工程师:AI 时代,算法从不是为了制造茧房
爱我中华发表于 2026-02-27 20:07
春节期间,中国 AI 行业仍在加速狂飙。这一轮生成式人工智能的爆发,源于 AI 行业在深度学习、大模型与数据工程上的长期技术沉淀与规模化落地。
以终为始,在这个节点我们想回过头聊聊推荐算法。这项早已融入各类 App 和我们生活日常的技术,易被忽视它同样来自 AI 深度学习技术的突破,且至今仍是规模最大、最成熟的 AI 推理应用场景。也因此,推荐系统会是检验大模型推理能力的终极赛场之一,也是目前少有的能将大模型技术转化为规模化商业价值的产业场景。
播客“蜉蝣天地”于年前对谈算法工程师风霁,带来了近年来对推荐算法最深入的一次分享。风霁任职过国内多家互联网大厂,在推荐算法场景有 8 年经验,他参与了推荐算法的基础模型复杂化的整个进程:从最早的简单机器学习、深度学习,到目前大模型相关的技术在推荐场景下的各种结合应用。

这场对谈最有意思的地方,是把算法工程师从神秘“黑箱”里拽回到一个很具体的岗位:一份脏活累活。面对亿级上传、千亿级观看的内容洪流,系统先机审和人审,再做召回、排序、重排,把“你可能会喜欢”从一句口号拆成可计算的目标:点击、停留、互动、长期留存、创作者公平、社区健康。算法从来不能一次算准,大部分情况下是在A/B测试中的小步试错,边跑边修、边增长边治理:今天追求效率,明天就可能补上被灰黑产利用的漏洞;今天满足兴趣,明天还得防止兴趣越来越窄。
更有意思的是,所谓用户画像并不是一句“你是个爱钓鱼的人”这么简单,而是一堆工程上可用、但人类很难直观看懂的向量;工程师要在这些冷数字和热情绪之间反复翻译,既听行为,也尊重表达。而当 AI 介入创作和分发后,这份工作还会更难:你不仅要判断用户现在想看什么,还要猜他未来想成为什么样的人。
真正决定平台生命力的,不是让用户多刷十分钟,而是让用户一年后还愿意回来,让好内容和好创作者都不被埋没。说到底,算法工程师做的,是一种现代信息社会的基础设施维护,而他们维护的是社会可能还没有产生共识的思想前沿。
以下为算法工程师风霁和“蜉蝣天地”主播重轻、汉洋的对谈,由凤凰网财经整理:
01
推荐算法本质是信息检索,围绕用户满意度建模
重轻:算法是我们从第一期就想聊的话题,邀请到你满足了我俩很长时间的愿望。推荐算法其实不是一个古典的工程师岗,它在某一个时间点才慢慢出现。
风霁:从我的视角,我觉得推荐算法本质是在做信息检索,推荐相关的论文,最早发的那个会是“信息检索会议”。这个事并不特殊,互联网本身就是为了信息检索而诞生的。
第一代推荐,可能是 2005 年以前,当时的推荐,大部分都是编辑做的,门户网站都是人工定义的规则,我没有参与过这个阶段。从 2005 年大概到 2012 年左右,深度学习、机器学习开始火了。在 2012 到 2016 年这段时间,是传统机器学习在推荐上的应用。2016 年谷歌发了一篇论文就是把神经网络应用在 YouTube 的推荐里。之前是非常简单的机器算法,就是挖特征,通过挖复杂信号让推荐变得更精准,是个堆人力的事,明显不是个长久的事情。谷歌是在简单模型的基础上,再叠加上一个深度神经网络。
我大概在 2017 年入行,我在那家公司应该是在 2018 年,我自己去主导把神经网络应用到推荐。那个年代的视频迭代,基本上只优化一个目标,就是 CTR(Click-Through-Rate,点击率),上了神经网络之后,你会发现点击率暴涨,涨 10%-20%,但同时带来一些标题党、封面党的问题。我们会把时长、点赞这些多目标也融入到推荐迭代,做了很多生态治理的工作,打压这些封面党、标题党,包括一些擦边、软色情的治理。
重轻:所以你是一个开荒的工作,你经历了各种指标飞涨,工作价值特别大,甚至整个公司都为之震动的这个过程?
风霁:推荐对于业务来说是推进器,当时整个公司的增长非常快,业务是每年翻倍的,推荐带动涨 10%,其实也就是一部分。这个技术对于我自己和团队来说,是非常震动和开心的,很振奋。
互联网给不同的人分发不同内容,千人千面、亿人亿面,大家可能没有意识到个性化能力到底能有多强。按照大模型 scaling-up 的逻辑来说,假设当年编辑推荐的点击率是1%,努力后做到 2%,但如果你知道未来可以做到 20%,其实总编就不重要了。
本质来说推荐本质是信息检索,信息检索的产品形态和技术都发生了翻天覆地的变化。我们今天一天能看的视频,如果没有现在这个技术,你可能花 100 倍的时间也找不到这个视频。
重轻:推荐算法成为了一个现实之后,各家都开始做这个事,接下来你做了什么?
风霁:大概在 2018 年做的事情是比如说一个用户有 1000 个历史行为,从中间找到比如说 30 个,看里面有哪些跟我是相关的,跟候选的视频相关的。然后根据历史视频,判断你可能对哪些视频感兴趣,叫做序列建模。大概从 2019 年到 2023 年,我们在做序列建模,以及多目标建模。多目标做得更复杂,比如说从时长、点赞、关注,包括全屏分享,把用户使用过程中的各种行为做拆解。
我们首先考虑,哪些行为反映用户对这个视频是满意的?哪些动作反映这个视频是在骗用户、骗平台?只有用户对内容满意,才会留在这个平台。
说回来推荐是分几部分的,第一部分叫做用户体验,第二部分叫做作者的体验,我们叫B端和C端。第三部分是生态工作。C端我们去会考虑推得准不准,用户看这个视频会不会秒退?秒退可能说明封面标题好,体验不好。在B端,作者如果创作了好作品,有没有拿到足够多的流量?如果拿不到,是什么原因?我们要把这个问题解决好。第三部分生态,就是有一些作品不优质,但是拿到了比较多的流量,我们也要对它治理。
02
时长不是唯一目标,更希望用户一年后还用
重轻:听你说这么多,算法的目标比我们以为的要复杂。我们以为互联网公司要不择手段地把我留在这,增加用户时长和粘性,但其实这里面内含了不一样的目标?
风霁:坦白来说,各大互联网公司肯定希望时长更多——但是具体到每一天,并没有那么极致地去优化时长。至少我个人带团队时,我是不太 care 涨时长这个事。我们对这个事情的理解是:用户一年之后还用,这个 APP 能不能陪伴用户非常久?不能只看今天。
今天让用户多看 10 分钟,有意义吗?我觉得意义不一定大。大家都能看到一些用户觉得太沉迷了,我把它卸载了吧!可能多了一天的活跃度,但你损失了未来 365 天乘以 50 分钟的价值。所以我们会更关注用户有没有发生有效互动:只是浏览,还是也有点赞、关注、评论?
最近两三年,我们做长期价值建模会比较多,会考虑在未来180天,这个作者你会去看几天?如果180天你还看同一位作者,当然也会在这个平台上活跃180天。
从生态视角,永远在考虑一个问题,你看舞蹈,那跳同样一个舞,有没有人比这个视频跳得更好的?那个更好的视频为什么没有推荐给你?这是从我们的用户视角看这个问题的。从作者视角来看,那个跳的更好的作者,有没有拿到更多的播放量?
作者侧要分档,好的作者越来越满意。但是有一些灰黑产,包括现在有很多低成本的创作,这些人是不满意的。对创作者来说,如果说你的作品用户喜欢,那不应该担心“一代版本一代神”,你应该是永远的神。相反如果下个版本你不行了,那是不是说明就是你过去是靠上个版本的 bug 拉到的流量?
重轻:如果因为版本迭代,让创作者屡屡要遭受断崖式下降,是产品出问题了?
风霁:对,这个产品自然就会被淘汰了。因为明面上好像是用户选择了平台,但我觉得底
下一页 (1/5)
回帖(11):
11 # hanxiao129
02-28 14:26
楼主分享非常不错的
10 # hanxiao129
02-28 14:25
了解一下内幕
9 # hanxiao129
02-28 14:24
不错的导读,谢谢楼主分享
8 # z3960
02-28 06:33
了解信息
7 # z3960
02-28 06:33
看看资讯
6 # 任逍遥
02-28 02:11
不错,了解了
5 # 任逍遥
02-28 02:11
也就看看
4 # 任逍遥
02-28 02:11
来看一下
3 # huwg
02-28 01:26
谢谢分享
2 # huwg
02-28 01:26
了解一下

全部回帖(11)»
最新回帖
收藏本帖
发新帖