- 移动版

主题：对话大厂算法工程师：AI 时代，算法从不是为了制造茧房

爱我中华发表于 2026-02-27 20:07

们不可能把那1亿个视频排个序吧，是不是随便抽了一点点？
风霁：不是随便抽的，有个模糊计算的过程，会从中间抽出几万个，挨个计算一次。模糊计算的过程，可以想象成一个树，这个树有十层，每一层有几十个分叉，中间可能会有些策略，在分叉最里面拿到一些视频，所以相当于是全局计算。
05
为了用户长期留存，算法一直在努力打破“茧房”
重轻：你刚才说模糊计算是从一亿个候选视频里，给我拿了一点做排序，是不是有点像是一个购物清单去到超市里面，我的偏好已经在这些候选视频里面了？
风霁：很多人在抱怨“信息茧房”，其实推荐系统一直想去打破它，我们拿出可能千亿的流量去做随机分发。这个随机分发，当然也不是说从几亿个里面随机，而是我们可能挑一些主题完全不一样的视频，不走后面的模糊匹配，也不走精密计算，从几万个里面随机挑一个给你展现，那这个点击率可能是大盘点击率的1%。
差这么多意味着什么呢？今天如果没有推荐系统，就随机给你分发视频，那你想要找到一个视频的难度至少是现在的 100 倍，而且应该不止 100 倍，因为点击率是1%，播放时长、完播率、点赞率也是变低的。如果你从满意度层面来看，可能是千分之一。
所以说如果没有推荐系统，你基本可以理解你在这个内容极度爆发的时代，面对每天亿级别的内容供给，你是没办法去看内容的。
汉洋：换句话说，如果没有推荐系统，面对亿级的视频，你看的是个平均数，就是中国用户制作视频的平均水平。
风霁：你随便抽一个视频，可能抽到了你们小区一个大爷的怼脸自拍。我不是说这个视频不好，但大概你不太感兴趣。随机推送和有效推送中间的状态，是让人们看一个他大概感兴趣的内容，但是不完全迎合。
分发过程中，有一部分是多目标，鼓励探索你过去没看过的内容，有挺多权重的。它是一个拔河比赛，从长期价值来看，你到底是希望这个系统短期更懂你，还是说长期能够帮你发现新事情？人的需求会变化的，如果我今天只盯着你已有的需求去服务，你未来可能就流失了，所以我们很关注，你在这个平台能不能发现过去未曾看过的观点，没看过的内容、方向甚至题材，我们去不停地探索。
执行层面，也有很多目标为这个服务。我们有一个目标会看跟你差不多画像的用户在搜索什么稿件，他搜索代表推荐系统还没有识别到的，我们会猜他想搜什么，然后把这个视频推荐给你，这个观点和内容可能都是你过去没有接触到的。
我觉得这个事情就是求同存异。人类天然会检索自己偏好的内容，大模型学习的也是这个偏好。但跟人类不一样的是，推荐系统会加很多模块去纠偏这个偏好。长期来说，纠偏对于用户的平台留存是不是一件好事？我理解是个好事，业界应该有共识，做一些兴趣探索的实验，长期留存是正向的，平台没有必要把你锁在“茧房”，平台希望用户能够更 open 看世界。
重轻：我的问题是，技术肯定是滞后的，就是要先出了问题，你才知道。
风霁：我们会尽量前置去考虑问题，很多问题不可能等事情发生。比如说要加一个目标，其实能知道可能带来哪些风险，风险弄好之后才会上线。但是我也不可能 100% 什么问题都看到，有些问题是后置治理，甚至有的不是上线时发生的，而是要很久以后。
比如 2019 年前后上点赞目标，一年之后出了一些视频，你点一个赞，就做个俯卧撑，或者你点个赞，今天就有一天好运，你们应该刷到过这种视频吧，现在看不到这类视频了。当时有一些作者，有些黑灰产、营销号，知道了点赞率高能有流量，他反过来去拉流量，我们只能后置去识别这类视频，把这些无效的用户行为给过滤掉。
还有一个逻辑，是你的竞品优化得更好，更准了，那你要不要做？今天如果不迭代，这个系统就在变差，因为用户有额外的需求。今天是全网亿级视频上传，早十年只有百万量级、千万量级，这么多量级的变化，整个系统要不要演进？10 年前的推荐系统，一定处理不好今天的情况。
重轻：似乎没有一个无为而治、往后退一步的办法，必须得往前走，遇到问题要充分理解问题，然后把它反映在我们的目标设定和函数里面。
风霁：我必须要提出一个观点，就是在我们日常的工作中，会有一个问题叫做，“这个事情为什么是这样，为什么不是更完美的一个状态”。万事万物理论上都是从 0 到1，从 1 到 100 的过程。很多问题不是突然出现的，而是慢慢爬升上来的，一些争议问题，不是新增的，而是过去就有，只是大家的要求比过去更高了，你才觉得它是个问题。
比如我们要求东西更便宜，内容比以前更新颖，“茧房”比以前更窄。推荐系统实际上是更好了，大家可能想象不出 10 年前的推荐系统是什么体验了。从技术层面来说，各家推荐系统一定是在往体验更好的方向走。
重轻：有时候用户想玩“怀旧服”，停留在“大灾变”那个时代的游戏，就是想活在过去。在魔兽世界，我们还真获得过一次怀旧服的感受，那是一个历史性的时刻，一瞬间全世界小时候玩过魔兽世界的人全回去了，90% 以上的人第二次被淘汰，我就是那 90% 的人，然后我才想起来这个游戏所蕴含的东西是什么。
在我玩不到旧版本的时候，我脑海中都是贼美好的事情，我进去以后发现，我要在这么低劣的画面里面杀 500 只野猪，要一只一只的杀，然后回去买面包，只留下最枯燥、最硬核的人才去玩这个东西。
风霁：他是希望他的快乐回到过去，但是他没有考虑到他自己的审美，或者说对快乐阈值的阈值在提高。所以我们说“越长大越孤单”，越难感受到快乐，因为我们小时候感受到的快乐更多。
06
对平台生态和社区价值的伤害，多年后才能观测到
重轻：有非常多叙事，像人心里的伤痕一样，最经典的研究应该是几年前，有科学家搞了 100 多个青少年的社交网络账号，发现很容易收敛到极端减肥跟节食。包括有吹哨人出来，说 Facebook 的算法会鼓动少女进一步增强她们的身材焦虑。如果它足够有利于用户粘性，这些公司还是不吝于去作恶的，这是很多人内心深处对技术最底层的不信任。你怎么看这些事？
风霁：我理解大家的不信任。像这种有一定风险性的内容，一部分是用户上传的，更大比例是灰黑产，有意图去引流的，可能是减肥药，或者非法减肥机构。至少根据我的工作经历上，针对这些灰黑产，我们有一定的治理经验，这对平台也是不利的。
推荐算法最终要围绕用户满意度来建模，需要有一个底线。算法不应该决策，到底 A 观点还是 B 观点对，我觉得推荐不应该负责这个事，平台也不应该负责这个事。但是推荐算法应该管理好底线，符合法律法规和道德约束。
重轻：最后一个问题关于情绪，我感觉情绪是一个最近两年人们开始谈论的议题，之前讲更多的是“misinformation”，虚假的事实，阴谋论、造谣这些，现在是算法在挑动情绪，它不是个实在东西，它只是一个冷和热，或者一个人积极和消极，很难去描述它，它可能是一个很丧的、埋怨社会的，或者是一种特别“社会达尔文主义”，觉得弱者应该去死。这些情绪不是关于事实的判断，在这个情况下就是，推荐算法有意识地去管理、抑制，或者是酝酿、提倡一些特定的社会情绪吗？你有主张吗？
风霁：我觉得这个事，可以认为是一个社区工作，有的社区是鼓励讨论的，有的是鼓励双方来对垒的。在我过去的工作中，我可能更加主张观点接受差异化，但是要就事论事，友善的态度来讨论。
如果一个视频，是以引发争议来获得流量的话，我们会建模这一块的价值，比如评论区都是喷他的，可以通过大模型变成是和否的标签。那这个视频在综合目标里是不占优势的

回帖(11)：

11 ^# hanxiao129
02-28 14:26

楼主分享非常不错的

10 ^# hanxiao129
02-28 14:25

了解一下内幕

9 ^# hanxiao129
02-28 14:24

不错的导读，谢谢楼主分享

8 ^# z3960
02-28 06:33

了解信息

7 ^# z3960
02-28 06:33

看看资讯

6 ^# 任逍遥
02-28 02:11

不错，了解了

5 ^# 任逍遥
02-28 02:11

也就看看

4 ^# 任逍遥
02-28 02:11

来看一下

3 ^# huwg
02-28 01:26

谢谢分享

2 ^# huwg
02-28 01:26

了解一下

全部回帖(11)»