首页| 论坛| 搜索| 消息
主题:对话大厂算法工程师:AI 时代,算法从不是为了制造茧房
爱我中华发表于 2026-02-27 20:07
们不可能把那1亿个视频排个序吧,是不是随便抽了一点点?
风霁:不是随便抽的,有个模糊计算的过程,会从中间抽出几万个,挨个计算一次。模糊计算的过程,可以想象成一个树,这个树有十层,每一层有几十个分叉,中间可能会有些策略,在分叉最里面拿到一些视频,所以相当于是全局计算。
05
为了用户长期留存,算法一直在努力打破“茧房”
重轻:你刚才说模糊计算是从一亿个候选视频里,给我拿了一点做排序,是不是有点像是一个购物清单去到超市里面,我的偏好已经在这些候选视频里面了?
风霁:很多人在抱怨“信息茧房”,其实推荐系统一直想去打破它,我们拿出可能千亿的流量去做随机分发。这个随机分发,当然也不是说从几亿个里面随机,而是我们可能挑一些主题完全不一样的视频,不走后面的模糊匹配,也不走精密计算,从几万个里面随机挑一个给你展现,那这个点击率可能是大盘点击率的1%。
差这么多意味着什么呢?今天如果没有推荐系统,就随机给你分发视频,那你想要找到一个视频的难度至少是现在的 100 倍,而且应该不止 100 倍,因为点击率是1%,播放时长、完播率、点赞率也是变低的。如果你从满意度层面来看,可能是千分之一。
所以说如果没有推荐系统,你基本可以理解你在这个内容极度爆发的时代,面对每天亿级别的内容供给,你是没办法去看内容的。
汉洋:换句话说,如果没有推荐系统,面对亿级的视频,你看的是个平均数,就是中国用户制作视频的平均水平。
风霁:你随便抽一个视频,可能抽到了你们小区一个大爷的怼脸自拍。我不是说这个视频不好,但大概你不太感兴趣。随机推送和有效推送中间的状态,是让人们看一个他大概感兴趣的内容,但是不完全迎合。
分发过程中,有一部分是多目标,鼓励探索你过去没看过的内容,有挺多权重的。它是一个拔河比赛,从长期价值来看,你到底是希望这个系统短期更懂你,还是说长期能够帮你发现新事情?人的需求会变化的,如果我今天只盯着你已有的需求去服务,你未来可能就流失了,所以我们很关注,你在这个平台能不能发现过去未曾看过的观点,没看过的内容、方向甚至题材,我们去不停地探索。
执行层面,也有很多目标为这个服务。我们有一个目标会看跟你差不多画像的用户在搜索什么稿件,他搜索代表推荐系统还没有识别到的,我们会猜他想搜什么,然后把这个视频推荐给你,这个观点和内容可能都是你过去没有接触到的。
我觉得这个事情就是求同存异。人类天然会检索自己偏好的内容,大模型学习的也是这个偏好。但跟人类不一样的是,推荐系统会加很多模块去纠偏这个偏好。长期来说,纠偏对于用户的平台留存是不是一件好事?我理解是个好事,业界应该有共识,做一些兴趣探索的实验,长期留存是正向的,平台没有必要把你锁在“茧房”,平台希望用户能够更 open 看世界。
重轻:我的问题是,技术肯定是滞后的,就是要先出了问题,你才知道。
风霁:我们会尽量前置去考虑问题,很多问题不可能等事情发生。比如说要加一个目标,其实能知道可能带来哪些风险,风险弄好之后才会上线。但是我也不可能 100% 什么问题都看到,有些问题是后置治理,甚至有的不是上线时发生的,而是要很久以后。
比如 2019 年前后上点赞目标,一年之后出了一些视频,你点一个赞,就做个俯卧撑,或者你点个赞,今天就有一天好运,你们应该刷到过这种视频吧,现在看不到这类视频了。当时有一些作者,有些黑灰产、营销号,知道了点赞率高能有流量,他反过来去拉流量,我们只能后置去识别这类视频,把这些无效的用户行为给过滤掉。
还有一个逻辑,是你的竞品优化得更好,更准了,那你要不要做?今天如果不迭代,这个系统就在变差,因为用户有额外的需求。今天是全网亿级视频上传,早十年只有百万量级、千万量级,这么多量级的变化,整个系统要不要演进?10 年前的推荐系统,一定处理不好今天的情况。
重轻:似乎没有一个无为而治、往后退一步的办法,必须得往前走,遇到问题要充分理解问题,然后把它反映在我们的目标设定和函数里面。
风霁:我必须要提出一个观点,就是在我们日常的工作中,会有一个问题叫做,“这个事情为什么是这样,为什么不是更完美的一个状态”。万事万物理论上都是从 0 到1,从 1 到 100 的过程。很多问题不是突然出现的,而是慢慢爬升上来的,一些争议问题,不是新增的,而是过去就有,只是大家的要求比过去更高了,你才觉得它是个问题。
比如我们要求东西更便宜,内容比以前更新颖,“茧房”比以前更窄。推荐系统实际上是更好了,大家可能想象不出 10 年前的推荐系统是什么体验了。从技术层面来说,各家推荐系统一定是在往体验更好的方向走。
重轻:有时候用户想玩“怀旧服”,停留在“大灾变”那个时代的游戏,就是想活在过去。在魔兽世界,我们还真获得过一次怀旧服的感受,那是一个历史性的时刻,一瞬间全世界小时候玩过魔兽世界的人全回去了,90% 以上的人第二次被淘汰,我就是那 90% 的人,然后我才想起来这个游戏所蕴含的东西是什么。
在我玩不到旧版本的时候,我脑海中都是贼美好的事情,我进去以后发现,我要在这么低劣的画面里面杀 500 只野猪,要一只一只的杀,然后回去买面包,只留下最枯燥、最硬核的人才去玩这个东西。
风霁:他是希望他的快乐回到过去,但是他没有考虑到他自己的审美,或者说对快乐阈值的阈值在提高。所以我们说“越长大越孤单”,越难感受到快乐,因为我们小时候感受到的快乐更多。
06
对平台生态和社区价值的伤害,多年后才能观测到
重轻:有非常多叙事,像人心里的伤痕一样,最经典的研究应该是几年前,有科学家搞了 100 多个青少年的社交网络账号,发现很容易收敛到极端减肥跟节食。包括有吹哨人出来,说 Facebook 的算法会鼓动少女进一步增强她们的身材焦虑。如果它足够有利于用户粘性,这些公司还是不吝于去作恶的,这是很多人内心深处对技术最底层的不信任。你怎么看这些事?
风霁:我理解大家的不信任。像这种有一定风险性的内容,一部分是用户上传的,更大比例是灰黑产,有意图去引流的,可能是减肥药,或者非法减肥机构。至少根据我的工作经历上,针对这些灰黑产,我们有一定的治理经验,这对平台也是不利的。
推荐算法最终要围绕用户满意度来建模,需要有一个底线。算法不应该决策,到底 A 观点还是 B 观点对,我觉得推荐不应该负责这个事,平台也不应该负责这个事。但是推荐算法应该管理好底线,符合法律法规和道德约束。
重轻:最后一个问题关于情绪,我感觉情绪是一个最近两年人们开始谈论的议题,之前讲更多的是“misinformation”,虚假的事实,阴谋论、造谣这些,现在是算法在挑动情绪,它不是个实在东西,它只是一个冷和热,或者一个人积极和消极,很难去描述它,它可能是一个很丧的、埋怨社会的,或者是一种特别“社会达尔文主义”,觉得弱者应该去死。这些情绪不是关于事实的判断,在这个情况下就是,推荐算法有意识地去管理、抑制,或者是酝酿、提倡一些特定的社会情绪吗?你有主张吗?
风霁:我觉得这个事,可以认为是一个社区工作,有的社区是鼓励讨论的,有的是鼓励双方来对垒的。在我过去的工作中,我可能更加主张观点接受差异化,但是要就事论事,友善的态度来讨论。
如果一个视频,是以引发争议来获得流量的话,我们会建模这一块的价值,比如评论区都是喷他的,可以通过大模型变成是和否的标签。那这个视频在综合目标里是不占优势的
下一页上一页  (3/5)
回帖(11):
11 # hanxiao129
02-28 14:26
楼主分享非常不错的
10 # hanxiao129
02-28 14:25
了解一下内幕
9 # hanxiao129
02-28 14:24
不错的导读,谢谢楼主分享
8 # z3960
02-28 06:33
了解信息
7 # z3960
02-28 06:33
看看资讯
6 # 任逍遥
02-28 02:11
不错,了解了
5 # 任逍遥
02-28 02:11
也就看看
4 # 任逍遥
02-28 02:11
来看一下
3 # huwg
02-28 01:26
谢谢分享
2 # huwg
02-28 01:26
了解一下

全部回帖(11)»
最新回帖
收藏本帖
发新帖