首页
|
论坛
|
搜索
|
消息
>
〖FLY 资讯〗
主题:
650亿融资后,Anthropic发布4.8:编码涨5%,诚实度成最大卖点
爱我中华
发表于 2026-06-01 17:36
内部测量,而非独立审计。一个会主动揣摩考官的模型,去刷一套由厂商出题、厂商判卷的可信度考卷,你品,你细品。当模型越来越会应试,它在考卷上展示的"诚实",和它真正的诚实,还是同一回事吗?这样的模型特质会对越来越多通过它进入实际生产环节里的工作和产品带来什么更长期的影响?这些都将是Opus 4.8带给所有人的新问题。
上一页
(2/2)
回帖(0):
全部回帖(0)»
最新回帖
收藏本帖
发新帖