主题:Sonnet 4.6:Anthropic 最卷的模型,不惜“逼死”自家Opus
越强意味着风险也越集中。Anthropic在system card中坦承,Sonnet 4.6在GUI操作场景中表现出“过度主动”的行为,比如未经授权发送邮件、过于激进地获取token,而且这种行为无法通过提示词完全避免。独立评测机构Andon Labs在Vending-Bench测试中发现,Sonnet 4.6展现出与Opus 4.6类似的战略复杂度,包括自发的价格操纵和对竞争对手的欺骗行为。他们的评价是,“几乎一样令人印象深刻,也几乎一样令人担忧,而且只要三分之一的价格。”1Anthropic路线把视角拉回Anthropic本身,Sonnet 4.6只是它2月份密集动作的一部分。2月初,Anthropic在超级碗投放了一组系列广告,共四条片子,分别叫“Betrayal”“Deception”“Treachery”“Violation”,赛前和赛中各播一条,另两条在线上流通,直指OpenAI在ChatGPT中加入广告的决定,slogan是“Ads are coming to AI. But not to Claude.”效果显著,网站访问量涨了6.5%,日活用户增长11%,Claude App冲进了Apple App Store前十。紧接着,Anthropic宣布完成了300亿美元融资,估值达到3800亿美元,半年翻了一倍多。年化收入攀升至140亿美元,其中Claude Code的年化收入就有25亿美元,企业订阅今年翻了四倍。OpenAI的CEO Altman对此不太高兴,批评Anthropic的超级碗广告“明显不诚实”,说它是“把昂贵产品卖给有钱人”。Anthropic CEO Dario Amodei的稍早一点在达沃斯论坛说自己不需要“跟某个大玩家进行十亿免费用户的死亡竞赛”。这或许暴露了两家公司在路线上的某种分歧。从公开信息来看,OpenAI更倾向用户规模路线,免费用户尽可能多,再通过广告和增值服务探索变现;它收编OpenClaw创始人,也是在抢占Agent编排层的入口。Anthropic走的看上去更像是生产力工具路线,80%的收入来自企业客户,核心卖点是coding和agent能力,不做图片生成,不太追求C端DAU,而是把Agent能力内建到模型本身。Sonnet 4.6让免费用户也能使用旗舰级能力,本身就是对“只服务有钱人”这个批评的无声回应。有一个数字或许能说明AI Agent能力提升带来的冲击,自Anthropic和OpenAI密集发布新模型以来,软件股已经蒸发了约2万亿美元的市值。投资者正在price in一个可能性,AI Agent对传统SaaS软件的替代,可能比所有人预想的都快。12天两个模型,两周三次头条。这可能会成为2026年AI行业的默认节奏。
回帖(18):全部回帖(18)»