主题:刚刚,Windows「梦中神机」来了,把你的 PC 变成 Agent 工位
微软和 OpenAI 的蜜月期,曾经是整个 AI 行业最重要的联盟。
一方握着模型,另一方手握云服务、办公软件、开发者工具和企业客户,双方互相成就,几乎让微软在 AI 时代提前拿到一张头等舱门票。但即便联盟再紧密,微软也不能永远把最关键的 AI 想象力寄托在别人身上。
尤其是在双方关系开始脱钩之后。
刚刚召开的 Build 2026 因此变成一场特殊的发布会。微软比以往任何时候都需要一场酣畅淋漓的 AI 胜利,向外界证明自己究竟是 AI 时代的主角,还是依旧只是 OpenAI 的云服务商?
从 MAI 模型、Azure AI Foundry、到量子计算以及本地智能体能力,再加上黄仁勋和龙虾之父的相继站台,微软展示了一整套覆盖开发、模型、数据、算力和治理的完整生态,其目标也很清晰:将 AI 从 OpenAI 主导的模型红利,转变为微软主导的平台生意。
微软自研模型发布, MAI 补上 AI 供应链最关键一环
相比去年,微软这次把模型放在了更重要的位置。微软 CEO 纳德拉称,Microsoft Foundry 目前已有超过 11000 个模型,覆盖 OpenAI、Anthropic 和微软自研 MAI 模型。
微软的判断是,企业和开发者不会只依赖一个模型完成所有任务。不同任务会对应不同模型,也会受到延迟、成本和能力边界的约束。因此,模型目录、模型选择、运行环境和企业治理,会一起构成新的平台竞争点。
今天,微软自研模型家族正式一口气推出了七款新模型,覆盖推理、代码、图像、语音和转录等方向。
MAI Thinking 1 是其中的推理模型。它采用稀疏 MoE 架构,35B active 参数,总参数规模约 1T,支持 256K token 上下文,足以容纳大约 600 页文档。
微软 AI 负责人穆斯塔法·苏莱曼强调,这个模型没有使用第三方模型蒸馏,训练数据来自干净且合规授权的数据,并在预训练中排除了 AI 生成内容。它已在 Microsoft Foundry 私有预览,之后会进入 MAI Playground 公测。
代码模型 MAI Code 1 Flash 面向日常开发工作流。它由微软端到端训练,使用干净且合规授权的数据,正在向 Visual Studio Code 中的 GitHub Copilot 个人用户推出,入口包括模型选择器和默认自动选择器。
微软称,这个模型针对 GitHub Copilot harness 做了训练和适配,支持 Agentic coding,也支持 adaptive thinking。简单请求保持简洁,复杂任务会投入更多推理预算。
微软把 MAI Code 1 Flash 直接拿来和 Claude Haiku 4.5 比较。
MAI Code 1 Flash 在 SWE Bench Pro 上达到 51.2%,高于 Claude Haiku 4.5 的 35.2%;在 IF Bench 精确指令跟随上领先 28.9 分,在 Advanced IF 上领先 14.5 分。它将支撑微软 GitHub Copilot 的常见编码场景,尤其是代码修改、多轮指令和真实开发环境里的 Agent 任务。 图像和语音模型也被纳入 MAI 体系。
MAI Image 2.5 和 Flash 版本支持文本生成图像和图像编辑,已经进入 PowerPoint,并会扩展到 OneDrive 和 Foundry。
MAI Transcribe 1.5 支持 43 种语言,微软称其速度达到竞品 5 倍,正在集成到 GitHub、Teams、Copilot 和 Dynamics 365 Contact Center。
MAI Voice 2 支持 15 种语言,可通过短样本适配声音,同时内置防滥用保护;低成本版本 MAI Voice 2 Flash 也在计划中。
微软还把 MAI 模型和自己的芯片联系起来。MAI Thinking 1 已针对 Maia 200 优化,端到端运行 MAI 模型时,还能获得 1.4 倍每瓦性能提升。
企业定制也是 MAI 模型的重要方向。未来所有企业不仅会调用模型,也会把自己的流程训练进模型。
为此,微软还发布了 Microsoft Frontier Tuning,核心是 reinforcement learning environments。企业可以把真实工作轨迹、任务步骤、决策、工具调用和评价标准变成训练环境,让模型学习组织内部的工作方式。
PC 变成 Agent 工位,你的桌面就是数据中心
除了模型,微软也把重点转向本地算力。
Surface RTX Spark Dev Box 是这部分最值得一提的产品。纳德拉把它称为面向开发者的「dream machine(梦中神机)」。这台设备提供 1 petaflop AI 算力、20 个 CPU 核心和 128GB 统一内存,计划在今年秋季推出。
Surface RTX Spark Dev Box 基于 Nvidia RTX Spark 平台。正如 APPSO 前几天所报道的,RTX Spark 是面向 PC 的下一代 SoC,把 CPU、GPU 和 AI 能力整合到一颗芯片中,并支持统一内存架构和集成 DRTM。
英伟达 CEO 黄仁勋在视频连线中表示,PC 正在从个人电脑走向个人 AI。他举例称:用户外出时,可以给自己的 PC 发消息,让本地 Agent 调用工具、修改代码、推进设计,再和用户继续迭代。
PC 不再只是一个被人操作的工具,也开始变成可以持续运行任务的 AI 助手。
此外,微软还为 Surface RTX Spark Dev Box 预装开发优化的 Windows 11 Pro,内置 VS Code、WSL、PowerShell 7、GitHub Copilot、Coreutils for Windows 等工具。
现场演示中,这台设备默认没有新闻流、组件弹窗和通知,使用深色模式;Windows Insider 版本还加入了纵向任务栏,不仅开发工具被进一步系统化,命令行和容器体验也更接近 Linux。
硬件上,它采用阳极氧化铝 3D 打印一体机身,拥有 1000 个通风孔,热设计功耗 100W,接口包括 USB-C、USB-A、HDMI、以太网和耳机接口。
Windows 将在 AI 时代大有作为。本地 AI 要让 PC 成为 Agent 工作流的一部分:开发者可以在本地调试、运行模型、调用工具、看日志、开容器、跑子 Agent,再把更大规模任务交给云端。
Agent 需要新入口,微软探路下一代 AI 终端
相比 Surface RTX Spark Dev Box 面向开发者,Project Solara 更像微软对 Agent 设备形态的提前试探。下一台计算机不会只是一台设备,而是一组协同工作的设备。
微软展示了两类参考设备。
第一类是固定在桌面上的工作终端,基于联发科芯片。
用户走近后,系统会安全识别身份,并让用户进入自己的 Agent 工作环境,访问基于 Work IQ 的 Microsoft 365 Copilot。
它可以显示当天重要事项,也支持点按或语音交给 Agent 处理任务,还能作为 Windows PC 伴侣,或通过 Windows 365 接入 Cloud PC。它更像企业办公桌上的 Agent 控制终端,负责身份识别、任务提醒、语音交互、Copilot 调用和 Cloud PC 接入。
第二类是可佩戴数字工牌,使用 Qualcomm 可穿戴芯片,面向移动工作场景。
演示中,用户通过指纹解锁后,要求 Copilot 为社交媒体帖子收集现场素材。工牌负责拍摄画面,Agent 负责挑选镜头、清理画面,并发送给本人和团队审阅。发布会还展示了医疗场景:护士可用它进行免提语音记录、区分说话人、核验生命体征、扫描药物并验证护理流程。
这两类设备只是参考形态。
手机和 PC 仍然重要,但一些工作场景需要更靠近人、空间和传感器的硬件。面对未来的 Agent 时代,企业可以更换 Agent,调整外观、屏幕、传感器和输入方式,在同一硬件和软件基础上适配不同垂直行业。
龙虾之父站台,微软给个人 Agent 加上企业护栏
Surface RTX Spark Dev Box 讲的是本地算力,Project Solara 讲的是新设备形态,OpenClaw on Windows 则把焦点转到个人 Agent 如何安全进入企业。
微软展示了适用于 OpenClaw 的 Windows 套件,可以帮助用户设置自己的 OpenClaw,或连接已经托管在 Windows 和 WSL 中的 OpenClaw。
应用里可以查看 gateway、参与 OpenClaw 的其他机器、会话和使用情况,也能快速进入 chat、
回帖(6):全部回帖(6)»