智东西
作者 | 陈骏达
编辑 | 心缘
智东西6月3日报道,今天凌晨,在微软Build 2026开发者大会上,微软一口气发布了超20项重磅更新,包括9款自研模型、与英伟达合作的全新PC产品、Windows版"龙虾",以及超10款智能体应用和开发工具。
英伟达创始人兼CEO黄仁勋从台北远程连线,深夜和微软董事长兼CEO萨蒂亚·纳德拉(Satya Nadella)纳德拉展开对谈。黄仁勋说,AI基础设施已经进入智能体时代,而微软与英伟达正在共同定义下一代AI计算平台。

纳德拉用一个问题引出微软重磅PC新品——搭载英伟达RTX Spark超级芯片的Surface RTX Spark Dev Box桌面工作站,AI算力达1PFLOPS,本地能跑120B参数的大模型。

除了新型PC外,微软还展示了为多智能体世界而生的两款新型AI硬件:一款是能塞在胸前的AI可穿戴设备,另一款是AI桌面伴侣,主打以低成本、即插即用、随时响应的方式来使用智能体。
值得一提的是,在扶持OpenAI七年后,微软AI超级智能团队终于发力,连推7款自研大模型:首款旗舰推理模型MAI-Thinking-1性能追平Claude Opus 4.6,图像模型MAI-Image-2.5盲测分数超过谷歌的Nano Banana 2。

还有Windows版OpenClaw,现已推出预览版。微软与OpenClaw合作,将OpenClaw与微软MXC结合,帮IT管理员轻松做好智能体安全保护。

一、迷你工作站塞入128GB统一内存,自带"开发者特调版"Win11
微软与英伟达的合作是本次Build大会上的重点。微软本周早些时候推出的Surface Laptop Ultra首发了英伟达RTX Spark超级芯片,预计今年秋天上市。
面向开发者,微软打造了Surface RTX Spark Dev Box。这是一款桌面工作站产品,使用英伟达的RTX Spark超级芯片,拥有1 Petaflop的AI计算能力、20个CPU核心和128GB统一内存,同样将于今年秋天推出。

散热对这类高性能桌面设备尤为关键。Surface RTX Spark Dev Box采用铝制机壳,兼作散热器。
Surface RTX Spark Dev Box自带面向开发者优化的Windows 11,预配置了所有必备开发工具,比如Visual Studio Code、Windows终端内嵌的GitHub Copilot、WSL、PowerShell 7。
其设置也面向开发的需求进行了调整,没有新闻推送,没有弹出的小组件,没有通知,默认采用深色模式。这一设置可通过GitHub上的Windows Developer Config项目一键部署。

安全性方面,Surface RTX Spark Dev Box拥有安全核心PC架构、BitLocker加密和Microsoft Defender防护,并面向企业提供了Entra ID和Intune功能,可实现大规模管理。
二、联手高通、联发科推出参考设计,智能体硬件要直接杀入工作场景
微软全球副总裁、应用科学组负责人Steven Bathiche分享了微软在新型硬件方面的探索——Project Solara,并发布两款硬件参考设计。

Project Solara是一个智能体优先的设备平台,建立在三大基础之上:首先是面向企业级部署的微软设备生态系统;其次是智能体驱动的全新交互模型;最后是扩展能力,允许企业接入自己的智能体。
在Build大会上,微软首次展示了两类参考设备。
第一类是固定式设备。
这是一款面向办公桌场景设计的智能体终端,采用联发科平台,支持Windows Hello企业身份认证。用户走近设备即可完成安全登录,直接访问自己的智能体服务。

与此同时,这一设备还能够与Windows PC和Windows 365云电脑无缝协同,成为现有办公环境的补充。
相比固定设备,第二种形态更加灵活,是一款类似数字工牌的可穿戴设备原型。
这款设备采用高通骁龙平台打造,体积小于传统移动终端。现场演示中,Bathiche通过指纹完成身份验证后,直接调用个人智能体执行任务。他按下录制按钮,设备侧边摄像头开始采集现场画面,并向智能体下达指令:整理Build大会现场素材,生成内容并发送给团队审核。
随后整个流程由智能体自动完成,包括内容收集、整理、归档和分发。

以医疗场景为例,护士佩戴设备后,可以通过语音与智能体实时交互,自动完成病历记录、语音转写、发言人识别以及护理记录整理。同样的能力也适用于零售、制造业、金融服务、法律服务等众多行业。

微软透露,目前已经有多家企业开始参与相关探索,包括Best Buy、CVS Health、Levi’s、Target等公司都在研究如何将智能体设备引入自身业务流程。
纳德拉总结道,Project Solara最重要的意义并不是推出一种新的平台,而是在重新定义了一套平台规则,让开发者和企业能够自由想象智能体应该存在于何处,以及它们将以什么样的形态出现。
三、MAI连发7款自研模型,旗舰推理模型比肩Claude Opus 4.6
本届Build大会上,微软的AI研究部门MAI集中发布了7款新模型,涵盖旗舰推理模型、编程模型、图像生成模型、语音识别模型和语音模型等多个类别。
微软首个推理模型MAI-Thinking-1采用混合专家(MoE)架构,拥有350亿激活参数、大约1万亿和256K上下文窗口。
微软AI CEO Mustafa Suleyman称,在与行业主流模型的对比测试中,MAI-Thinking-1获得了更高的人类评测偏好率。在多个推理基准测试中,其表现达到行业领先水平。
尤其是在软件工程基准SWE-bench Pro上,该模型取得53%的成绩,与Claude Opus 4.6处于同一梯队。

图像模型方面,微软推出了MAI-Image-2.5及其轻量化版本MAI-Image-2.5-Flash。两款模型在图像质量和编辑能力方面实现了突破,MAI-Image-2.5在大模型竞技场图像编辑排行榜中排名第二,超过了多个主流竞争对手。
目前,两款模型已经集成至PowerPoint,并正在向OneDrive推广,同时已在Azure Foundry开放使用。
微软同时发布了新一代语音转录模型MAI-Transcribe-1.5。根据微软公布的数据,该模型支持43种语言,在转录准确率方面达到行业领先水平,并在多项测试中超过现有旗舰模型。
在语音生成领域,微软发布了MAI-Voice 2和MAI-Voice-2-Flash。
MAI-Voice 2支持15种语言,具备更加自然的语调、情感表达以及细粒度控制能力;而Flash版本则重点面向实时语音智能体场景,以更低延迟和更高效率满足企业需求。
微软还推出了专门针对编程任务优化的MAI-Code-1-Flash。
尽管仅拥有50亿参数,但该模型在SWE-bench Pro测试中取得51%的成绩,展现出较高的推理效率。该模型针对VS Code和GitHub Copilot CLI进行了深度优化,能够以更低成本提供接近大型模型的代码生成与推理能力。
除了Azure Foundry之外,微软宣布将把MAI系列模型同步提供给多个第三方AI生态平台,包括OpenRouter、Fireworks AI、Baseten等。开发者未来可以直接在这些平台上获取模型权重并进行个性化微调。
Mustafa还重点介绍了微软在模型与芯片协同设计方面的最新进展。
MAI-Thinking-1已针对微软自研的Maia 200 AI芯片进行了专项优化。MAI-Thinking-1+Maia 200的组合,每瓦性能是英伟达GB200的1.4倍。

微软重点介绍了名为"Frontier Fine-Tuning(前沿微调)"的新能力。微软认为,未来企业竞争的关键不再是使用统一的大模型,而是拥有基于自身数据、工作流程和知识资产训练出来的专属模型。
通过强化学习环境(RLE)和定制训练平台,企业能够持续优化模型,使其更加贴合自身业务场景。微软披露,在内部测试中,经过前沿微调的MAI模型在部分任务上已达到与最新旗舰模型相当的效果,同时实现约10倍的成本效率提升。
四、Windows AI API支持范围拓展,两款自研小语言模型将登陆Windows
纳德拉称,边缘端的算力总量,其实是相当惊人的。如今已有许多AI功能依靠Windows设备的本地AI能力运行,比如Outlook的摘要、PowerPoint超分辨率功能、Adobe的AE、Premiere也都在Windows上利用NPU和GPU进行本地处理。
为了充分挖掘这些计算潜力,微软宣布扩大本地AI推理框架Windows ML和Windows AI API(无需自备模型即可使用的内置AI能力接口)的支持范围。这样一来,任何开发者都能利用设备上已安装的GPU,为本地AI构建应用,并在整个系统环境中流畅运行。



此外,微软还发布了WSL容器,让开发者在本地构建和部署时不会被复杂的环境依赖等问题干扰。其中一个WSL配置文件能在Windows上支持Mac用户熟悉的Starship、Zsh和Homebrew等工具和命令行环境。未来几个月WSL容器将进行公开预览。
五、微软版"龙虾"来了!支持多智能体协作、权限控制
在企业智能体层面,微软发布了Microsoft Scout,这是一款能操作本地设备的智能体,基于OpenClaw框架,适用于Windows和macOS。
Microsoft Scout将本地和云功能整合到一个桌面应用中,拥有独立的身份与个性,可以创建、编辑和搜索文档,能直接加入Teams群组聊天或处理Outlook邮件,并以数字团队成员的身份与人类协作,帮助企业减少繁琐工作并提升效率。

Microsoft Scout内置了用于常见任务的Skill,比如Office操作、网页开发等。
安全性方面,用户可以通过详细的权限系统对Microsoft Scout进行控制,比如启用或禁用特定功能类别、标记敏感文件目录等等。
Microsoft Scout是微软企业级智能体Autopilots中的默认智能体,用户也可在Autopilots中自行创建更多类型的智能体。
六、为Windows版"龙虾"的安全保驾护航
与传统的应用不同,智能体正在采取越来越多自主性的行动。随着它们成为软件系统中的持续参与者,新的控制和信任风险问题也出现了。
为解决这一问题,微软推出了不少新功能和产品。
1、MXC SDK
为了在不限制生产力提升的前提下限制智能体的影响,微软推出了微软执行容器(MXC,Microsoft Execution Container)SDK的早期预览版,这是一个跨平台、策略驱动的Windows和WSL Agent执行层。
开发者定义了在应用和Agent中需要约束的内容,Windows通过MXC在运行时持续执行这些约束。MXC在隔离原语之间提供了抽象层,因此开发者无需管理底层隔离细节。


该技术现已在Windows平台上的OpenClaw中得到应用,使多步骤工作流能够在这些由操作系统强制实施的边界内执行。面向自主智能体的NVIDIA OpenShell安全运行环境,也是基于MXC构建的,并引入了策略管理、推理路由以及个人身份信息(PII)脱敏功能。
2、OpenClaw Windows套件
大会上的一个亮点是适用于OpenClaw的Windows套件。这套系统能长期自主运行,替用户管理邮件、跟踪包裹、处理GitHub任务,甚至管理个人健康数据或自动购买电影票。
微软与OpenClaw团队共同开发了OpenClaw Windows Companion App ,采用WinUI 3界面,可实现权限管理和企业级策略控制。现场演示中,OpenClaw拿到了删除桌面文件的命令,但因为MXC被设置为只读模式,所有操作全被阻止。

3、Windows 365 for Agents
Windows 365 for Agents现已正式发布,它可以将隔离扩展到本地设备之外,让智能体在Intune管理的云PC中运行。
随着MXC集成未来的加入,Windows 365 for Agents将在单一的SDK和政策模型下,从轻量级本地隔离扩展到更多的硬件类型。
4、Agent 365
针对大规模部署智能体的管理需求,微软强调了可观测、可治理与可防护的重要性,并通过今年5月发布的Agent 365作为智能体的管理控制中心。
微软将现有的Entra(身份)、Defender(防御)与Purview(合规)等企业级服务扩展至智能体,确保每个智能体都能以特定身份运行并受到完整保护。
5、MDASH
MDASH是微软打造的多模型智能体安全系统,通过部署超过100个智能体,从数据流、业务逻辑和利用链进行推理,来发现可被利用的漏洞,并结合上下文提供修复建议。该系统直接呈现在Defender Portal中。
七、给智能体配齐全套软件基础设施:托管、上下文、评估全覆盖
在云端,微软也在打造完整的智能体软件基础设施。
1、Foundry智能体托管服务
在云端,微软正在把Foundry打造为完整的智能体应用平台,本月即将全面推出智能体托管服务,提供长期状态管理、自动会话隔离等功能。
他们还与Fireworks AI合作,将后者所有的开放权重模型引入Foundry。
2、Microsoft IQ
智能体时代最大的挑战已经不再是模型本身,而是如何为模型构建高质量上下文。纳德拉认为,未来软件系统的核心问题是让智能体在正确时间获得正确信息。
围绕这一趋势,微软发布了Microsoft IQ,这是一个统一的上下文层,在GitHub Copilot、Microsoft Foundry、Copilot中普遍可用,将智能体构建于世界知识和企业知识中。
Microsoft IQ由四大部分组成:
(1)Web IQ:一个与模型无关、MCP原生的网络搜索栈,可为AI模型和智能体提供即时、可验证的网络数据,包含新闻、图片、视频等等,返回相关段落的速度是次优选择的近2.5倍。Web IQ于今天正式发布。

(3)Fabric IQ:在结构化业务数据之上提供了共享的语义基础。
(4)Foundry IQ:将上述能力串联起来,实现对企业知识与实时互联网信息的统一检索与调度。

微软推出了一套开放的、端到端的信任技术栈,适用于任何框架下的AI智能体体系,并以两个开源项目为核心支撑:ASSERT(Adaptive Spec-driven Scoring for Evaluation and Regression Testing,自适应规范驱动的评估与回归测试评分),用于策略驱动型安全评估;以及智能体控制规范(Agent Control Specification),用于规范在智能体运行闭环中,应在何处、以及如何施加各类控制机制。
八、GitHub Copilot上新应用,提供多模型支持
在开发者工具方面,微软推出了全新的GitHub Copilot应用程序,支持"智能体编程会话"(Agentic coding sessions),开发者能同时启动多个会话来处理不同的问题,并利用技术建立隔离环境,实现多任务平行开发且互不干扰。

为了超越传统聊天界面,微软引入了Canvas(画布)概念,让智能体能建构自定义UI与用户沟通。
针对后端整合,微软推出了Rayfin SDK,让智能体能轻松连接至"后端即服务"(BaaS)与Microsoft Fabric租户,解决开发中常见的身份识别、存储与数据库架构挑战。
微软还官宣了与Replit的合作,Rayfin SDK可以帮助Replit中开发的应用快速部署到Microsoft Fabric租户中。

在前沿科学探索方面,微软发布了新一代量子处理器Majorana 2。这一处理器中包含的量子比特比Majorana 1中的量子比特可靠度高出1000倍,其操作可在微秒尺度上进行,平均寿命为20秒,偶尔甚至超过1分钟。

这种材料的变化导致性能显著提高,这反映在拓扑相改进的鲁棒性中。 这一处理器中,保护拓扑量子比特免受环境噪声和错误影响的拓扑间隙,是以前量子处理器的两倍多。
基于这一进展,微软正在加快实现可扩展、实用的量子计算机的路线图。Agentic AI的助力下,微软预计在2029年实现真正可规模化的量子计算机。
在AI加速科研方面,微软今天发布了Microsoft Discovery,这是一个覆盖完整科研流程的企业级智能体AI平台,药物研发、半导体等行业的企业已在使用。此外,微软还面向更广泛的科研群体发布了免费的Microsoft Discovery本地应用,现已进入预览阶段。
十、面向智能体升级基础设施,自研芯片Cobalt 200虚拟机推出预览版
纳德拉认为,AI时代衡量云基础设施价值的核心指标是"每瓦特每美元能够生成多少Token(Tokens per Watt per Dollar)"。围绕这一目标,微软正在从能源、电力、网络、存储到芯片的每一个环节进行系统级优化。
目前,Azure已经在全球80个区域部署了超过500座数据中心,构成全球覆盖最广的超大规模云网络之一。过去18个月里,微软新增的数据中心容量已经超过Azure创立后第一个十年的总和。

纳德拉详细介绍了代号Fairwater的微软新一代"AI超级工厂"。这一AI超级工厂从零开始面向AI设计,与英伟达深度合作,采用全新的双层架构和三维机架布局,在有限空间内实现更高密度GPU部署。

与此同时,微软还重新设计了供电体系,并优化了冷却系统。Fairwater能够在接近零耗水的状态下运行,其全年平均每日用水量大致只相当于一家普通餐厅。
在硬件层面,微软正在同时推进自研芯片和开放生态两条路线。
微软已经成为首家验证英伟达下一代Vera Rubin平台的云服务商,并持续与AMD合作推进MI300及后续产品。
与此同时,微软自研的Maia AI加速器也在快速推进。纳德拉透露,新一代Maia 200已经在美国爱荷华州投入运行,并计划于今年晚些时候扩展至更多区域。
按照微软内部测试数据,Maia 200相较当前主流GPU可实现约30%的Token/美元性能提升,并已在GPT-5.5上完成验证,未来将用于支撑Microsoft 365 Copilot等核心AI服务。

面向这类工作负载,微软推出了Cobalt 200虚拟机的预览版。Cobalt 200是微软基于Arm架构打造的新一代云端CPU,于去年正式发布。与Cobalt 100相比,这款CPU在云原生工作负载上的性能提升超过50%,智能体响应延迟降低33%,执行速度提升14%,吞吐量提升23%。

Fairwater等AI超级工厂将通过微软全球骨干网络互联,形成一个统一的计算池,实现跨数据中心资源调度和弹性扩展。
结语:微软要给智能体时代铺路架桥
纵观这场两个半小时的发布会,微软正给加速到来的智能体时代打造基础设施并制定规则与标准。如何让智能体更好地使用工具、融入企业既有流程,并最终成为值得信赖的数字同事,是整场Build大会试图回答的关键问题这一。
微软给出的答案是提供一整套从芯片到云、从操作系统到开发框架的垂直整合方案。在模型能力日趋同质化、逐渐走向商品化的背景下,基础设施层的综合能力,正成为影响胜负的关键因素。