AI Jun 6, 2026

微软的 AI 策略

我通常不会提前透露我的采访对象，但鉴于本次主题和下面的更新，我要破例一次。我正在旧金山撰写这篇文章，之前刚刚采访了微软 CEO Satya Nadella，就在他参加 Build 开发者大会主题演讲之后；通常我会想立即发布，以便你能完整了解我的分析背景。

不过，这次我在主题演讲期间就形成了下面的观点，而且是在采访之前，因此出于这个原因（以及一些后勤因素），我想先把这些观点阐述清楚（在你看到我的问题之前），然后再跟进 Nadella 对这些观点（以及其他话题）的看法。

话虽如此，进入正题：

NVIDIA AI PC

来自 CNBC 的报道：

Nvidia 已成为全球最有价值的公司，通过主导数据中心人工智能芯片市场。现在，该公司正将其优势扩展到个人电脑主处理器芯片领域，进入长期由 Intel、Advanced Micro Devices、Qualcomm 和 Apple 主导的赛道。

在周一台湾 Computex 大会的主题演讲中，Nvidia CEO Jensen Huang 公布了一款与 Microsoft 共同打造的新 PC 处理器。RTX Spark 超级芯片（Huang 也称之为 N1X）将于秋季在 Microsoft、Dell、HP、ASUS、Lenovo 和 MSI 的全新 Windows PC 产品线上首次亮相。

我实际上是从周日开始在台北报道的，Huang 在 Computex 上介绍了传闻已久的 Nvidia PC 芯片；来自 Tom’s Hardware 的报道：

在满血配置下，这款芯片提供高达 20 个 Arm CPU 核心、一颗配备 6,144 个 CUDA 核心的 Blackwell GPU、128GB LPDDR5X RAM，以及高达 300 GB/s 的内存带宽。这种强大的 CPU 和 GPU 通过 NVLink C2C 互联，加上庞大的统一内存池，为 AI 智能体和 1200 亿参数模型提供了充足的算力和空间，支持长达百万 token 的上下文长度，据 Nvidia 称。

我们目前还没有任何基准测试数据，但 RTX Spark 似乎与 DGX Spark 大致相似。那是一款不错的芯片，在 prefill 阶段表现优秀，但解码速度慢于 M5 Max（主要受限于内存带宽），CPU 任务则明显更慢。

Huang 通过现场视频连线出现在主题演讲中，讨论这款芯片。

Satya Nadella：

突然之间，“边缘端无计量智能”这个概念又变得炙手可热了。也许你可以谈谈这个话题：你一直思考并讨论这个问题，而现在 RTX Spark 真正落地了，我认为这是一个让 AI 变得更加无处不在的突破性系统。但 Jensen，也许你可以分享一下你对未来走向的看法。

Jensen Huang：

这一切大约始于三年前你我之间的一次对话。我们当时讨论如何打造一类全新的 PC——对设计师和创作者而言非常出色，同时也非常适合人工智能。它需要具备强大的处理能力，同时还要有与全球主流设计和创作软件深度集成的软件栈，当然还有我们正在做的所有 AI 相关工作。三年后的今天，我们打造了一颗令人惊叹的新芯片。这套系统得到了你为 Windows 开发的所有新软件的支持。现在，我们终于能够让一个自主智能体在 PC 上运行了。

这段对话解释了为什么我认为这款芯片——以及 AI PC 整体——相当令人失望。三年前我们还处于 ChatGPT 时代的 AI，我对本地推理的可能性非常兴奋。随后进入推理时代，KV cache 爆炸式增长（大幅增加了对内存的需求），并让解码的重要性凸显出来（因为需要生成更多 token）。现在我们已经进入智能体时代，CPU 性能变得极其关键。

因此，本地智能体的理想配置是：强大的本地 CPU 性能 + 需要时调用云端进行推理。然而，RTX Spark 把大量芯片面积花在了 GPU 核心上，这些核心在云端（至少在内存大小和带宽方面）处于劣势，却牺牲了 CPU。如果你只是想要 2023 年左右风格的聊天机器人，这是一款合适的芯片；但在 2026 年，很难看出它值得这个价格——或者值得接受 Windows on ARM 带来的软件妥协。

跳转到 Build 主题演讲，我发现开场非常令人失望。Nadella 先简要概述了 AI 技术栈，然后开始谈论 Windows，我对其中缺乏愿景和热情感到相当惊讶。那一刻我突然意识到：我想 Nadella 其实同意我的看法！当然，一些本地推理是好的，但那并不是重要 AI 未来的落脚点。

请记住，Nadella 对 Windows 并没有真正的忠诚。事实上，我曾把《The End of Windows》归功于他。具体来说，Nadella 并没有终结 Windows 这个产品，但他终结了它作为整个公司运营组织原则的地位，转而聚焦于“到处运行的软件”和“运行一切的云”。

这引出了一个令人惊讶的结论，也是 Build 主题演讲最有趣的部分：如果微软其实非常适合重新进入 AI 设备领域呢？

Project Solara

来自 GeekWire 的报道：

微软内部的一个团队一直在悄然构建一个平台，用于运行 AI 智能体而非传统应用的设备。该平台基于 Android 而非 Windows，目前已有两个可运行的硬件设计，并有首批知名企业签约进行试点。平台名为“Project Solara”，是微软的赌注——AI 将开启全新的计算场景：通过智能体绕过传统软件的限制，并利用现成组件快速、低成本地开发新设备。

Project Solara 目前仍是 vaporware（概念阶段产品），尽管微软展示了真实设备，并已与 Qualcomm 和 MediaTek 签约成为芯片合作伙伴。它也极具吸引力。以下是 Nadella 的介绍：

到目前为止，我们讨论了边缘和云，以及当前的形态因素。我看到 Jensen 周末发布的照片，里面有所有那些台式机，我觉得，伙计，我又回到 90 年代了，对吧？因为再次看到我从小到大喜爱并陪伴我成长的那些机器阵容，真是太酷了，对吧？形态因素相同，但因为机载 AI 能力而拥有了令人难以置信的新功能。所以，这就是我们在笔记本电脑、台式机，当然还有云端看到的情况。

但它也提出了下一个问题：如果你拥有这种新功能的能力，并且可以把它塞进现有形态因素中，你甚至可以为这种新功能量身打造全新的形态因素吗？你能为智能体时代构建一个全新平台吗？这就是 Project Solara 背后的动机……

首先要注意这个框架：PC 是搭载了智能体的旧技术；而由智能体赋能的新技术又是什么？同时注意微软经典的钩子——这种新技术是否可以建立在一个新平台之上？

微软应用科学集团负责人、Corporate Vice President Steve Bathiche 解释了这一愿景：

在谈论你们刚刚看到的那些令人惊叹的新设备之前，让我先说说“为什么”。在 2023 年的 Build 大会上，我曾谈到“外部 AI 应用结构”，即 AI 从在应用框架内运行，转变为在全局运行，跨多个应用和服务工作，在整个工作流、设备和时间尺度上连接、协调并维持上下文。如果有一套专门为这种新型应用结构、为这些智能体、为这种变革性交互技术而设计的设备生态系统，会怎么样？这就是 Project Solara 的推动力。

但面对如此多的可能形态因素，你该如何选择？下一个设备是什么？你看，我们最大的领悟是：这不是要选择某一种特定形态因素，而是要创建一个能让你的智能体延伸到一系列设备上的系统。下一台计算机不是单一设备，而是所有这些设备协同工作的一个系统，智能体会在你需要它们的地点和时间更近地出现。

推广视频中有一个简短的瞬间，让我真正理解了这个概念：

可穿戴设备的问题在于交互模型——它们只有在你与它们交互时才有用，即人类必须在环中。但与可穿戴设备保持在环状态是烦人且低效的。然而，这里展示的是简短交互，然后智能体在后台工作。换句话说，有用性发生在云端，而无需人类持续参与，因为智能体在完成工作。

这就是我认为真正引人注目的地方。一方面，你可以说微软当然会对使用云作为平台的设备模型感兴趣，因为微软不像苹果拥有 iPhone 那样的移动设备控制权。然而，我想到的是：即使微软在 Project Solara 上失败了，这种模型——云是中心，多个设备是辐条，而不是手机处于中心——显然对智能体来说是更好的架构。智能体在云端以及跨应用和设备工作得最好；是的，手机可能是其中一个设备，但当涉及智能体时，它不应该成为中心。

再次强调，这仍是 vaporware，而且非常符合微软的利益，所以对 Project Solara 要持适当的怀疑态度。然而，这是一个对未来的愿景，它确实很有道理，尤其是在企业场景中——所有上下文和算力已经在云端（Project Solara 专注于企业，而非消费级）。它也与过去完全不同，符合我的观点：在 AI 时代，thin is in（轻薄为王）。

Microsoft AI

来自 GeekWire 的报道：

微软的 AI 业务长期以来主要依赖 OpenAI 的模型，最近也扩展到 Anthropic。周二，该公司展示了如何计划减少对这两者的依赖。在 Build 开发者大会上，Microsoft AI Superintelligence Team 公布了一个从头构建的七模型家族。这是该公司持续努力的一部分，旨在为合作伙伴和有竞争性忠诚的对手构建可信的内部替代方案……

这七个新发布的 MAI 模型中，旗舰型号是 MAI-Thinking-1，这是一个推理模型。微软表示，在盲测中它与 Anthropic 的 Claude Sonnet 4.6 持平，并在广泛使用的编码基准测试中与更强大的 Claude Opus 4.6 相当。[Microsoft AI CEO Mustafa] Suleyman 强调，MAI-Thinking-1 是从零开始训练的，没有从其他公司的模型中进行蒸馏，旨在吸引重视数据血统清晰度的企业客户。

这些模型总体来看相当不错，但真正有趣的是框架：微软强调企业可以将这些模型据为己有。Suleyman 表示：

这就是端到端拥有完整技术栈的样子。这是 Microsoft Frontier Tuning 的基础，它允许你使用我们完整的栈爬坡机器，在你想要的地方定制 MAI 模型。这意味着我们构建模型时所投入的严谨且持续的工程努力，现在可以在一个你信任的平台上提供给你，为你工作，创建由你控制的自定义智能体。

当然，过去一年真正重大的事情是这些 RLE（强化学习环境），这些为你的 AI 打造的独特训练场馆。它们能创建仅适应于你、基于 MAI 模型的公司和任务特定智能体。例如，在微软内部，我们将 RLE 与 MAI 模型结合使用，在 Excel 上朝着最佳智能体用例攀登。我们调优后的 MAI 模型在公开和私有基准测试中已与 GPT 5.4 相当，同时成本效率高出 10 倍。许多早期采用者也看到了类似结果。当我们在 McKinsey 的任务上调优模型时，MAI 取得了最高胜率，甚至超过了 GPT 5.5，同时成本效率再次高出 10 倍。所以对我们来说，这就是非常精确校准的前沿调优的优势。

重要的是，与其他一些公司不同，使用 MAI，你不会从一个共享模型中租用智能，而这个模型会从所有人那里学习。只有你能保留自己辛苦积累的工作流、专有技术、知识和机构数据。只有你能控制最终的模型。因此，使用我们的 RLE 和你在其中构建的模型，它们将成为你的护城河。我真的认为这是与众不同的。这标志着 AI 的一个新时代，我们都对此非常、非常兴奋。

这与 AWS 的 Nova Forge 有几分相似，后者允许企业在预训练的某个检查点加入自己的数据；虽然侧重点略有不同（更侧重强化学习），但这些界限正在变得模糊。

这个概念是：企业可以拥有专属于自己数据的模型，而不必与想要吃掉他们午餐的前沿实验室分享。这个想法在理论上当然很有吸引力；真正的考验将是，看看选择这条路线的企业是否会因为不在功能的最前沿而受到惩罚。然而，帮助谨慎的企业以自己的方式拥抱未来，而不一定需要在纯性能上获胜，正是微软长期维持其地位的方式。