微软的AI策略

微软的AI策略

作者: Ben Thompson(Stratechery原文: The Nvidia AI PC, Project Solara, Microsoft AI


我通常不会提前透露采访对象,但这周要破例了,因为主题和下面的更新内容关系太大。我是在旧金山写的这篇,刚刚在微软 CEO 萨提亚·纳德拉的 Build 开发者大会主题演讲之后采访了他;一般来说我会想立刻发布采访内容,好让你们有完整的分析背景。

但这次不同——下面这些观点是我在主题演讲期间、在采访之前就形成的,所以出于这个原因(以及一些后勤原因),我想先把它们说清楚(在你看到我的提问之前),之后再跟进纳德拉对这些观点(以及其他许多话题)的看法。

闲话少说,进入正文:


Nvidia AI PC

来自 CNBC

Nvidia 凭借在数据中心 AI 芯片市场的主导地位,已成为全球最有价值的公司。现在,这家公司正将触角延伸到 PC 主处理器芯片领域——这个竞技场长期以来由英特尔、AMD、高通和苹果统治。 在台湾 Computex 大会的主题演讲中,Nvidia CEO 黄仁勋发布了与微软联合打造的新款 PC 处理器。RTX Spark 超级芯片(黄仁勋也称之为 N1X),将于秋季搭载在微软、戴尔、惠普、华硕、联想和微星的全新 Windows PC 产品线上。

我实际上是周日从台北写起的,黄仁勋在那里发布了传闻已久的 Nvidia PC 芯片。来自 Tom’s Hardware

在满配状态下,这颗芯片提供多达 20 个 Arm CPU 核心、一颗拥有 6,144 个 CUDA 核心的 Blackwell GPU、128GB LPDDR5X 内存以及高达 300 GB/s 的内存带宽。强大的 CPU 和 GPU 通过 NVLink C2C 互联,加上巨大的内存池,为 AI 智能体和 1200 亿参数模型提供了充足的算力和空间,据 Nvidia 称可支持长达百万 token 的上下文长度。

我们还没有基准测试数据,但 RTX Spark 看起来和 DGX Spark 大致相当——这是一颗不错的芯片,预填充性能出色,但由于内存带宽较低,解码速度比 M5 Max 慢,CPU 任务性能更是明显落后。

黄仁勋在主题演讲中通过实时视频连线讨论了这颗芯片:

萨提亚·纳德拉: 突然之间,“边缘端无限量智能”这个概念又火起来了。所以 Jensen,也许你可以谈谈你对这个方向的看法——你一直在思考这个问题、谈论这个问题,现在 RTX Spark 真正交付了,我认为这是让 AI 更加无处不在的突破性系统。 黄仁勋: 嗯,这一切始于大约三年前你我之间的一次对话。当时我们在讨论如何打造一类全新的 PC——对设计师和创作者来说堪称惊艳,对人工智能来说同样出色。这种系统不仅拥有处理能力,还有与全球设计软件和创作软件深度整合的软件栈,当然还有我们在 AI 方面做的一切。三年后的今天,我们打造了一颗令人惊叹的新芯片,配合你为 Windows 开发的所有新软件。我们现在有能力在 PC 上运行一个真正的自主智能体了。

这段对话恰好解释了为什么我觉得这颗芯片——乃至 AI PC 整个品类——都相当乏善可陈。三年前我们还处在 ChatGPT 时代,我对本地推理的可能性非常兴奋。然后推理时代(reasoning era)到来了,KV 缓存爆炸式增长(意味着需要更多内存),解码速度的重要性被大幅提升(因为需要生成多得多的 token)。现在我们进入了智能体时代(agentic era),CPU 性能变得至关重要。

因此,本地智能体的理想配置是:强大的本地 CPU + 调用云端进行推理。但 RTX Spark 把大量芯片面积花在了 GPU 核心上——这些核心在算力上不如云端(至少因为内存大小和带宽的差距),却牺牲了 CPU 性能。如果你只是想要一个 2023 年水平的聊天机器人,这颗芯片还行;但在 2026 年,考虑到价格和 Windows on ARM 的软件妥协现实,很难看出它值在哪里。

快进到 Build 主题演讲——开场我觉得非常令人失望。纳德拉简要概述了 AI 堆栈,然后开始谈 Windows,老实说我对那种缺乏愿景和热情的状态相当惊讶。就在那时我恍然大悟:我觉得纳德拉其实和我的观点一致! 当然,一些本地推理不错,但那不是真正重要的 AI 所在的地方。

别忘了,纳德拉对 Windows 没有真正的忠诚。事实上,我把 Windows 时代的终结 归功于他。具体来说,纳德拉没有终结 Windows 这个产品,但他终结了它作为整个公司运转核心原则的地位,转而聚焦于跨平台软件和承载一切的云。

这引出了一个出人意料的结论,也是 Build 主题演讲最有趣的部分:如果微软实际上在 AI 设备领域处于有利位置呢?


Project Solara

来自 GeekWire

微软内部一个团队一直在悄悄打造一个平台——运行 AI 智能体而非应用程序的设备平台。它基于 Android 而非 Windows,目前已有两款可运行的硬件设计,并且已经签下了一批知名企业来进行试点。这个平台代号”Project Solara”,是微软的一个赌注:AI 将开启全新的计算场景——利用智能体来突破传统软件的限制,用现成的组件来快速、低成本地开发新设备。

需要说明的是,Project Solara 目前仍是概念产品(vaporware),尽管微软确实展示了实物设备,并已签下高通和联发科作为芯片合作伙伴。但它确实极具吸引力。以下是纳德拉的引入方式:

到目前为止,我们谈了边缘和云。现有的这些形态,对吧?我是说,我看到 Jensen 周末发的那张照片——他身后摆满了所有台式机——我感觉自己回到了90年代,因为看到我从小到大热爱的那些机器排成一排,真的太酷了,只不过它们现在有了全新的功能——因为板载 AI 能力,对吧?所以这就是我们在笔记本、台式机以及云端看到的情况。 但这也自然引出了下一个问题:如果你有了这种新功能,可以放进现有的形态里,那你能不能为这种新功能专门设计新的形态?能不能为智能体时代打造一个全新的平台?这就是我们今天推出的 Project Solara 背后的动机。

首先注意这个框架:PC 是承载了智能体的旧技术;那由智能体独特赋能的新技术呢? 再注意经典的微软钩子:这种新技术能不能建立在一个新平台之上?微软应用科学组负责人、公司副总裁 Steve Bathiche 阐释了愿景:

在我谈论你们刚才看到的那些酷炫新设备之前,先说说”为什么”。在 Build 2023 上,我谈过外部 AI 应用架构——AI 从应用程序框架内部运行,转变为全局运行,跨多个应用和服务来连接、协调并维护跨整个工作流、设备和时间尺度的上下文。如果有一个专门为这种新型应用架构、为这类智能体、为这种变革性交互技术而设计的设备生态系统呢?这就是 Project Solara 的出发点。 但面对如此多的可能形态,你该选哪一个?下一个设备是什么?我们最大的顿悟是:不是选择某一个特定的形态而是创建一个将你的智能体延伸到一系列设备上的系统。下一台电脑不是一台设备,而是所有这些设备作为一个系统协同工作,智能体在你需要的时间和地点出现。

在 Bathiche 出场前的宣传视频中,有一个短暂的画面让我瞬间理解了这个概念:

可穿戴设备的问题在于交互模型:它们只在你与之交互时才有用——需要人类参与循环(in the loop)——但与可穿戴设备保持互动既烦人又低效。然而这里展示的是一次简短交互,然后智能体在后台工作。换句话说,真正有用的部分发生在云端,不需要人类参与,因为智能体在做这些工作。

这就是我觉得它有吸引力的地方。一方面,你可以说微软当然会对一个以云为平台的设备模式感兴趣——毕竟微软不控制 iPhone 这样的移动设备。但我意识到的是,即使微软在 Project Solara 上不成功,这种模式——云是中枢、多设备是辐条,而不是手机作为中心——对智能体来说显然是更好的。智能体在云端运行效果最好,并且跨应用和设备工作;是的,手机可能是其中一个设备,但在智能体的世界里,它不应该是中枢。

再说一次,这是概念产品,非常符合微软的利益,所以对 Project Solara 请保持适度怀疑。然而,这是一个对未来的愿景,确实很有道理——尤其是在企业场景下,所有的上下文和算力本来就在云端(而 Project Solara 聚焦的正是企业,不是消费者)。它也完全不同于过去的任何东西,契合我的论点:在 AI 时代,瘦就是王道(thin is in)。


微软 AI

来自 GeekWire

微软的 AI 业务在很大程度上建立在 OpenAI 的模型之上,最近又扩展到了 Anthropic。周二,微软展示了它打算如何减少对两者依赖的计划。在 Build 开发者大会上,微软 AI 超级智能团队发布了一系列从零开始构建的七个模型。这是该公司持续推进的一部分努力——在合作伙伴和竞争对手之间利益交错的环境中,建立可信赖的自研替代方案…… 新发布的七个 MAI 模型中的旗舰是 MAI-Thinking-1——一个推理模型。微软称它在盲测人类评估中与 Anthropic 的 Claude Sonnet 4.6 打平,在一个广泛使用的编码基准测试中与更强大的 Claude Opus 4.6 持平。[微软 AI CEO Mustafa] Suleyman 强调,MAI-Thinking-1 是从头训练的——没有从其他公司的模型中蒸馏——以此吸引那些在意数据来源合规性的企业客户。

就能力而言,这些模型看起来还不错。但让我感兴趣的是其定位框架:微软强调企业可以把这些模型变成自己的。Suleyman 说:

这就是端到端拥有完整堆栈的样子。它是微软前沿微调(Microsoft Frontier Tuning)的基础——让你可以在我们的完整堆栈上按你想要的方向定制 MAI 模型。这意味着我们在构建模型过程中投入的严谨而不懈的工程能力,现在通过一个你可以信赖的平台,向你们所有人开放——为你工作,创建你将控制的定制智能体。 过去一年真正发生的大事,是这些 RLE——强化学习环境(Reinforcement Learning Environments)——为你的 AI 打造的专属训练馆。它们创建只为你适配的公司级和任务级智能体,建立在 MAI 模型之上。例如,在微软内部,我们使用 RLE 结合 MAI 模型来优化 Excel 的最佳智能体用例。我们的 MAI 微调模型现在在公开和私有基准测试中与 GPT 5.4 持平,同时成本效率提高了 10 倍。许多其他早期采用者也看到了类似的结果。当我们针对麦肯锡的任务对模型进行微调时,MAI 取得了最高的胜率,甚至超越了 GPT 5.5,而且同样实现了 10 倍的成本效率。所以对我们来说,这就是精心校准的前沿微调的优势。

重要的是,与其他一些公司不同——使用 MAI,你不是从一个为所有人学习的共享模型中租用智能。只有你自己保留你辛苦积累的工作流、专业知识、知识和机构数据的收益。只有你控制生成的模型。所以在我们这里,RLE 和你在其中构建的模型会成为你的护城河。我真的认为这是一个独特的优势。它标志着 AI 的一个新时代,我们都对此非常、非常兴奋。

这和 AWS 的 Nova Forge 服务有异曲同工之处——后者允许企业在预训练的某个检查点加入自己的数据。这里略有不同,更聚焦于强化学习,但这些边界正在模糊。

核心概念是:企业可以拥有自己的模型,用于自己的数据,而不必与那些想吞噬它们午餐的前沿实验室共享。这个概念在理论上当然有吸引力;真正的考验在于,选择这条路的企业是否会因为不在功能最前沿而受到惩罚。话说回来,帮助保守的企业按自己的节奏拥抱未来、而不需要在纯性能上赢——这恰恰是微软长期维持其市场地位的方式。