微软的 AI 策略

微软的 AI 策略

我通常不会提前透露我的采访对象,但鉴于本次主题和下面的更新,我要破例一次。我正在旧金山撰写这篇文章,之前刚刚采访了微软 CEO Satya Nadella,就在他参加 Build 开发者大会主题演讲 之后;通常我会想立即发布,以便你能完整了解我的分析背景。

不过,这次我在主题演讲期间就形成了下面的观点,而且是在采访之前,因此出于这个原因(以及一些后勤因素),我想先把这些观点阐述清楚(在你看到我的问题之前),然后再跟进 Nadella 对这些观点(以及其他话题)的看法。

话虽如此,进入正题:

NVIDIA AI PC

来自 CNBC 的报道:

Nvidia 已成为全球最有价值的公司,通过主导数据中心人工智能芯片市场。现在,该公司正将其优势扩展到个人电脑主处理器芯片领域,进入长期由 Intel、Advanced Micro Devices、Qualcomm 和 Apple 主导的赛道。

在周一台湾 Computex 大会的主题演讲中,Nvidia CEO Jensen Huang 公布了一款与 Microsoft 共同打造的新 PC 处理器。RTX Spark 超级芯片(Huang 也称之为 N1X)将于秋季在 Microsoft、Dell、HP、ASUS、Lenovo 和 MSI 的全新 Windows PC 产品线上首次亮相。

我实际上是从周日开始在台北报道的,Huang 在 Computex 上介绍了传闻已久的 Nvidia PC 芯片;来自 Tom’s Hardware 的报道:

在满血配置下,这款芯片提供高达 20 个 Arm CPU 核心、一颗配备 6,144 个 CUDA 核心的 Blackwell GPU、128GB LPDDR5X RAM,以及高达 300 GB/s 的内存带宽。这种强大的 CPU 和 GPU 通过 NVLink C2C 互联,加上庞大的统一内存池,为 AI 智能体和 1200 亿参数模型提供了充足的算力和空间,支持长达百万 token 的上下文长度,据 Nvidia 称。

我们目前还没有任何基准测试数据,但 RTX Spark 似乎与 DGX Spark 大致相似。那是一款不错的芯片,在 prefill 阶段表现优秀,但解码速度慢于 M5 Max(主要受限于内存带宽),CPU 任务则明显更慢。

Huang 通过现场视频连线出现在主题演讲中,讨论这款芯片。

Satya Nadella:

突然之间,“边缘端无计量智能”这个概念又变得炙手可热了。也许你可以谈谈这个话题:你一直思考并讨论这个问题,而现在 RTX Spark 真正落地了,我认为这是一个让 AI 变得更加无处不在的突破性系统。但 Jensen,也许你可以分享一下你对未来走向的看法。

Jensen Huang:

这一切大约始于三年前你我之间的一次对话。我们当时讨论如何打造一类全新的 PC——对设计师和创作者而言非常出色,同时也非常适合人工智能。它需要具备强大的处理能力,同时还要有与全球主流设计和创作软件深度集成的软件栈,当然还有我们正在做的所有 AI 相关工作。三年后的今天,我们打造了一颗令人惊叹的新芯片。这套系统得到了你为 Windows 开发的所有新软件的支持。现在,我们终于能够让一个自主智能体在 PC 上运行了。

这段对话解释了为什么我认为这款芯片——以及 AI PC 整体——相当令人失望。三年前我们还处于 ChatGPT 时代的 AI,我对本地推理的可能性非常兴奋。随后进入推理时代,KV cache 爆炸式增长(大幅增加了对内存的需求),并让解码的重要性凸显出来(因为需要生成更多 token)。现在我们已经进入智能体时代,CPU 性能变得极其关键。

因此,本地智能体的理想配置是:强大的本地 CPU 性能 + 需要时调用云端进行推理。然而,RTX Spark 把大量芯片面积花在了 GPU 核心上,这些核心在云端(至少在内存大小和带宽方面)处于劣势,却牺牲了 CPU。如果你只是想要 2023 年左右风格的聊天机器人,这是一款合适的芯片;但在 2026 年,很难看出它值得这个价格——或者值得接受 Windows on ARM 带来的软件妥协。

跳转到 Build 主题演讲,我发现开场非常令人失望。Nadella 先简要概述了 AI 技术栈,然后开始谈论 Windows,我对其中缺乏愿景和热情感到相当惊讶。那一刻我突然意识到:我想 Nadella 其实同意我的看法!当然,一些本地推理是好的,但那并不是重要 AI 未来的落脚点。

请记住,Nadella 对 Windows 并没有真正的忠诚。事实上,我曾把《The End of Windows》归功于他。具体来说,Nadella 并没有终结 Windows 这个产品,但他终结了它作为整个公司运营组织原则的地位,转而聚焦于“到处运行的软件”和“运行一切的云”。

这引出了一个令人惊讶的结论,也是 Build 主题演讲最有趣的部分:如果微软其实非常适合重新进入 AI 设备领域呢?

Project Solara

来自 GeekWire 的报道:

微软内部的一个团队一直在悄然构建一个平台,用于运行 AI 智能体而非传统应用的设备。该平台基于 Android 而非 Windows,目前已有两个可运行的硬件设计,并有首批知名企业签约进行试点。平台名为“Project Solara”,是微软的赌注——AI 将开启全新的计算场景:通过智能体绕过传统软件的限制,并利用现成组件快速、低成本地开发新设备。

Project Solara 目前仍是 vaporware(概念阶段产品),尽管微软展示了真实设备,并已与 Qualcomm 和 MediaTek 签约成为芯片合作伙伴。它也极具吸引力。以下是 Nadella 的介绍:

到目前为止,我们讨论了边缘和云,以及当前的形态因素。我看到 Jensen 周末发布的照片,里面有所有那些台式机,我觉得,伙计,我又回到 90 年代了,对吧?因为再次看到我从小到大喜爱并陪伴我成长的那些机器阵容,真是太酷了,对吧?形态因素相同,但因为机载 AI 能力而拥有了令人难以置信的新功能。所以,这就是我们在笔记本电脑、台式机,当然还有云端看到的情况。

但它也提出了下一个问题:如果你拥有这种新功能的能力,并且可以把它塞进现有形态因素中,你甚至可以为这种新功能量身打造全新的形态因素吗?你能为智能体时代构建一个全新平台吗?这就是 Project Solara 背后的动机……

首先要注意这个框架:PC 是搭载了智能体的旧技术;而由智能体赋能的新技术又是什么?同时注意微软经典的钩子——这种新技术是否可以建立在一个新平台之上?

微软应用科学集团负责人、Corporate Vice President Steve Bathiche 解释了这一愿景:

在谈论你们刚刚看到的那些令人惊叹的新设备之前,让我先说说“为什么”。在 2023 年的 Build 大会上,我曾谈到“外部 AI 应用结构”,即 AI 从在应用框架内运行,转变为在全局运行,跨多个应用和服务工作,在整个工作流、设备和时间尺度上连接、协调并维持上下文。如果有一套专门为这种新型应用结构、为这些智能体、为这种变革性交互技术而设计的设备生态系统,会怎么样?这就是 Project Solara 的推动力。

但面对如此多的可能形态因素,你该如何选择?下一个设备是什么?你看,我们最大的领悟是:这不是要选择某一种特定形态因素,而是要创建一个能让你的智能体延伸到一系列设备上的系统。下一台计算机不是单一设备,而是所有这些设备协同工作的一个系统,智能体会在你需要它们的地点和时间更近地出现。

推广视频中有一个简短的瞬间,让我真正理解了这个概念:

可穿戴设备的问题在于交互模型——它们只有在你与它们交互时才有用,即人类必须在环中。但与可穿戴设备保持在环状态是烦人且低效的。然而,这里展示的是简短交互,然后智能体在后台工作。换句话说,有用性发生在云端,而无需人类持续参与,因为智能体在完成工作。

这就是我认为真正引人注目的地方。一方面,你可以说微软当然会对使用云作为平台的设备模型感兴趣,因为微软不像苹果拥有 iPhone 那样的移动设备控制权。然而,我想到的是:即使微软在 Project Solara 上失败了,这种模型——云是中心,多个设备是辐条,而不是手机处于中心——显然对智能体来说是更好的架构。智能体在云端以及跨应用和设备工作得最好;是的,手机可能是其中一个设备,但当涉及智能体时,它不应该成为中心。

再次强调,这仍是 vaporware,而且非常符合微软的利益,所以对 Project Solara 要持适当的怀疑态度。然而,这是一个对未来的愿景,它确实很有道理,尤其是在企业场景中——所有上下文和算力已经在云端(Project Solara 专注于企业,而非消费级)。它也与过去完全不同,符合我的观点:在 AI 时代,thin is in(轻薄为王)。

Microsoft AI

来自 GeekWire 的报道:

微软的 AI 业务长期以来主要依赖 OpenAI 的模型,最近也扩展到 Anthropic。周二,该公司展示了如何计划减少对这两者的依赖。在 Build 开发者大会上,Microsoft AI Superintelligence Team 公布了一个从头构建的七模型家族。这是该公司持续努力的一部分,旨在为合作伙伴和有竞争性忠诚的对手构建可信的内部替代方案……

这七个新发布的 MAI 模型中,旗舰型号是 MAI-Thinking-1,这是一个推理模型。微软表示,在盲测中它与 Anthropic 的 Claude Sonnet 4.6 持平,并在广泛使用的编码基准测试中与更强大的 Claude Opus 4.6 相当。[Microsoft AI CEO Mustafa] Suleyman 强调,MAI-Thinking-1 是从零开始训练的,没有从其他公司的模型中进行蒸馏,旨在吸引重视数据血统清晰度的企业客户。

这些模型总体来看相当不错,但真正有趣的是框架:微软强调企业可以将这些模型据为己有。Suleyman 表示:

这就是端到端拥有完整技术栈的样子。这是 Microsoft Frontier Tuning 的基础,它允许你使用我们完整的栈爬坡机器,在你想要的地方定制 MAI 模型。这意味着我们构建模型时所投入的严谨且持续的工程努力,现在可以在一个你信任的平台上提供给你,为你工作,创建由你控制的自定义智能体。

当然,过去一年真正重大的事情是这些 RLE(强化学习环境),这些为你的 AI 打造的独特训练场馆。它们能创建仅适应于你、基于 MAI 模型的公司和任务特定智能体。例如,在微软内部,我们将 RLE 与 MAI 模型结合使用,在 Excel 上朝着最佳智能体用例攀登。我们调优后的 MAI 模型在公开和私有基准测试中已与 GPT 5.4 相当,同时成本效率高出 10 倍。许多早期采用者也看到了类似结果。当我们在 McKinsey 的任务上调优模型时,MAI 取得了最高胜率,甚至超过了 GPT 5.5,同时成本效率再次高出 10 倍。所以对我们来说,这就是非常精确校准的前沿调优的优势。

重要的是,与其他一些公司不同,使用 MAI,你不会从一个共享模型中租用智能,而这个模型会从所有人那里学习。只有你能保留自己辛苦积累的工作流、专有技术、知识和机构数据。只有你能控制最终的模型。因此,使用我们的 RLE 和你在其中构建的模型,它们将成为你的护城河。我真的认为这是与众不同的。这标志着 AI 的一个新时代,我们都对此非常、非常兴奋。

这与 AWS 的 Nova Forge 有几分相似,后者允许企业在预训练的某个检查点加入自己的数据;虽然侧重点略有不同(更侧重强化学习),但这些界限正在变得模糊。

这个概念是:企业可以拥有专属于自己数据的模型,而不必与想要吃掉他们午餐的前沿实验室分享。这个想法在理论上当然很有吸引力;真正的考验将是,看看选择这条路线的企业是否会因为不在功能的最前沿而受到惩罚。然而,帮助谨慎的企业以自己的方式拥抱未来,而不一定需要在纯性能上获胜,正是微软长期维持其地位的方式。