困在“大型机”里的AI产业

大型机一定程度上代表着计算机产业的巅峰,当年IBM的大型机如此,今天NVIDIA的“AI大型机”亦如此。这些雄伟壮观的机器是人类最顶尖科技的结晶,数不清的高精度零部件极其精密地组装在一起,形成一个有机的整体,把计算机产业和AI带到了空前的高度,也进一步推动和孕育着人类最顶尖的AI模型。

 

半导体领域激烈地探讨着Scale-Up网络的实现路径、互联的光电之争、Switch Tray和Compute Tray的组织搭配方式、高密度机柜的供电散热方案。AI领域同样激烈地探讨着Scaling Law能否持续、深度推理能否延续Scaling Law、Token成本如何指数级下降、各类应用华丽的demo和伟大的愿景。全世界都在密切关注着OpenAI不断预热的一次次发布会和NVidia的股价。甚至连ASIC设计服务都拿出来当作一种叙事模式,凡此种种构成了今天最热闹的AI产业,也编织成了一个以AI Factory支撑大模型提供通用AI能力改造全行业的宏伟蓝图。

 

此情此景,与上个世纪计算机产业革命一样蔚为壮观。上个世纪的60年代的IBM System/360几乎奠定了现代计算机形态和操作系统的基础,几乎奠定了今天习以为常的很多行业标准,包括8位的Byte,标准化了计算机的规格参数,奠定了软件系统兼容性的可能性以及各种外设的可扩展性,推动了定制计算机到兼容计算机的巨大转变,随后到70年代推出的System/370在System/360的基础上进一步发展成熟,引入虚拟内存等重要设计。除此之外,在性能和可靠性上也达到了当时技术的巅峰,推动了计算机在大型企业的各种复杂场景的商用落地。

 

IBM System/370

 

与此同时也是各种半导体技术的升级迭代,从真空管到晶体管再到大规模集成电路,从磁芯存储器到半导体DRAM,无论是半导体技术还是计算机架构的解耦合设计都是极其领先的。后面的System/390系列以及2000年开启的IBM z系列,延续至今已经到z16了,z17芯片也出来了,不过信息还非常有限。z17系统支持16个Socket、256个Core、64TB的统一内存、192个PCIe扩展槽,甚至还有2.88GB的虚拟L4缓存,除了核的数量在疯狂堆核的今天毫不起眼,但其他的指标要做到全局的一致性和高可靠性以及极低延迟,放在今天都是怪兽级的难度,技术上无可挑剔。

 

当然,后面四十多年,真正用计算机技术改变了全世界的,是下面这颗,x86的始祖8086。麻雀虽小但五脏俱全,和同时代的大型机相比,规格小得可怜,当时的System/370可以支持16MB的内存,而8086大约只有64KB左右差了好几个数量级,IO、可靠性的差异更是天差地别。但类似虚拟内存这一类在System\370中才引入的机制,也在8086演进了2代之后,在80286中就引入了。x86催生了整个PC产业和互联网产业的繁荣,让信息技术真正意义上进入并重塑了整个人类社会。

 

Intel 8086

早期x86处理器的PC

 

核心原因在于用普惠的价格让当时计算机巅峰塑造的体验带到了消费级市场。首个PC具有16KB内存,同时具备了彩色图像能力、键盘等诸多外设,只需要1565美金,相比之下,IBM当时的大型机售价往往在几十万美金到几百万美金,在这之前IBM最便宜的计算机型号也需要1万美金。

 

从80年代开始掀起了轰轰烈烈的PC产业革命,整个PC产业一方面是软件行业从此成为一个独立的行业,也催生了整个计算机产业形态从纵向的解决方案模式转向了水平的分层产业模式。

 

《Only the Paranoid Survive》

 

半导体层面也一样掀起了一波把大型机和工作站中能够享受到的体验通过重新发明芯片形态带到消费级价位的浪潮,这其中最重要的参与者也包括以NVidia为代表的3D图形体验。

 

这不单纯是半导体技术用更便宜的价格实现类似的性能,而是软硬件边界的重新划分。x86也好,消费级3D图形显卡也好,本身不是什么半导体的黑科技,甚至在当时大型机、工作站所采用的半导体技术几乎是当时的巅峰水平。x86体系本身放弃了可靠性的极致追求,放弃了极致IO的追求,但把System/360奠定的一个现代计算机和操作系统形态必备的各种特性都支持了,从而将现代计算机的极致体验带到了消费级价位,促成了PC产业和互联网产业的高度繁荣。

 

产业结构和成本模型不只是单纯的Token/$,还包括边际成本还是固定成本,成本的转移。PC产业形态和互联网产业形态都是在消费级价位的计算机激活的商业模式的伟大发明,进一步推动了产业结构和成本模型的变迁。

 

今天的大模型商业落地都在寻找高价值场景,追求ROI。但互联网和PC的逻辑是让包括低价值场景都用最好的信息技术体验,核心在于成本模型的演化。

 

互联网的核心商业逻辑在于流量变现,羊毛出在猪身上。互联网应用覆盖的很多都是根本不会花钱干的事情,免费和付费是有本质区别的,就像用AI帮我点一杯咖啡这件事情,无论Token/$降低到多少,都很难让大量用户为这样的需求付费,因为这是典型的低价值场景,用户甚至没有迫切的需求需要这样的体验。但互联网的逻辑是把这样的事情变成免费,让用户零边际成本进入这个场景,连这种没有需求的低价值场景都要用AI试一试来偷那么一点懒,才能占领用户的消费娱乐习惯,占领用户注意力,最后再把成本转移到这杯咖啡上。这和今天追求高价值,寻找高ROI的大模型落地是截然不同的。

 

互联网的商业逻辑本质上对应的是一个极其奢侈的产业形态,用最顶尖的计算机和芯片,处理全社会海量细碎低价值的场景,但反过来,也才是真正技术平权,用顶尖的半导体和计算机技术服务人类社会的方方面面,并且彻底改造了人类社会的运作方式。但前提条件是猪身上的羊毛能够支撑得起互联网数据中心的巨大固定成本和服务每个用户细碎场景的边际成本。这也是Google当年用一大堆非常便宜的垃圾x86机器构建了服务全球的搜索引擎并且还能商业闭环的基础,如果建立在昂贵的大型机上来处理海量的请求,是很难依靠广告支撑服务全球搜索业务的高昂成本的,今天的大模型同样如此。

 

当然乐观地讲,今天最乐观的技术降本都很难想象一个最终让所有人都能极其“奢侈”地零边际成本用顶配的大模型技术处理所有琐碎的事情的产业形态,高价值场景仍然是今天这个行业的从业者的主要追求。但促成技术平权和普惠的不只有技术层面降本,也包含了商业模式带来的巨大降本空间。

 

PC产业的核心在于把信息技术和大模型体验的边际成本转移成消费者采购顶配电脑的固定成本。让消费者可以零边际成本享受信息技术以及人工智能的成果,同样也可以让消费者从一个应用软件到另一个应用软件的迁移也是零边际成本。放到过去买了顶配的电脑可以用Office套件办公,相比打字机的投入可能不相上下,但再去体验上网、打游戏的时候,是完全零边际成本的。放到今天大模型时代,例如为AI编程买了顶配的电脑之后,再去享受AI写作、AI绘画时,不再增加额外的订阅费。

 

对应用开发是一样的,今天的大模型应用都需要考虑提供大模型服务的边际成本,需要通过订阅费的形式实现收支平衡。但PC时代的游戏开发者是不需要为游戏玩家的画质支付边际成本的,一个3A大作无论卖100万份还是卖1000万份,都是零边际成本。虽然今天PC上也有很多收订阅费的软件,但这部分订阅费基本是应用开发者的纯利润。同样,PC产业形态还降低了应用开发的门槛,当应用的起步门槛就包含了搭建大模型服务的一次性成本和未来的边际成本时,那么开发和运营一款应用的资金投入门槛就会很高,反过来使得应用开发的试错数量变得更少。相反如果今天的应用开发变成纯软件,免去了大模型服务的建设成本转而由应用使用者自己的顶配硬件提供,个人开发者就成为可能,使得开发应用的门槛可以降低到几乎所有人都有机会进入。当然,PC的前提是转移的固定成本是消费级可接受的价位,最好的体验。大型机有最好的体验,但价位直接与消费级绝缘。

 

以上两种产业形态都是由x86体系提供的可能性,当然x86本身因为历史的机缘巧合形成了一个高度开放的组装机体系,也促成了这样一个计算机体系可以几乎零边际成本的适应更多细分行业中,根据行业的需求配置和扩展,而不像大型机需要为不同类型的行业打造不同的型号,门槛低到普通消费者都可以“撺机”,从而使得这样一个凝结了人类顶尖技术的计算机走进人类社会的几乎所有行业。

 

一切都事关边际成本以及成本转移的必要条件。实际上今天的产业不是卡在具体的半导体技术、芯片技术的成本问题上,而是困在了逐渐大型机化的计算机形态中,很多可以促成全社会极其“奢侈”地享受大模型的带来的体验的产业模式创新都缺少基础的条件。

 

大型机化的AI计算机确实有效推动了AI算法不断走向全新的高度,正如当年大型机的巅峰之作System/360、System/370为整个计算机系统架构奠定了极其可扩展的基础。但大型机化的计算机形态也在不断推高进入大模型的起步门槛,让十几万的服务器一点点变成几百万,并逐渐走向上千万,最终向着数十亿的AI工厂形态一骑绝尘,但也把广大从业者推到了门外。

 

高昂的起步门槛逐渐让最近火热的博通ASIC设计服务这种几十亿起步门槛的事情也变成某种意义上的一个选项。这并不是一个更好的叙事,而是一个起步门槛直接奔向几十亿的糟糕叙事,只不过在逐渐大型机化的AI基础设施形态的承托下也变得不是那么不可接受,让越来越多云厂商开始尝试自研芯片。博通可以从中赚的盆满钵满,云厂商未必能从中获得真正的收益,无非是在一个差和更差的选择中取舍。从整个AI产业而言,这是一个起步门槛更加糟糕的选择,与我们所期望的类似繁荣的PC和互联网产业所需要的极低的起步门槛可以说是南辕北辙。

 

我一直相信也希望推动在大模型时代类似x86组装机体系促成的今天AI时代的PC与互联网产业的兴起,也希望有识之士加入行云一起推动这样的未来。

创建时间:2025-06-18 17:49
首页    困在“大型机”里的AI产业