第248章 统一AI算力与通用算力
读一本书,过一段人生。
  林薇正快步走向会议室,手中的平板电脑屏幕上跳动著即將討论的议题。就在刚才,她从晶片团队拿到了一份令她既兴奋又忧虑的报告,章宸的预研小组在动態数据流架构上取得了突破性进展,但与此同时,“悟道”主团队在通用计算能力上的优化却停滯不前。
  推开会议室门,里面已经坐满了人。长桌左侧是晶片设计团队的骨干,右侧是软体架构和算法团队的负责人,正中间坐著云服务事业部的王振宇。这三拨人代表著未来科技计算生態的三个支柱:晶片、软体、云平台。他们平时各自为战,今天被林薇召集到一起,要解决一个根本性问题。
  “人都到齐了,我们开始。”林薇没有寒暄,直接打开投影,“今天只有一个议题:如何统一ai算力与通用算力。”
  屏幕上出现两张架构图。左边是“悟道”系列ai晶片的架构演进,右边是公司另一条產品线“天枢”系列通用伺服器晶片的发展路线。两条线並行发展了三年,各自取得了不俗成绩,但也积累了越来越多的问题。
  林薇调出数据对比表:“我们先看现状。『悟道2.0』在ai训练任务上的能效比达到国际领先水平,但在通用计算任务上,性能只有同工艺通用晶片的60%。反过来,『天枢3.0』在伺服器通用负载上表现出色,但运行ai推理任务时,能效比只有『悟道』的40%。”
  她顿了顿,让这些数字在每个人心中沉淀:“这意味著什么?意味著我们的客户如果要部署完整的ai应用,需要购买两种晶片、搭建两套系统、维护两套软体栈。成本增加、复杂度提升、资源利用率低下。”
  章宸第一个回应:“林总,这个问题我们一直在研究。但ai计算和通用计算本质上需求不同。ai计算大量使用矩阵乘法和卷积运算,需要专用的张量核心和高带宽內存。通用计算则需要灵活的標量计算能力和复杂的控制逻辑。鱼与熊掌难以兼得。”
  “但客户不需要听技术难处,他们只需要解决问题。”林薇冷静回应,“而且,陈总提出的ai本地化计算战略,对晶片提出了新的要求。边缘计算节点需要同时处理ai推理和传统业务逻辑,车载系统需要运行自动驾驶模型和车载娱乐系统,工业网关需要分析传感器数据和管理网络协议……”
  她调出几个具体场景的需求分析:“这些场景都不可能部署两套晶片。要么我们设计出能够兼顾两种计算模式的晶片,要么我们提供能够有效调度异构计算资源的软体方案。而现状是,晶片团队在做晶片,软体团队在做软体,两边缺乏深度协同。”
  会议室里的气氛变得微妙。晶片工程师和软体架构师们交换著眼神,这是典型的技术领域壁垒问题,搞硬体的觉得软体优化不到位,搞软体的觉得硬体设计不合理。
  软体架构负责人李峰推了推眼镜:“林总说得对。我们现在的情况是,每个团队都在自己的领域做到极致,但系统整体效果却不理想。上周我们优化了一个图像识別服务,在『悟道』晶片上推理延迟降低了30%,但整个服务还包含数据预处理、结果后处理、网络通信等环节,这些环节运行在通用晶片上,整体优化效果只有10%。”
  “为什么不把这些环节也放到『悟道』晶片上运行?”王振宇问。
  “因为『悟道』晶片对非ai计算任务不友好。”李峰调出性能分析报告,“我们测试过,同样的数据预处理代码,在『天枢』晶片上运行需要10毫秒,在『悟道』晶片上需要25毫秒。硬体架构决定了软体表现。”
  林薇抓住这个例子:“这正是问题的核心。我们设计的ai晶片为了极致性能,牺牲了通用性。而ai应用从来不是纯粹的ai计算,它一定嵌入在更大的业务系统中。如果晶片不能高效运行整个系统,那么单点的性能突破价值就会大打折扣。”
  她站起身,走到白板前,开始画一个新的架构图:“所以今天,我要提出一个构想:不再区分『ai晶片』和『通用晶片』,而是设计一种『可配置计算阵列』。”