第248章 统一AI算力与通用算力
读一本书,过一段人生。
  会议室里所有人都挺直了腰板。
  “具体来说,”林薇在白板上画出一个模块化结构,“晶片由三种基础单元组成:张量计算单元(tcu)、標量处理单元(spu)、智能调度单元(isu)。tcu专门处理矩阵运算,spu负责通用逻辑和控制流,isu根据任务特性动態分配计算资源。”
  她详细解释:“当一个ai训练任务到来时,isu可以配置大部分资源给tcu,形成类似『悟道』的高性能ai计算阵列。当一个web伺服器任务运行时,isu可以配置大部分资源给spu,形成类似『天枢』的通用计算阵列。而当一个混合任务运行时,isu可以按需分配比例,实现最佳能效比。”
  章宸迅速在笔记本上计算著什么,几分钟后抬起头:“理论上可行,但工程实现难度极大。动態资源配置需要复杂的片上网络和缓存一致性协议,会增加晶片面积和功耗。而且调度算法本身就需要计算资源,可能吃掉一部分性能增益。”
  “所以才需要软体团队和晶片团队深度合作。”林薇看向李峰和章宸,“如果我们能把一部分调度逻辑硬化在晶片里,另一部分软体可配置,是不是可以找到平衡点?”
  李峰思考著:“这需要重新定义指令集和编程模型。传统的cpu指令集和gpu编程模型都不適用,我们需要一种新的抽象层,让开发者既能表达ai计算需求,又能描述通用逻辑,还能指定计算资源的分配策略。”
  “这正是我想推动的。”林薇调出一份预研计划,“我建议成立『统一计算架构』联合项目组,晶片团队、软体团队、算法团队各抽调三分之一的核心人员,全职投入这个项目。”
  她展示项目目標:
  第一阶段(6个月):定义可配置计算阵列的架构规范,完成fpga原型验证
  第二阶段(12个月):设计新的指令集和编程模型,开发编译器原型
  第三阶段(18个月):流片测试晶片,验证完整软体栈
  “这个项目如果成功,”林薇环视会议室,“我们將为整个行业定义下一代计算晶片的標准。不再区分cpu、gpu、ai加速器,而是一个能够根据任务动態重组的智能计算平台。这完全符合陈总ai本地化战略的需求,也是未来科技实现技术领先的关键突破。”
  会议室里陷入了长久的沉默。每个人都在消化这个构想的巨大潜力和同样巨大的挑战。
  王振宇第一个打破沉默:“如果这个项目成功,对云服务意味著什么?”
  “意味著革命性的改变。”林薇调出云服务架构图,“现在的云服务需要为客户提供多种实例类型:通用计算型、內存优化型、gpu加速型等等。如果有了统一计算晶片,我们可以提供『智能算力』实例,客户只需要描述工作负载特性,我们的调度系统自动配置晶片资源,达到最佳性价比。”