芯泽芯
销售服务热线

13534090549

芯泽芯

浅析AI芯片性能乱象 AI芯片=DSP+DSP+……+DSP?

2022-06-28

      所谓人工智能,根据1956年达特茅斯会议的定义,就是“让机器行为看起来就像是人所表现出来的智能行为一样”。不过虽然这句话理解起来很简单,想真正实现却非常困难。在人工智能的发展过程中,逐渐划分出两个发展阶段:强人工智能和弱人工智能。
  强人工智能是属于人类级别的人工智能,机器拥有思维和意识,可以实现自我推理和自主决策。弱人工智能则是指机器擅长于处理单一方面的问题,但并没有真正的思维和意识。由于弱人工智能发展程度并没有达到模拟人脑思维的程度,所以弱人工智能仍然属于“工具”的范畴,与传统的“产品”在本质上并无区别。
  目前整个业界所研发的全部人工智能产品,甚至是AlphaGo,都仅限于弱人工智能这个阶段,许多打着各种幌子的“伪”人工智能也一并充斥在这片红海中。与此同时,作为人工智能的硬件基础,AI芯片也在短短的一年之内“满山鲜花开满坡”。
  向上看,有谷歌TPU和NVIDIAGPU这样的巨无霸,不是下棋就是开汽车,一个萝卜一个坑的占着几个摊子。向下看,有各大移动SoC厂商的AI芯片,输了体积不输阵,也都是规格明码标价,性能头头是道。
  然而,“你不觉得AI芯片是个伪概念吗?”这样的疑问却从一位AI芯片从业者口中说出,“从半导体圈子的人来看,AI芯片概念比较怪,定义也非常宽泛。你做机器学习也是AI芯片,做深度学习也是AI芯片,做某几种特定算法也是AI芯片。”
  的确,对于目前这些AI芯片的功能,各家确实都少有明确的描述,基本上都是一句“AI任务”带过。
  不明所以的‘AI任务’
  这“AI任务”到底是个啥?一番细看之下,原来大多数所谓的“AI任务”指的都是视频、音频、图像处理这些方面。这些都是非常传统的需求,而且也都有专用处理器来应对,音视频处理有DSP,图像处理有ISP。
  其实无论是视频音频还是图像处理,这些工作都可以在CPU上完成。之所以专门设计DSP芯片和ISP芯片,是因为它们处理这些任务的效率比CPU高出许多。同样的,如果全新的AI芯片能比传统DSP和ISP更加高效,那在处理器中加入AI芯片的同时,我们理应看到DSP和ISP从现有芯片组成中消失才对。
  在高通官网的骁龙845介绍中,“可提供更丰富的拍摄、语音、XR和游戏体验”的人工智能平台,依然被高通明确的归结在HexagonDSP下,说明现在各家AI芯片所宣传的这些功能,并未达到真正意义上AI所在的层次,只是对既有需求的扩展而已。
  人工智能平台依然被高通明确的归结在HexagonDSP下
  坊间有过这样的传闻,说有一家公司出了款AI芯片,但实际上只是几颗传统DSP(数字信号处理器)芯片的组合,再加上一些软件层面的修改。
  对于这条传言的由来,我们无据可考,虽然高通现如今将HexagonDSP作为支撑AI的基石,看起来这种说法好像也有几分道理,但也不能排除这只是“同行是冤家”所引起的非议。而且图灵老爷子于1950年提出的图灵测试,针对的是一个AI系统的整体表现,对于AI硬件的测试,目前市面上尚没有专业的通用测试标准。
  不过在前不久,鲁大师在其评测软件中添加了一套AI性能评测,同时支持海思麒麟的HiAI和高通的SNPE框架,也支持在CPU上运行TensorFlow推断库。这套AI测试包含了三种不同的神经网络模型:VGG16,InceptionV3以及ResNet34,输入的测试数据是ImageNet数据库中的100张图片。
  鲁大师AI性能评测
  国外知名媒体Anandtech选择了使用麒麟960的华为Mate9、使用麒麟970的华为Mate10Pro、使用骁龙835的谷歌Pixel2XL和LGV30四款手机,分别测试了ARMCPU、HexagonDSP和NPU的AI性能,测试结果以性能(fps)和效能(mJ/inference)双重指标来衡量。
  我们首先注意到的一个结果是,NPU和CPU在处理AI运算时的性能有着几十倍的巨大差异。这些算法在CPU上执行的速度最高不过2fps,同时还会消耗掉大量的电能。无论是骁龙835还是麒麟960的CPU平均功耗都已经超过可持续工作的上限。
  作为对比,骁龙835的HexagonDSP相比CPU约有8~10倍的性能提升,而麒麟970的NPU性能又可达到HexagonDSP的1.5倍~4倍。不过在能耗比方面,虽然华为NPU相比CPU有着巨大到已经不在一个次元的优势,但我们也很惊讶的看到,骁龙835的HexagonDSP的综合效率落后麒麟970的NPU仅6%左右。
  Anandtech的测试结果
  虽然鲁大师不管在PC和手机端,都素有“娱乐大师”这样一个不怎么好听的绰号,单单这三个测试项也无法代表麒麟970的NPU的全部性能,但我想鲁大师应该无意在目前的AI测试中对谁有所偏重,软件中所选择的这三个测试项目应该是比较常见且通用的。毕竟现阶段的安卓阵营里,宣称有AI加速能力的也就只有骁龙835/845和华为麒麟970而已。
  我们知道,AI芯片在美国要经过严苛的NSF认证:“要让DNN(深度神经网络算法)计算功耗比提升1000倍的芯片”,这也许是高通依然将人工智能平台归结在HexagonDSP下的原因之一吧。
  瑞芯微自曝的RK3399Pro成绩颇为惊人
  我在之前的文章里也曾经说过,目前绝大部分AI芯片,都是厂商对AI大潮反应过激的产物,好像如果名字里没有AI,都不好意思在江湖上报号。那个坊间传闻,虽然并没有任何实锤,但也许真的是目前AI芯片领域现状的映射。
  想要在量子计算时代到来前,在传统半导体工业中实现真正的强人工智能,除了要进行大刀阔斧的芯片架构研发,还要引进新的电子元器件——忆阻。其实这东西说新也不新,忆阻是除电阻、电容、电感之外的第四大电路元件,早在1971年,任教于美国的柏克莱大学的华裔科学家蔡少棠便提出了忆阻器的概念。
  现行的计算机体系中最常见的是“冯诺依曼架构”,即计算机由存储器、控制器、运算器、输入输出四部分组成,这和人脑的结构有着巨大的差别。人脑的存储、控制和运算三位一体,而忆阻可以让半导体电路具有和人脑一样的“三位一体”特性。
  四大电路元件,忆阻在右下角
  可以说,如果没有忆阻,仅靠传统的三大电路元件,任何模仿人脑模式的人工智能,在运算效率上都只能是事倍功半,除非人类能够研发出一条与人脑完全不同的智能模式。
  虽然AI芯片不可能仅靠一个忆阻便一朝功成,但更不是像如今这样在名字里贴上AI两个字母就可以齐活儿的。那些以AI为名的芯片厂家,只有极少数厂家在有目的有方向的进行研发,其余大多都是浮躁。