2023年6月16日,高通方面召开了一场比较特别的技术沟通会。为什么说它“特别”?因为与以往有些不同的是,高通这次并没有发布特定的硬件,也没有宣布什么全新的软件技术。
取而代之的是,则是他们集中阐释了刚刚公布的、中文版《混合AI是AI的未来》白皮书中的大部分技术内容,并结合高通现有的芯片、AI相关产品,进行了简单的演示。
看到这里,有些朋友是不是感觉这场沟通会的内容可能有点不太“激动人心”?在经过深度挖掘后,我们三易生活发现,除了阐释这一白皮书中的内容外,高通其实还暗藏了一些“干货”。
(资料图片)
首先,高通首次明确了其AI硬件的“原点”
如果过去曾经有看过我们三易生活关于手机AI的相关内容可能会记得,我们几乎每次提到高通的手机端AI编程硬件时,几乎都会涉及一个单词,“Zeroth”。
“Zeroth”是什么?最初的它,其实是一款单独的AI芯片,由高通在2013年发布。它最大的特色,是采用了仿生自生物大脑的神经元架构(事实上这正是最早的NPU概念),能够不依赖编程、而是通过反复的“观察”和“自学习”,实现程序、性能的自我进化。
到了2014、2015年之后,“Zeroth”的架构、编程思路被引入到骁龙平台,成就了高通旗下第一款明确具备AI加速能力的移动平台,也就是大名鼎鼎的骁龙820系列。
有意思的是,或许是因为骁龙820诞生的时候,智能手机上的AI用例还十分稀少,因此高通当时并没有针对骁龙820的js“Zeroth”AI加速架构进行太多宣传。直到后来的骁龙845、骁龙855时代,他们才开始大力宣编程客栈传骁龙平台内置的“AI加速器”。这就给部分此前不太关注移动AI发展的消费者带来了错误的印象,使得他们误以为高通直到2018年前后,才开始发力手机上的AI硬件。
很显然,这有点偏差。而随着高通在这场技术沟通会上,正式将他们的手机端AI技术介绍为“(自2013年起)有着10年的技术积淀”,实际上也就意味着高通方面意识到,他们自己其实才是智能手机端侧AI的真正发明者,而且比竞争对手要早了好些年。
其次,高通还变相预告了次世代骁龙移动平台的性能
何谓“混合AI”?简单来说,它指的其实是云端和设备端共同处理AI计算,借助设备端的即时感知、即时处理优势,来填补云端AI在延迟方面的短板,同时还通过云端的超高算力,来弥补端侧AI性能的缺憾。
考虑到目前的智能手机上的AI处理场景(比如拍照、影音增强、语音辨识)通常对于延迟都极为敏感,所以混合AI虽然名义上是云AI与端侧AI的“算力混合”,但实际上端侧AI的性能高低对于用户体验的影响,反而可能才是更大的一方。
正因如此,在这场沟通会上高通给出了两个很有趣的数字。一是目前其已在端侧支持运行参数超过10亿的AI模型,从而能够在手机上跑Stable Diffusion这样的内容生成实例。而另一个更为关键的,则是他们宣称,“在未来几个月,终端侧将可以支持超过100亿参数的模型”。
这是什么概念呢?有关注手机SoC的朋友可能已经猜到,“未来几个月内”高通将会发布的新品是什么。但从“10亿参数”到“100亿参数”这样高达10倍的AI性能提升,则是首次被官方以近乎公开的形式提出。
而且回溯历史不难发现,此前数年的骁龙移动平台在AI算力上的进步虽然普遍不小,但基本都是每代提升70~100%左右的水平。只有到了骁龙8Gen2这一代,在软硬件两方面的共同加持下,才首次将跨代的AI性能提升幅度达到了300%之多,这已经十分恐怖了。但如果高通此次公布的数字无误的话,那么他们下一代的旗舰SoC,将很有可能首次实现AI性能的暴增。
再更进一步推断,这似乎也就意味着,如果新一代的骁龙7系、骁龙6系,乃至骁龙4系“沿用”新旗舰的相关架构设计,那么它们将同样有可能会迎来AI性能的爆炸式增长,甚至有望超越现有骁龙8Gen2的水平。
如果真是那样,那么搭载骁龙移动平台的机型从2023年底开始,所能实现的端侧AI功能势必将会迎来一轮极为巨大的进步。
除了手机,高通的AI布局还瞄准了XR、汽车和PC
过去我们三易生活在相关内容中常常说到,Adreno GPU是高通的一大技术底气。因为它有着行业中少见的自研架构,由高通自己来维护驱动程序,因此可以做到比其他竞品更深入、更及时的游戏适配。
很显然,如今这个“因为是高度自研、所以优化更好、效率更高”的理由,也同样适用于高通的AI计算体系。
在这次沟通会上,高通方面就明确提到了其XR、汽车、PC平台在端侧AI计算性能上相比于竞品的优势,也提到了他们已具备从算法开发、软件效率优化、数据量化和编译,以及硬件加速技术等方面的全栈开发工具。甚至还“特意”强调了其AI开发软件对于android、Windows、linux和QNX等,多种操作系统的跨平台支持性。
那么这意味着什么呢?很显然,在移动端拿下40%端侧AI计算设备份额,确立了自身的“行业统治地位”后,高通如今正打算借助自研架构的优势,将他们的混合AI布局推广到更多的消费类电子设备上。而能否取得成功编程客栈,似乎很大程度上就要看接下来的那款新品,究竟能在AI性能上将竞争对手们甩开多远,又能有多块将其架构“流用”到其他骁龙平台上了。