在2024年的骁龙峰会上,39岁的高通公司完成了一次蜕变。
最直观的体现,是在峰会议程设置上。已经连续举办九届的骁龙峰会,今年有着明显不同。以往,手机芯片会是整个峰会最核心的内容,但今年,手机芯片被排在了AI、汽车、PC等话题之后。
不仅如此,高通更是留出一整天的时间给到汽车业务,其中包括首次在骁龙峰会上发布汽车新品,这也进一步凸显了汽车业务目前的重要性。
这些改变并不意味手机芯片不再重要。相反,手机业务仍贡献着高通超六成的营收,而且高通每年推出的新款手机芯片,也仍是未来一年市场上旗舰安卓手机的标配。
只不过对高通而言,在手机业务之外,它有了更多可讲的故事。
在过去39年里,高通从无线技术起步,因成功抓住移动通信时代,进而奠定了今天的地位。而随着新一轮AI时代的来临,高通也有了新的目标——它希望自己能从一家通信公司转型成为一家计算公司。
在这个过程中,骁龙平台扮演着至关重要的角色。2007年诞生的骁龙平台,最初只是面向智能手机,但随着其不断进化,现在在汽车、物联网、PC等领域,也都能看到骁龙的身影。
当然,高通的多元化业务布局早已开始,而之所以说今年骁龙峰会是高通的一次蜕变,最核心原因还是Oryon CPU的出现。
对高通而言,Oryon CPU是其完成整个SoC的最后一块拼图,因为在此之前,高通已经具备了除CPU之外,其他所有技术单元的自研能力。
凭借自研Oryon CPU,骁龙平台又站上了一个新台阶,它也让高通公司总裁兼CEO安蒙喊出的“Snapdragon is everywhere(骁龙无处不在)”,不再只是一句口号。
自研CPU横空出世
实际上,Oryon CPU首次亮相是在去年的骁龙峰会。
当时,高通发布了全新的PC芯片——骁龙X Elite,采用的就是Oryon CPU。安蒙当时介绍称,Oryon CPU是一款高通从零开始设计的产品,它从设计之初就秉承着一个目标:在极低的功耗下实现强劲性能。
测试数据显示,Oryon CPU的单线程性能已经超越了苹果M2 Max,而在实现相同水平性能时,Oryon CPU可以减少30%的能耗。若对比X86 CPU,Oryon CPU的单线程性能也超过了英特尔的i9-13980HX,在相同性能下,Oryon CPU的能耗则降低高达70%。
PC芯片领域的格局因此迅速发生改变。而Oryon CPU出色的表现,也让高通开始加速将其应用到更多领域。今年骁龙峰会,高通推出的新一代手机芯片——骁龙8 Elite,便搭载了第二代Oryon CPU。
2021年,高通斥资14亿美元收购了成立仅两年的创业公司Nuvia,等待的就是这一天。高通公司中国区董事长孟樸在接受21世纪经济报道记者采访时指出,高通的主要业务是智能手机,所以最初收购Nuvia,也是希望为智能手机自研CPU。
“只不过Nuvia团队很多人都拥有做PC CPU的经历和经验,所以先让他们做出PC CPU,这对他们来说也更得心应手”,孟樸表示。
据高通技术公司产品管理总监Manju Varma介绍,相比第一代,第二代Oryon CPU面向移动平台进行了大刀阔斧的改进,并设计出全新的微架构。
第二代Oryon CPU采用了2+6的设计方案,两个超级内核最高主频高达4.32GHz,适合应对需要快速响应速度的密集型应用。另外六个是性能内核,每个性能内核都经过调优,负责运行最密集型的应用程序,同时具有极高能效。
需要指出的是,在第二代Oryon CPU中,高通彻底去除了效率内核。近年来,高通一直致力于减少CPU中效率内核的数量,现在得益于全新的CPU架构,高通终于可以不再需要效率内核,这也使Oryon CPU可以实现以前智能手机前所未有的处理速度。
除此之外,Oryon CPU的另一大改进是在内存架构上。高通为每个CPU丛集配备了12MB的二级缓存,使得整个CPU拥有24MB专用缓存,这也是当前移动领域最大的缓存。
此外,高通还大幅提升了每个超级内核和性能内核的一级缓存。同时,考虑到生成式AI对内存的高度依赖,骁龙8 Elite配备了最先进的LPDDR5内存。
Manju Varma称,由于信号传播和访问时间的物理限制,二级缓存比前代平台增加一倍,通常会导致时延增加。不过,由于Oryon CPU实现的架构变化,例如设计与内核同步的二级缓存,可显著降低时延并实现更低功耗。
得益于在微架构和内存架构上的升级,第二代高通Oryon CPU可以实现更高的性能以及更低的能耗,数据显示,第二代Oryon CPU相比上一代性能提升30%,同时功耗降低57%。
开枝散叶
对高通而言,这次成功自研CPU,也让其摆脱了对Arm架构的依赖,从而赋予了其产品在多场景中的广泛应用能力。
孟樸告诉记者,这其实是高通第二次做自研CPU,以前高通用Arm架构也做过自研,但因为跟Arm公版的提升并不是非常明显,所以就放弃了自研。但这次自研的Oryon CPU非常成功,从性能来讲,Oryon CPU已经超过了Arm公版。
众所周知,CPU扮演的是大脑的角色,由它负责执行来自应用程序、操作系统和用户输入的指令。而现在,高通借助Oryon CPU可以直接定义和定制所有处理通道的配置,不需要任何外部依赖。
对于今年新发布的骁龙8 Elite来说,Oryon CPU带来的不仅仅是CPU性能的提升(相比第三代骁龙8, 骁龙8 Elite的CPU 性能提升 45%,能效提升 44%),更是整个SoC能力的跨越式迭代。
比如骁龙8 Elite搭载的Adreno GPU也经过完全重新设计,使其性能和能效大幅提升。比如对于图形密集型游戏,其性能提升40%,功耗降低40%。
在AI能力方面,与第三代骁龙8相比,全新架构的Hexagon NPU性能提升45%,能效提升45%。结合提升的CPU和GPU,骁龙8至尊版能够跨所有核心动态管理AI负载。
正因为这些技术单元的全面提升,骁龙8 Elite的商用机与第三代骁龙8商用机和采用竞品的智能手机相比,在单线程和多线程基准测试中,实现了45%的性能提升,能效提升也达到44%。
高通还特意强调,所有这些基准测试都是在实际室温环境下完成的,不同于其他厂商在冷冻环境中运行基准测试以获得更高性能。
在骁龙峰会现场,21世纪经济报道记者采访了网易旗下《永劫无间》手游的工作人员。据高通宣布,《永劫无间》经过两家公司的合作优化,首次将具有18亿参数的大语言模型引入终端侧。
《永劫无间》工作人员告诉记者,在第三代骁龙8芯片上,《永劫无间》也做过尝试,但是在大语言模型跑在云端的情况下,功耗还是不理想。而在骁龙8 Elite上,不仅可以将大语言模型放在终端上,而且整体性能也进一步提高很多。
据该工作人员透露,目前只有搭载骁龙8 Elite的终端和搭载苹果M4芯片的iPad,能实现这一效果。
除了手机端,在高通最新发布的骁龙Cockpit Elite和骁龙Ride Elite两款汽车芯片中,也首次搭载了专为汽车定制的Oryon CPU。
据高通公司汽车、行业解决方案和云事业群总经理Nakul Duggal介绍,骁龙Cockpit Elite面向智能座舱场景,骁龙Ride Elite则是面向智能驾驶场景。
“Oryon CPU的处理速度与前代顶级平台相比提升至3倍。同时,Oryon CPU专为汽车应用设计的灵活架构,使它既能支持先进的座舱功能或智能驾驶功能,抑或是在同一SoC上无缝运行数字座舱和智能驾驶功能,这为软件定义汽车提供了灵活性和可扩展性”,Nakul Duggal说。
掘金7000亿美元市场
从PC到手机和汽车,高通的自研Oryon CPU已经开始引发一场蝴蝶效应。Oryon CPU的成功不仅重新定义了高通的产品架构,还对整个行业产生了连锁反应——在智能手机、PC和汽车的多个细分领域,竞争格局正被重新改写。
在智能手机领域,高通的地位已经毋庸置疑,但近年来,其每年所做的产品迭代,给外界的感知正变得越来越弱,但这次,借助Oryon CPU,高通的手机SoC完成了一次真正的代际转换,各项能力均发生质的飞跃。
与此同时,在汽车领域,高通过去的业务布局主要是在智能座舱场景,现在得益于整个芯片架构的升级,高通打通了座舱与智驾两大场景,这也让汽车厂商有了更多选择高通的理由。
还有去年发布的骁龙X Elite,从市场反馈来看,它也让高通重新回到了PC市场的牌桌上。而这一切,都是因为Oryon CPU的出现,让高通得以在芯片产品上实现一次革新。
当然,除了硬件层面的突破,生成式AI技术的快速发展,也为高通提供了一个巨大的舞台。
安蒙在骁龙峰会开场说,生成式AI是移动计算领域最大的创新之一,而他要给大家展示的,是未来几年AI将如何改变一切。
安蒙表示,生成式AI最有趣的地方在于,它不仅可以执行复杂的模型,还能让计算机理解人类语言,这将改变人们与计算设备的交互方式。
他举例称,现在的手机还是以应用程序为主,随着人工智能的加入,应用程序的体验将被重新定义。比如银行应用,现在用户需要打开App,然后进行查询余额或转账的操作,但当计算机能够理解人类时,用户只需要对手机提出查询余额或转账的需求,手机就能直接完成。
最关键的是,这些场景不再只是设想,骁龙8 Elite已经能够支撑实现。所以,生成式AI在高速发展两年之后,用户期盼已久的一些AI体验,将随着骁龙8 Elite的发布而逐渐落地。
孟樸向记者表示,在高通看来,AI的发展是一个持续演进的过程。“特别是生成式AI出现以后,更是一个大的趋势,就像当年的互联网一样,早期都是固网,后面变成移动互联网,并无处不在。”
“AI在高通扮演的是一个通用平台的角色,我们没有区分它是车的AI还是智能手机的AI,相反,AI是横跨高通所有产品线的一个能力”,孟樸说。
三年前,在ChatGPT还未出现时,高通曾在投资者大会上披露过一份未来发展规划。当时有数据显示,到2025年,预计64%的数据将在传统数据中心之外产生。在高通看来,边缘侧数据量的增长,将使本地数据处理和智能应用的需求随之增长,这推动了关键行业趋势的形成,对高通技术的需求也应运而生。
安蒙当时也提出,高通将利用“统一的技术路线图(one technology roadmap)”——一个可扩展应对所有增长业务需求的技术路线图来把握这些机遇。
“凭借在AI、摄像头、图形、处理和连接等领域的领先能力,我们将为几乎每类边缘侧终端提供终端侧智能、高性能低功耗系统和一切无线组件,从耳塞到智能网联汽车”,安蒙表示。
他也据此预测,未来十年,随着智能网联边缘的扩展,高通的潜在市场规模将从2021年的1000亿美元增长至7000亿美元。
当时,有分析人士认为安蒙的预测过于乐观。但现在看来,随着Oryon CPU的成功,高通实现了技术路线的统一,生成式AI又为整个市场创造了更多增长空间,未来,当高通成功转型成为一家可以为各类终端提供计算能力的计算公司时,它距离自己设定的目标,也将不再遥远。