仅仅半年之后,AIPC就要迎来了一轮大幅度的升级。
在之前关于AMD锐龙AI300系列的报道中,雷科技就提到了AMD新款AIPC芯片在NPU算力的飞跃,以及高通、AMD和英特尔之间的全新竞争。而在高通、AMD之后,英特尔终于也带来了下一代笔记本电脑芯片。
6月4日,英特尔在台北电脑展上展示了最新一代的LunarLake处理器,并计划在秋季正式出货。
坦白讲,这个发布节奏对比AMD和高通显然要「慢」上不少,首批搭载骁龙X系列芯片的Windows11AIPC很快就将在618上市,搭载AMD锐龙AI300系列的Windows11AIPC也将从7月起陆续上市。
俗话说「好饭不怕晚」。但问题是,英特尔的LunarLake会是一碗「好饭」吗?英特尔已经放言,LunarLake「绝对」超越高通同类产品(其实就是骁龙X系列芯片),然而就现在来说,我们肯定不会得到一个明确的答案。
但从目前公开和流出的信息来看,LunarLake至少是值得期待的,不仅因为全面提升的CPU、GPU、NPU性能,也因为用上了台积电的先进制造工艺以及自己的先进封装工艺。
图/英特尔
甚至在LunarLake上,英特尔第一次将LPDDR5X内存封装在芯片之中,就像苹果的统一内存架构一般。
但这种设计能给LunarLake带来什么变化和升级?LunarLake又能给下一代AIPC带来什么?这些都是英特尔要在几个月后要正式回答的。
台积电工艺加持,LunarLake不只性能更强
去年,英特尔宣称酷睿Ultra(MeteorLake)处理器代表了该公司40年来最大的一次架构转变,但面对Arm芯片的持续挑战,这种转变显然不会是一次性的。
在LunarLake上,英特尔继续采用了SoC的设计,在一块芯片中集成了CPU、GPU、NPU计算模块。不同的是,LunarLake没有采用英特尔自己的芯片制造工艺,而是用上了台积电N3B和台积电N6两种工艺来打造。
在一定程度上,这是一种升级,毕竟是用上了目前最先进的台积电3nm工艺。
要指出的是,N3B作为台积电3nm的第一代工艺,在苹果A17Pro上并没有带来大幅的能效提升。不过对比英特尔的先进工艺就另说了,按照英特尔自己的说法,LunarLake的能效提升了约30%。
而在性能方面,Lunarlake配备了全新的CPU和GPU架构,CPU性能提升了约20%,GPU性能更是提升了50%,尤其在3DMarkTimeSpy等基准测试中提升更为明显。
图/英特尔
具体来说,新的CPU设计增强了分支预测、指令并行度和缓存带宽,使得处理器在处理多任务和计算密集型任务时有更好的表现。
原来酷睿Ultra采用的3D性能混合架构也改了,英特尔在LunarLake上砍掉了LP-E核设计,用上了新的4x4设计,也就是说,LunarLake现在配备了4个P核、4个E核。同时LunarLake上不支持超线程,意味着LunarLake的线程数量和核心数量一样都是8。
按照英特尔的说法,与之前的LP-E核相比,LunarLake的E核(Skymont)在同性能下的功耗只有前者的三分之一,同功耗下的单线程和多线程性能则有前者2倍和4倍。另一边,P核(LionCove)的IPC提高了14%。
图/英特尔
此外,在Windows11「containmentzones」的基础上,LunarLake可以通过线程指令使用异构调度策略,将工作负载(比如Copilot助手等应用)导向功耗更低的E核,来实现节省电量的目的;或者是导向性能更高的P核,实现更流畅地运行。
简单来说,现在LunarLake可以将特定任务细化到分配给不同策略的核心,做到更高匹配度和更高效率的运行。
GPU方面,LunarLake采用了下一代Xe2架构,不仅性能有了平均50%的提升,而且和Xe架构一样具有高度的可扩展性,即可以集成在低功耗的移动SoC上,也将用在稍晚即将推出的Arc显卡上。同时,GPU还能提供高达67TOPS的AI算力。
NPU性能大涨,整体AI算力冲上120TOPS
AIPC这个概念,可以说最初就是英特尔主导的,随后也被整个PC行业所共同介绍。但公允地讲,英特尔现售的AIPC芯片酷睿Ultra在很多方面难以支撑「AIPC」的概念,除了Windows系统没有跟上之外,AI算力也是基础因素之一。
好在,LunarLake也迎来了一波AI性能大升级。
英特尔宣称,LunarLake处理器的NPU达到了48TOPS的AI性能,相比酷睿Ultra上的NPU算力提升了四倍不止。作为对比,新一代笔记本电脑芯片中,骁龙X系列的NPU算力是45TOPS,锐龙AI300系列的NPU算力是50TOPS。
图/英特尔
此外,在异构计算下,NPU加上CPU的5TOPS、GPU的67TOPS,LunarLake处理器整体能够提供高达120TOPS的算力。
不过在小雷看来,笔记本电脑受限于续航,异构计算更多承担的是临时性的重负载AI任务。而要将生成式AI技术应用到PC的基础体验之中,则必须充分利用起低功耗高AI性能的NPU。这其实也是微软在下一代Windows11AIPC的标准中着重强调40TOPS以上算力的关键原因。
所以从这个角度来看,就算是NPU我们也不能只看最高算力,还要看功耗表现。不过,这一点还是要以后续的实际测试为准。
而除了算力,影响AI实际运行表现的其实还有内存。我们都知道,现在很多时候限制AI实际运行表现的并非计算,而是传输,更直接地说是内存带宽和延迟。当然,往大了说,内存的改进也会影响CPU以及GPU的实际表现,从而影响设备的整体性能。
这可能也是为什么,英特尔选择在LunarLake中直接封装了内存。
把内存焊上芯片,英特尔也要「统一内存」
在主题演讲上,当英特尔CEO帕特·基辛格(PatGelsinger)手持展示LunarLake的时候,所有人都注意到了:
LunarLake还封装了两颗内存。
图/英特尔
作为英特尔首款采用封装内存的芯片,LunarLake有16GB和32GB(双通道)LPDDR5X两种配置,单芯片运行速度高达8533MT/s。该内存支持16bx4通道,与传统的PCB嵌入式设计相比,PHY功耗降低了40%,面积节省了250平方毫米。
在当下,这种设计我们已经不陌生了,比如消费级中苹果M系列芯片就采用了统一内存架构,此外,英伟达的高端加速卡如H100、B200都是直接将内存(包括HBM)焊在GPU和CPU旁边,封装成一个芯片。
这样做的好处也非常明显,首先是可以显著提升数据传输速度和系统响应时间。内存与处理器之间的距离缩短,大大减少了数据传输的延迟,提升整体系统性能。这对于需要高带宽和低延迟的应用,例如图形处理、AI计算和高性能计算任务,尤为重要。
其次是有助于降低功耗。同样因为传输距离缩短,也减少了数据传输过程中的能量损耗,同时配合更先进的制造工艺,有助于延长设备的续航,特别适用于移动设备和笔记本电脑。
再有,在芯片里封装内存也可以简化主板布局,减少主板上的元件和连接。这不仅减少了生产成本,还提高了系统的可靠性。更紧凑的设计使得设备在重量和体积上有所减少,进一步提升了便携性。这对于超薄笔记本和移动设备来说,同样是一个重要的优势。
图/英特尔
但封装内存也有不可回避的问题,首先就是可扩展性和可维修性的降低。这很好理解,毕竟已经焊在芯片里,你不可能对内存进行后续的升级,同时如果内存坏了也基本不存在修理的可能,也只能更换整个芯片甚至电脑。
事实上,PC供应链之前就对此表达了不满。由于LunarLake处理器的内存与CPU的捆绑封装策略,OEM厂商将无法单独采购内存模组,只能采购不同内存规格的LunarLake处理器,很大程度上限制操作空间,并可能导致相关厂商失去内存业务。
从更大的层面来说,考虑到英特尔在移动处理器市场的统治,LunarLake处理器的内存与CPU的捆绑封装策略,可能彻底影响OEM厂商提供多样组合的能力,减少了CPU、内存、固态硬盘的丰富规格选择,失去Windows阵营原有灵活性。
如果说苹果在封闭生态还能完全压制反对者的声音,那英特尔能做到吗?恐怕也有待时间的验证。
写在最后
「与Jensen(英伟达CEO黄仁勋)不同的是,我们相信摩尔定律依然活着,而且还活得很好。」基辛格在演讲开始就强调,在一块芯片上封装十亿个晶体管后,希望未来能封装一万亿个晶体管。
虽然依旧是PC行业的绝对巨头,但蓝色巨人面对的挑战依然很多、很大,在摩尔定律之外,数据中心业务面临英伟达的强势进攻,代工业务则还在积蓄力量的阶段,最强势的PC客户端业务则也面临着Arm阵营前所未有的挑战。
但最终,一切还是要靠产品说话,LunarLake做了很多的改变,这些改变是否能帮助英特尔准备应对PC领域的挑战,我相信会是接下来很多人关注的重点之一。
2024年5月20日-6月30日,618年中大促来袭,淘宝天猫、京东、拼多多、抖音、快手、小红书六大电商平台集体“听劝”,取消预售、疯狂杀价!
手机数码、AIPC、智能家电、电视、小家电、空冰洗等热门AI硬科技品类摩拳擦掌,战况激烈。
雷科技618报道团将全程关注电商平台最新战况,AI硬科技品牌最新动态,电商行业全新趋势,敬请关注,一起期待。
未经允许不得转载:头条资讯网_今日热点_娱乐才是你关心的时事 » 英特尔Lunar Lake「统一内存」,一切都是为了AI