专栏文章

CPU 架构瞎分析:难道 Arrow Lake-S 就这么一无是处吗?

科技·工程参与者 1已保存评论 0

文章操作

快速查看文章及其快照的属性,并进行相关操作。

当前评论
0 条
当前快照
1 份
快照标识符
@miolsanh
此快照首次捕获于
2025/12/02 21:17
3 个月前
此快照最后确认于
2025/12/02 21:17
3 个月前
查看原文
前排提醒(叠甲):本文纯属笔者臆测,没有任何数据证明,全是口嗨的,如果觉得作者的观点是错误的,请使用友善的语言指出(轻喷),不要引战。本人不是 I 粉也不是 A 粉,过去可能是软粉但是现在不是了。作者承认 Arrow Lake-S 在台式机上面是一个失败的架构,作者只是在分析这个是不是真的由于 Intel 如大家所说江郎才尽了导致的。如果未来的发展情况与作者此处的观点不一致,那是非常非常正常的。本文纯技术分析,不涉及对任何厂商的路线和思路的评价。也希望大家保持友善的态度。
一向来,大家对于 Intel Arrow Lake-S 的态度那是相当不待见,认为 Arrow Lake-S 的多核性能虽然可以,但是单核性能被 Zen 5 杀爆了,同时多 Tiles 设计显然缺乏操练,一个成本高得多的 3D 封装工艺(本质上和 3D V-Cache 用的互联技术是差不多的,所以成本其实比较高),最终搞出来的成果还不如人家基板互联,显然还是太抽象了些。
那么,Arrow Lake 真就是这么一无是处,除了能效比和比较强大的集成显卡(虽然大多数玩知乎的人应该台式机是不会用集成显卡的)以外一点优势都没有吗(而且能效比这个还是台积电的功劳呢对吧)?
笔者一开始也是这么认为的,但是当时就觉得很奇怪,如果说分 Tiles 设计导致的问题可以归结于 Intel 对于分 Tiles 设计并不是很有经验的话(这个还是比较有道理的,毕竟雀食是第一次带上桌面端,带有很强的移动端移植色彩,真要第一次就整的那么完美好像对于老英也是比较困难的),那么 Lion Cove 不太优秀的表现应该不是由于英特尔疏忽造成的,或者说很可能是有意为之。不然,考虑到 Intel 是一个很刚的厂商,如果英特尔特别想提升 Lion Cove 的性能,那么很可能 Intel 会直接把 Lion Cove 超频到至少 6GHz,不太可能放在这个 5.7GHz 的“低”频率(有人会说,N3B 的高频率下的电压—频率曲线不如 Intel 7 工艺,这是事实,但是上不去高频应该早期流片的时候已经发现了,切换成 N4X 也就是 AMD 同款工艺应该是可行的)。
也有可能有人会说可能是为了防缩缸,但是这个不使用 N4X 这件事情依然离奇,因为 N4X 这个工艺没有比 N3B 密度和低频性能差太多,而且价格是低了很多的,我是不太能理解在追求高性能的桌面端和标压笔记本端为什么要用一个高频不好的工艺。(PS:我觉得 AMD 也是这个思路,所以就用 N4X 了,还能省点钱呢是吧。)
所以就有一种可能:英特尔压根就没有很想提升 Arrow Lake-S 中 Lion Cove 的单核性能!
这是一个很有意思的事情。正常来说没有一个牌子会主动在稳定性不变的情况下降低自己的 CPU 的峰值性能吧,甚至高通、联发科和苹果在自家手机 SOC 上面高频也是定的相当刚的,甚至还会有特挑超频的情况(对吧,说不定还真有个 OEM 能干出把手机开满功耗这件事呢对吧)。
另外其实 N3B 的高频衰减其实挺早的,即使是 A18 Pro 那点频率也明显被这个高频衰减受累了。
所以,我得出了一个大胆的结论:Intel 就是有意缩小 P/E 核心之间的性能差距的,而不是很多人认为的 P 核性能拉了。这也是 Intel 把 P 核频率定的比较一般但是 E 核频率相比上一代大幅提升(也大幅超过了 Zen 5c)的真正原因。
为什么要这么干呢?这是不是违反了 Intel 搞大小核心的初衷了呢?
某种意义上是有一定违反的。大核没有做到提高单核性能的目的,倒是小核完美起到了提升性能密度和性能能效比的作用。但是,这个是更符合 Intel 未来的路径架构的。因为,Intel 的目标从来都不是搞大小核心,Intel 的目标是直接取消大核心,让小核心一统江湖。所以从 Gracemont 到 Skymont,Intel 的小核心的性能可以说是跨越性提升的,而且这一代的小核心其实已经能够达到大核心的性能了,但是相比于大核心,缺点还是明显存在,就是缓存容量和高级指令集的支持。根据 Intel 目前发布的 AVX10 规范我们可以推出,AVX512 从“可选特性”变成了“必选特性”,这暗示了小核心会支持 AVX512 指令集(所以说大概率 Nova Lake 是支持 AVX512 指令集的!),大概率在 Darkmont 里面是采用 256bit 半宽度寄存器来模拟 AVX512 指令集,然后很可能 Arctic Wolf 架构里面就会出现 512bit 的全宽度 AVX512 指令集了,然后最后到了统一的架构,再集成一个 AMX 单元,这样就可以彻底取代大核心的生态位了。
大小核心是一个权宜之计,只是因为目前 Intel 的环形总线设计遇到了瓶颈,如果只放大核只能放 12 个,就比起对手有较大差距。所以如果直接每个原来的大核心被几乎性能一样的 4 个核心组成的 cluster 取代,那么就可以堆到 48 核,这样就真的成为省城撕裂者了。
不过我不认为 Intel 在搞 12 代的时候就是这么想的,当时这个肯定是个拍脑袋方案,然后估计和软哥聊了聊,软哥也愿意给这东西写个调度,那么老英也很开心,终于可以在多核性能上扬眉吐气一回了。然后 Intel 就搞了个 12 代,并且愉快的要求大家要使用软哥的 Windows 11 来保证正确的调度哦!
但是发布了以后老英才发现软哥好像调度器并不是很完善的样子,明显有欠优化的痕迹。一个 8P+4E 的 12700K 吧,开发者写了个工程扔后台去编译了或者剪辑师扔后台去导出了,然后打开 B 站决定摸会儿鱼,然后搞半天一直没有编译好,结果发现这个 CPU 居然只有四颗小核和一个大核在干活,也就是说,自动拿小核去编译和渲染了,然后大核就开了一个用来放 B 站视频,这是什么神奇调度啊!
而且,在 Windows 11 被广泛使用的情况下,用户逐渐发现 Windows 11 具有相当多的 bug(划掉)feature,很多人反而希望回退到 Windows 10,而这个混合架构毫无疑问限制了用户的回退行为(尤其是笔记本的 1260P 和 12500H 这两款 CPU 或者是 U15 系列,E 核远多于 P 核,为了正常调度需要关闭 E 核,几乎是把这几款 CPU 阉割死了)。
老英有一个传统:如果你们做不好,那么我自己来!就是因为这个思路,老英一直保留着晶圆厂,也会通过 IXX 编译器和 MKL 来提高 Intel 处理器的软件性能。既然你的系统没法正确调度我的 CPU,我就自己写一个调度器!这个调度器就是硬件线程调度器。
这个调度器已经集成在之后发布的 Intel 芯片组的 BIOS 里面了,各位使用混合架构芯片的同学不必手动安装。
虽然这个调度器也没有非常优秀,但是至少体现了老英是有想要拯救系统内置的这个调度器的。虽然对于 Windows 11 的优化效果一般,但是这个对于想要使用 Windows 10 的混合架构用户那就是雪中送炭级别的了。
这个调度器直接将原来完全不可用的 Windows 10 上的混合架构变得可用了,其实客观上降低了对于 Windows 11 的依赖性。同时由于 Intel 的有意推动,主流 Linux 发行版对于混合架构的优化也变得越来越完善了,也就是说,即使不使用 Windows 11,用户依然有很多优秀的选择。这个应该是一定程度上对于 Windows 11 的市占率造成了影响。Windows 11 之所以到了最近市占率才超过了 50%,也是有这方面的原因在,当然最主要的原因肯定是 Windows 11 的各种骚操作。
但是 Windows 10 已经快要结束主流支持,同时苹果 macOS,各个主流 Linux 发行版都来势汹汹,微软自然希望大力推广未来几年的主流 Windows 系统 Windows 11,不然在 Windows 10 正式退役之后自己在操作系统厂商中的地位将会难保。本来 Intel 搞了这个混合架构使得大量的用户被捆绑在 Windows 11 系统上了,结果你 Intel 还来拆我微软的台,所以自然 wintel 联盟的情况就紧张了起来,直到最后接近于破裂。所以我猜测微软在 24H2 系统版本中对于 Intel 的负优化可能是有这一部分的原因的。由于 AMD 和微软走的比较近,所以确实 24H2 对于 AMD 的优化属实不错。
这里又会引申出一个问题来了:为什么 Intel Arrow Lake-S 给 KOL 的建议是搭配 Windows 11 24H2?我认为大概率是因为老英没有想到已经几乎等效于没有核心之分的 Arrow Lake 的性能依然会受到 Windows debuff 的影响;23H2 也只有几个月的产品生命周期了吧(貌似),让 KOL 用一个已经在生命周期的尾声的系统进行测试本身就是一个非常抽象的事情。自然搭配 25H2 也是不可能的(这东西现在都还在测试中),所以压根没得选。
所以,在这个节点上,老英一方面遇到自身难以给出一个非常优秀的解决方案的问题,一方面又缺少优秀的队友,所以如果继续让大核性能远强于小核性能,必然导致系统时卡时流畅,这才是会明显影响用户体验的。同时我们注意到 Intel 同时去掉了超线程支持,我感觉就是因为自己也知道 3 种线程是非常难以调度的,同时由于 Intel 的后端设计与 AMD、ARM、Apple 都有一个明显的区别就是 Intel 用的是复杂端口式设计,而不是其他厂商的分离式后端设计,也就是本来端口的利用率就比较可观,超线程带来的性能提升就没有 AMD 那么高,不如砍掉方便了属于是。所以干脆就让每个线程的性能差不多,这就串起来了吧。
我不否认 Arrow Lake-S 并不是一款成功的架构,其充满了欠优化的痕迹。但是我只是想说,欠优化未必是因为 Intel 黔驴技穷,可能其中一部分我们认为不合理的事情其实是有意为之的。但是必须要说明的是,像 D2D 总线效率低下这些情况,大概率就是设计的问题,要考虑如何使用微码修复,在之后的 Nova Lake 上不能重蹈覆辙了。
一枝独秀不是春,百花齐放春满园。只有竞争才能带来进步,如果缺少竞争只会导致一家独大和挤牙膏。不管怎么说,我们希望英特尔尽快找准自己的定位,给我们带来更多优秀的产品(也让我们用上便宜的 AMD)。

评论

0 条评论,欢迎与作者交流。

正在加载评论...