十年前,当Intel处理器从奔腾D升级到Core2Duo,业界是用雷霆一击来形容,那是一种飞跃式的质的变化,功耗温度大降而性能大涨,随后的Core2Quad虽然是个胶水四核,不过多了两个核还是带来了相当大的性能提升,接下来的Nehalem架构实现了原生四核,内存控制器整合到CPU内部使得内存带宽大幅攀升,超线程技术的回归让CPU的多线程性能有了很大提升,后面的SandyBridge架构是对Nehalem的一次大改,CPU与GPU真正的融合在一起,性能有了全面的提升。
但是后面几代CPU的性能提升就相当小了,每一代都是几个百分点的性能升幅,这也让Intel这几年被玩家笑称为牙膏厂的原因。
在2006年Intel提出了Tick-Tock战略,其中的Tick一环是指CPU工艺升级,Tock则是CPU架构升级,二者轮流交替,两年为一个周期,在Haswell架构之前Intel一直都是按照这个步伐一步步走过来的,2007年45nm工艺的Penryn处理器,2008年是同为45nm工艺的Nehalem架构,之后分别是32nmWestmere、32nmSandyBridge、22nmIvyBridge、22nmHaswell,22nm工艺是一个相当重要的节点,这是Intel首次投入实用的3D晶体管工艺,然而随后的14nm工艺Intel栽了个大跟斗,14nm工艺的延期迫使Intel放慢了前进的步伐。
实际上Intel现在的工艺技术路线已经变成了制程-架构-优化(Process-Architecture-Optimization),算是从之前的两步走改成三步走了,步调放缓了。
都在说Intel这几年来CPU的性能提升幅度不大,旧U还能继续战N年,那么最近几代Intel处理器到底有多大性能差距呢?今天我们要测试一下从第一代的Corei7-870开始到现在最新的Corei7-7700K共六款六代的酷睿处理器,看看各代之间到底有多大的差距。不过在测试之前我们先来回顾下这几年来Intel的各代CPU架构。
一切的开端:Nehalem
08年推出的Nehalem微架构是一切的基础,Intel这几年的酷睿处理器微架构都是以它为基础,严格来说,Nehalem微架构仍是基于上一代Core微架构改进而来的,但它的改进是全方位的,计算内核的设计来源于之前的Core微架构,并对其进行了优化和加强,主要为重拾超线程技术、支持内核加速模式TurboBoost和支持SSE4.2等方面,非计算内核的设计改动主要的有三级包含式Cache设计、使用QPI总线和整合内存控制器等重要改进。
Nehalem微架构采用可扩展的架构,主要是每个处理器单元均采用了BuildingBlock模组化设计,组件包括有:核心数量、SMT功能、L3缓存容量、QPI连接数量、IMC数量、内存类型、内存通道数量、整合GPU、能耗和时钟频率等,这些组件均可自由组合,以满足多种性能需求,比如可以组合成双核心、四核心甚至八核心的处理器,而且组合多个QPI连接更可以满足多路服务器的需求。
正因为这样的模组化设计,英特尔可以灵活的制造出各种差异化的核心,比如支持三通道DDR3的Bloomfield核心、支持双通道DDR3的Lynnfield和Clarkdale核心,而且这些核心间还存在是否支持超线程、TurboBoost技术等区别,Clarkdale还整合了GPU图形单元。
在2009年9月,Intel推出基于Nehalem微架构的Lynnfield处理器,采用LGA1156接口,它与Bloomfield的区别不单只在于内存通道数的差别,Lynnfield把PCI-E控制器整合到了CPU内部,而北桥其他功能与南桥一起整合到PCH里面,主板从三芯片变成了双芯片,形成了现在主板的基本布局。
2010年的Clarkdale只有双核设计,它把GPU也整合到CPU内部了,但是只是简单的将GPU和CPU封装在一起,并没有真正达到融合,一颗CPU里其实有两颗芯,CPU的制造工艺升级到了32nm而GPU部分则依然是旧的45nm工艺,它们采用QPI总线相连,对外则采用DMI总线连接PCH。
真正的双芯融合:SandyBridge
在2011年伊始,Intel就把微架构升级到新一代的SandyBridge,它真正将GPU与CPU融合,从以前的双U各立山头到合二为一,是非常大的突破,内核架构也较Nehalem有了较大变化,这些变化包括:新的分支预测单元、新的Uop缓存、新的物理寄存器文件、有效执行256位指令、放弃QPI总线改用环形总线、最末级缓存LLC机制、新鲜的系统助理等。
AVX指令集的加入是SandyBridge最为重要的改进,浮点性能得以激增,新一代的TurboBoost2.0技术增强了SandyBridge自动提速的弹性,除CPU外还可对GFX进行加速,并随着系统负载的不同协调二者的频率升降,表现得更加智能化。
新一代图形核心具备出色的图形与多媒体性能,由于改用了环形总线设计,三级缓存可由CPU各核心、GPU核心与系统助理SystemAgent共享,可直接在L3内进行通信。GPU主要包含了指令流处理器、媒体处理器、多格式媒体解码器、执行单元、统一执行单元阵列、媒体取样器、纹理采样器以及指令缓冲等等,架构与上一代相比有了较大修改。
3D晶体管起航:IvyBridge
IvyBridge虽然说只是SandyBridge的工艺改良版,架构上没太大改变,不过对Intel来说却是一款相当重要的产品,因为它是首次采用22nm3D晶体管工艺,是今后Intel半导体工艺的重要基础;另外CPU内部的PCI-E控制器也升级到了PCI-E3.0标准,带宽提升了一倍,分配方式也更灵活;内核方面的改进说是提升了IPC每周期指令性能,SSE以及AVX指令也有所增强;整合GPU性能也有所提升,EU数从12个提升到16个,API支持也从DX10.1升级到了DX11。
更强图形性能与更为精确的功耗控制:Haswell
Haswell是Intel在2013年推出的全新微架构,该架构给人最深刻的印象就是把原来主板上的VRM模块整合到了CPU内部,FIVR调压模块的加入让主板的供电变得简单,并且可以对CPU内部的电压进行更为精确的控制,提高供电效率,实际上Haswell与Broadwell架构的产品是我见过电压最为稳定的Intel处理器。
指令集方面,Haswell增加了两个指令集,一个是针对多线程应用的TSX扩展指令,另一个是就是AVX指令的进阶版AVX2。还有一点就是从Haswell架构开始Intel的核显开始了模块化、可扩展的设计,就此走上了暴力堆砌核显规格的道路,最高级的核显拥有40个EU,还有大容量eDRAM作为L4缓存,可同时提升CPU与GPU性能。
其实在Haswell与Skylake之间还有个Broadwell,就是采用14nm工艺的Haswell处理器,不过Broadwell主要用在移动平台上,桌面级的Broadwell就两颗,而且国内没有正式上市所以没啥存在感,这里就不再做介绍了。
DDR4的时代到来:Skylake
Skylake可以说是自SandyBridge以来Intel最给力的一次升级了,CPU同时升级架构、工艺及核显,内存同时支持DDR3与DDR4,采用了更为先进的14nm工艺使得Skylake在频率提升、性能增强的同时功耗有了明显降低,而FIVR电压控制模块则被取消了,电压的控制也重新回到主板上。
Skylake处理器在超频上的改进可能让人眼前一亮,因为此前Intel对超频的限制颇多,全民超频的盛况早就不存在了,但Skylake处理器上,Intel虽然会继续限制倍频,但这次的BCLK外频限制没这么严了,外频能轻易超到125MHz以上,外频的解放更有助于极限超频玩家挑战更高记录。
核显方面,Skylake与Broadwell其实挺相似的,每组Subslice单元依旧是24个EU,但是整体规模变得越来越大了,Skylake最多可以扩展到3组Slice单元,也就是说最多会配备72个EU单元,因此Skylake也多出GT4这个级别的核显。
小修小补提升能耗比:KabyLake
KabyLake只是Skylake的优化版本,主要改善能耗比,然而这些在桌面版的处理器上表现并不明显,桌面版第七代处理器比较明显的区别只是频率高了。
KabyLake虽然都是使用14nm制程,不过Intel说他们对工艺进行了改良,KabyLake处理器上使用的新工艺使用了更高的鳍片与更宽的栅极间距,更高的鳍片意味着需要更小的驱动电流,这可减少漏电概率,而更宽的栅极间距这货会降低晶体管密度,这需要更高的电压但是可以降低生产难度,另外更宽的间距允许每个晶体管的产生的热有更多地方扩散,这有助降低内核温度并提升频率,这也是为什么KabyLake频率都比Skylake高但功耗则没什么变化的原因。
GPU方面KabyLake的核心与Skylake一样都是Gen9,不过针对4K视频回放进行了改良,增加了H.265Main.10、VP98/10-bit格式的硬件解码与编码,可大幅降低4K视频播放时的功耗,这对台式机来说可能不算什么,不过对移动设备来说降低功耗等同增加续航时间,这个是相当重要的。
这几年来IntelLGA115X平台较有代表性的Corei7处理器规格一览
近年来LGA115X平台顶级主板芯片组规格一览说真的主板芯片组的变化可能是给消费者更新换代的更大原因,如果说这些年来LGA115X平台CPU给人的感觉总体差别不大的话,主板更新换代的差别就是相当大了,PCI-E总线从2.0变3.0,存储接口从SATA3Gbps慢慢进化到SATA6Gbps到现在最新的M.2/U.2接口,USB接口从2.0到3.0再到现在最新的3.1,这些都是能看得到且相当实在的变化,再加上主板厂商每次都会在主板上加新花样,可以说主板带来的变化更有让人更新换代的冲动。
测试平台与说明
这次测试的处理器包括从Corei7-870到Corei7-7700K的六代IntelLGA115X平台的处理器,Corei7-5775C是稀有品那个就算了,他们会搭配对应的主板,Corei7-7700K/6700K会使用DDR4内存,而其他处理器则使用DDR3内存,显卡采用GTX1070FE版,系统使用Windows10build1607,显卡驱动是NVIDIAGeForce372.70。
测试项目包括CPU基础性能测试与游戏性能测试,CPU性能测试用的都是基础性能测试软件,而游戏测试包括3DMarkFireStrike基准测试与《文明:超越地球》、《GTA5》两个游戏,会分别对比CPU默认性能与4G同频下的性能差别,此外还有功耗与温度的测试,由于CPU超频后的电压会随不同CPU的体质而不同,所以只测试CPU默认频率下的功耗与温度。