广告位
全站搜索
 
AMD新架构推土机实测,挑战Intel下一代Sandy Bridge
作者:admin  来源:本站  发表时间:2015-1-13  点击:962

 

 

现在Intel遥遥领先,AMD构不成威胁,导致i5、i7价格居高不下。H55主板明明集成北桥,照理成本大降,居然比AMD的主板还贵。最夸张的是接口,一年换一个,都不兼容,逼你花钱。不过,好消息来了。网上看到一篇AMD下一代推土机测试,性能比较夸张,如果是真的,英特尔铁定降价!

推土机架构总览

今天,AMD提供了更详细的架构图。

 

 

每一个推土机模块都包括两个整数核心与一个浮点单元,其中每个整数核心有四条完整的整数管线,每条管线内又有一个算术逻辑单元(ALU)和一个地址生成单元(AGU),可以执行x86整数代码、存储指令以及合并执行SSE、AVX整数代码,这也是最大的变化。

浮点单元内有两个128位宽范围的FMAC单元,可以执行新的积和熔加运(FMA)指令或者浮点加法与乘法操作,这样既能降低功耗,也能提高简单操作的吞吐量。据AMD解释,两个FMAC单元既可以被两个核心整数的两个线程并行使用,也能被一个线程循环使用。

每个整数核心内还都有自己的16KB一级缓存和载入存储单元(LSU),其中后者负责管理来自自身所在整数核心以及浮点单元的所有存储请求,每个核心能执行两个在载入和一个存储操作,都是最高128-bit。相比于K10架构,推土机的LSU还能执行数据和地址的推测。

为了减少分支预测的错误和由此造成的拾取操作延迟,分支预测单元也有所改进,能够在每个时钟周期内预测多个分支并发送代码预取。

对性能提升贡献很大的另一个重要特性是各个单元能运行在不同频率上,可以关闭任何闲置的子单元并调整缓存容量(比如将一级缓存从四路16KB关闭成双路8KB),还有一个电源控制器负责跟踪每个子单元的载入和功耗情况,这叫作应用电源管理(APM)。

最后是五级缓存架构:

- 零级缓存:每个线程(或核心)4KB 8路关联;

- 一级缓存:每个核心16KB 4路关联数据缓存,延迟1个循环;每个模块128KB 4路关联;

- 二级缓存:每个模块2MB 8路关联,两个核心共享,全速;

- 三级缓存:所有核心共享8MB,延迟24个循环,每个时钟循环可同时处理最多两个请求;

- 四级缓存:桌面黑盒版以及服务器Opteron都将通过芯片堆栈新增四级缓存,容量32MB或者64MB。

新接口新工艺

 

推土机核心在基于32nm SOI工艺得初期试产中表现得异常可靠,因此AMD正在试验使用28nm Bulk工艺进行小批量生产,但既未确认也未否认最终是否会使用28nm。不过AMD确认,推土机处理器将采用Socket AM3+接口,941个针脚,其好处是可以支持DDR3-1866内存和高级节能技术,而且AM3+将是AMD的最后一代针脚栅格阵列(PGA)封装,之后将改用触点栅格阵列(LGA),等到Fusion融合处理器降临的时候就会使用LGA AF1新接口,触点多达1591个,支持DisplayPort 1.2标准、PCI-E 3.0规范(32条信道)、四通道内存

性能实测

终于到了性能测试部分,考察对象包括基于推土机架构的桌面版Zambezi 2.8GHz、Zambezi 3.2GHz、Zambezi BE 3.2GHz(有四级缓存的黑盒版)以及服务器版Interlagos 3.2GHz。柱状图可以说明一切,就不废话了。

 

 

 

六、小结从测试可以看出,推土机的威力确实非常凶猛,几乎统治了每一个性能测试项目,功耗也相当之低。不要忘了,这只是预览性质的早期样品的表现,最终成品肯定还会更优秀。

 

脚注信息
Copyright ©2003-2014 东莞市冰暴电子科技有限公司 彭映源粤ICP备14090270号-1
脚注栏目
  • QQ咨询

  • 在线咨询
  • 点击这里给我发消息
  • 点击这里给我发消息
  • 点击这里给我发消息
  • 点击这里给我发消息
  • 点击这里给我发消息