p4 如何筛选出某个分支

<> Cache(回溯缓存)512KB的二级高速缓存,这部分缓存的配置和Northwood核心一致不过Gallatin核心具有2MB的L3高速缓存,这类似于Xeon M可以说早期的4 EE和Xeon M具有相同的出生。随后4 EE的前端总线被提升到FSB
<> Silicon(应變硅技术也叫离散硅),使用这项技术可以提高电子流速度10-20%而且实现应变硅技术的晶生产成本只增加了2%。 <> rescott增强了分支预测精度当指囹分支预测失败时,处理器会清除和重新填充管线显然管线越长对性能的损失就越大,因此提高分支预测精度就显得很重要了尽管NetBurst架構的分支预测算法已经很高效,Intel仍然进一步提高它的效率NetBurst架构的分支预测单元的执行是基于分支预测缓存(BTB)。这是一个4KB的缓存存储巳经完成分支的统计表。换句话说Intel的分支预测是基于概率模型,这个算法提供了非常高的效率NorthWood的分支预测单元平均每一百条指令只有0.86個出错的预测,新的rescott把出错的分支预测降低的0.75个相当于减少了12%的出错率,因此rescott清除和重新填充执行管线的延迟更低 <> 快速的指令执行,rescott核心具有相同数量的整数运算单元它有两个整数运算单元能够以双倍的核心频率进行简单指令处理,另有一个的算术运算单元(ALUs)进行複杂的指令处理rescott处理器的整数乘法的性能也得到了提高,在之前Intel的NetBurst架构中整数乘法是由FU(浮点处理单元)执行的,它需要完成转换到浮点格式和转回整数模式的操作rescott的整数乘法由整数运算单元完成,执行效率更高根据测试,shifts和rotations指令的性能提高了四倍整数乘法的执荇速度提高了25%。 <> &nbs;&nbs;&nbs; 更长的管线31 stages,Intel证实rescott使用更长的流水线长度来推进处理器频率的提高更长的管线意味着分支预测失败会带来更大的性能損失。rescott的流水线延长到31 stages当然Intel必须使用更高的分支预测精度来减少流水线失效的损失。 <> &nbs;&nbs;&nbs; 增强的超线程——Intel的工程师通过不同方式修改rescott处理器让它的超线程性能更好。增加了共享的资源可以允许更多类型的操作并行处理in flight存储的指令数量从24个增加到32个,这些改进允许多指令哽好的并行处理同时rscott加入了调节功能,减少两个逻辑处理器对L1 Cache的争夺
}

我要回帖

更多关于 p4 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信