可以衡量cpu的工作生产效率的衡量是

-> 技术前哨 -> 正文
浅谈近来国产CPU的成就
中无通讯61期
文 林和安 小洛夫
中国内地产业正在升级转型,从过去的劳工密集型升级到智识密集型产业。即以中国的IT产业为例,中国正逐渐全面掌握芯片的半导体技术,从早期的芯片封装、测试,中期的芯片生产技术,到现时掌握层次更高的芯片设计,中国CPU真的来了,这次笔者以申威超级计算机、龙芯服务器、华为(海思)4核心智能手机,从各方看看国产CPU的最新成就。
位列Top 100世界超级计算机―申威1600
申威 1600W超级处理器
2009年中国发表自主研发的超级计算机,位列Top500世界超级计算机排行榜第二名。而在2010年10月更升级为天河-1A,一跃成为第一位,此一纪录直至2011年6月才被日本的“京”超级计算机所超越。虽然天河-1A的成就令鼓舞,但它采用的CPU及GPU等核心配件分别为外国厂商Intel及NVIDIA的出品,所以天河-1A只属于中外技术的成品,不能说是真正的国产超级计算机。不过中国国产超级计算机之梦随即实现,在日揭幕的国家超级计算济南中心,以国产CPU达成超级计算机,成为中华民族之光。
世界超级计算机Top100排第14名
这台名为神威蓝光的国产超级计算机,采用8704颗16核心的申威1600处理器,采用外国厂商主导的:InfiniBand QDR技术交换器技术,连续浮点运算能力高达798TFLOPS、峰值可达1.07PFLOPS,LINPACK效率高达74.4%。这样出众的成绩一推出即位列2011年11月世界超级计算机Top500排行榜第14名(见http://www.top500.org/list/)、中国超级计算机Top100排行榜第2名(见http://www./sites/shuxue/pcC.jsp?contentId=2),可见其性能强悍,足以挤身世界顶级超级计算机平台的前列位置。
神威蓝光国产超级计算机采用了8704颗申威1600处理器
在世界超级计算机Top500排行榜排第14名
在中国超级计算机Top100排行榜排第2名
技术源自DEC Alpha 21164
有谓万丈高楼从地起,申威1600技术源于鼎鼎大名的DEC Alpha 21164。DEC Alpha 21164是90年代盛极一时的高性能服务器/工作站处理器,其技术影响后世CPU的发展良多,如超纯量(Superscalar)的工作方式为Intel Pentium处理器所沿用,而EV6总线更成为AMD Athlon处理器的前端总线(FSB),时至今日,DEC Alpha团队已被并入Intel Itanium研发团队中,继续从前顶级服务器处理器的研发工作。
虽然官方消息表明申威1600技术源于DEC Alpha 21164,但没有具体说明采用了后者甚么技术,只说明是采用国人自行开发的CPU指令集,属于精简指令集(RISC)微架构。另负责CPU研发的江南计算器所属于军方研究机构(总参56所),得到国家「核高基」重大专项的支持,基于国家安全不公开最机密的指令集架构是可以理解的。
一代名处理器Alpha 21164成为申威1600设计的基础
产品己经历三代拥有16核心
据官方消息表示,申威1600属于第三代产品。第一代申威SW-1在
2006年发表,采用单核心设计、130nm制程工艺及900MHz工作频率。第二代申威SW-2在2008年发表,采用双核心设计、130nm制程工艺及1.4GHz工作频率,工作功耗在70-100W。至于第三代即本文的主角申威1600,内建16个RISC 64位核心,65nm制程工艺及975-1200MHz工作频率,浮点运算能力高达140.88GFLOPS(1.1GHz工作频率表现),作为参考Intel Nehalem-EX 8核心为96GFLOPS(3.0GHz工作频率)、AMD Opteron 6100 12核心为83.2GLOPS(2.6GHz工作频率)、IBM Power 7 8核心为131.2GFLOPS(4.1GHz工作频率)。
申威1600采用低功耗设计,首先是它的最高工作频率不过是1.2GHz,其次是它设有标准及省电模式,使工作功耗低至35~70W左右,因此采用它的神威蓝光超级计算机功耗才1兆瓦,作为对比天河为4兆瓦,美州虎为7兆瓦。
申威1600处理器的介绍海报。
神威蓝光超级计算机采用胖树结构,各节点之间以QDR 4 x 10Gbps高速串行接口连接。
神威蓝光超级计算机采用液冷散热。
龙芯CPU正式染指服务器市场
龙芯3A服务器用CPU。
龙芯作为知名度高的国产CPU,其一举一动倍受华人世界所关注。早期的龙芯一、龙芯二因为运算性能不高,主要针对嵌入式方案及入门级笔者记计算机市场为主,而在累积两代产品的研发经验后,第三代的龙芯开始进军服务器市场,并跟宝德科技公司合作推出一系列产品,包括2x Socket的高阶版本,虽然与主流CPU性能存在不少的距离,但在国产CPU的发展上却写下新的一页。
龙芯3A采针对服务器的多核心设计
从龙芯1到龙芯3A,龙芯可说是经历了三代微架构的发展。从龙芯二开始,龙芯迎来了1GHz工作频率及对64bit的支持;而到了第三代,大突破是加入多核心设计,支持4-8个核心,并开始支持多SMP多CPU工作,令运算速度倍增。据说龙芯3A(4核心设计)的双精度浮点运算能力可达16GLOPS,而传说中的龙芯3B(8核心设计)更达128GLOPS,竟比Core i7 980X的107.55GFLOPS还要高,同一家族产品性能竟可差8倍,实教人难以相信,事实如何相信要待产品推出后才知分晓。
龙芯3A产品规格U
工作频率1GHz
核心数目4个
指令集MIPS64及龙芯扩展指令集
L1 Cache64KB(Data) + 64KB(Instruction)
L2 Cache4MB
工作总线2x HyperTransport 12.8GB/s
整合内存控制器2个64bit DDR2/3-800
晶体管数目4.25亿
制程65nm CMOS
核心面积173mm2
封装40mm x 40mm, BGA 1121pin
龙芯3A电路图,可以见到有2个HT控制器及4个核心。
支援双龙芯3A的主机板,采用的是旧式AMD RS780E + SB710芯片组。
另一款支援单龙芯3A的主机板。
借用外国厂商现成架构
龙芯3A在微架构方面仿照了AMD Athlon II的设计,特点是把内存控制器,北桥芯片等功能整成到CPU去,再以HyperTransport作为对外连接的接口,而Core与Core之间的通信以Xbar小型交换机处理,以加快处理速度。与此同时,每个Core还有专属的1MB L2 Cache存放重要的数据。笔者认为,龙芯3A的微架构使用市场上成熟的技术,可以降低研发时间及风险,但以现在的标准来看未免落后,特别是新一代CPU普遍加入共享L3 Cache设计,提升多核性能。
率先上市的两款龙芯3A服务器
这次展出龙芯3A服务器的,是一家名为宝德科技公司的深圳公司,共推出了两款龙芯3A产品,分别为PL-001及PR2920L。前者主要针对工业服务器使用,采用1U设计方便上架,后者则是2x Socket设计,可提供较高的效能。
PL-001工业服务器产品规格U
CPU1x 龙芯3A 1GHz
主机板AMD RS780E + SB710
内存4x DDR3 DIMM,最大8GB
显示功能整合ATI M72显示控制器
硬盘2x 3.5蓟4x 2.5SATA
其它Realtek Gigabit LAN & HD Audio
尺寸483mm(W) x 44.4mm(H) x 412mm(D), 19英寸1U标准上架机
售价约$7000RMB
PR2920L双路部门级服务器产品规格U
CPU1-2x 龙芯3A 1GHz
主机板AMD RS780E + SB710
内存8x DDR2 DIMM,最大8GB
显示功能整合ATI M72显示控制器
硬盘8x 3.5/2.5SATA/SAS
其它2x Intel Gigabit LAN, SATA DVD-ROM
机型19英寸1U标准上架机
尺寸675mm(W) x 88mm(H) x 430mm(D)
售价约$20000RMB
性能更胜国外同级产品―华为(海思)4核心智能手机
海思K3V2 4核心智能手机处理器。
最后要介绍的是华为(海思)4核心智能手机CPU。它由一家名为海思(HiSilicon Technologies Co., Ltd.)的公司开发,型号为K3V2。海思公司成立于2004年10月,前身是华为的ASIC 设计中心,总部位于深圳,设计团队分布北京、上海、美国硅谷、瑞典。2010年年底拥有3000名员工,有兴趣的读者可到了解更多。首批采用海思K3V2 4核心CPU的手机为华为Ascend D quad及Ascend D quad XL。
采用K3V2 的华为4核心手机
采用英国ARM 公司授权架构
K3V2 CPU架构由英国ARM公司授权而来。提起ARM公司,严格来说只是一家芯片架构设计公司,既没有自己的半导体工厂,更没有面向最终市场的产品。他只负责CPU微架构的研究,而后通过授权的方式赚钱,有效避开风险及营销产品的各式各样的开支。而对于海思公司来说,马上便可取得市场上成熟可靠的架构,确保可与他牌基于ARM架构的CPU相容。海思公司仅需专心从事CPU的设计优化及市场推广,工作效率极高。
在架构的选用上,K3V2使用目前最流行的ARM Cortex-A9架构,在40nm制程下核心面积12x12 POP,比另一款外国厂商NVIDIA Tegra 3 4核心处理器的14x14 BGA细小,成为目前业界体积最小的4核心智能手机CPU。K3V2 拥有4个最高1.2/1.5GHz的处理核心,设有热管理技术,在确保CPU温度安全的情况下,最大发挥CPU效能。据海思方面表示,K3V2的Dhrystone MIPS达15000,超过Tegra 3已知的13800 DMIPS(编按UMIPS是Million Instructoins per second的简写,即每秒执行100万次指令,是目前衡量智能手机CPU性能的重要指针。
K3V2的另一优势是在I/O性能,它拥有目前手机处理器最高端的64bit LPDDR2控制器,是外国Tegra 3 32bit控制器的一倍。不过Tegra 3可以支持DDR3-L 1500内存,以较高的内存工作频率补频宽之不足。
内建 16核心GPU
在多媒体性能方面,K3V2采用ARM公司的NEON多媒体指令集,兼容性比外国Tegra 3好。内建的GPU为32bit Immersion 16,拥有16个super GPU核心,数字上比Tegra 3的12个核心为多,但NVIDIA既为显示界的霸主,拥有强大的显示性能及兼容性,实际性能需视乎应用的不同而定。已知Immersion 16在超大型3D游戏,运行速度及流畅度可以与PC媲美。
采用各种省电技术
K3V2采用了多项技术降低功耗,宣称在同样电池容量下,比传统设计的手机可延长30%电池使用时间。它通过通讯算法优化、智能低功耗和全硬件调频调压技术,处理器各部件能因应当前的操作需求,灵活地配置性能水平,避免电力空耗的情况。不过与外国Tegra 3为省电而设的4+1架构,以慢速核心及快速核心负责不同的工作,则外国Tegra 3似乎更能针对省电作出优化,但代价是耗用更多的晶体管作为慢速核心之用,成本较高。
总结申威、龙芯及华为(海思)等国产CPU成就,得出两点结论。第一是他们均避开Intel、AMD主导的x86,避免可能遇到的技术投权等复杂问题。事实上现时x86架构的主导权牢牢的控制在Intel手里,像最新的SSE4.1/SSE 4.2及AVX指令集均需要Intel授权。与其在授权问题上与外国厂商虚耗时间,不若把时间投放在产品研发上更为划算。第二是在发展自家CPU系统时,有效化借用外国成熟的技术。比如龙芯CPU使用AMD HyperTransport总线、AMD主机板芯片组等等,既可节省研发的时间、费用及技术风险,而且最重要的CPU核心设计智识产权控制在国人的手上,借力打力,四两拨千斤,在短短十年多时间追上西方社会花几十年时间才有的成就,体现了中华民族的智慧及刻苦耐劳的精神。展望未来,中国能够推出更多高性能的CPU,而且是技术上处于世界领先水平的作品。
覆盖全国各省会城市及海外城市的网速测试
→选择要测试的地区
→选择目标测试点
>> 测试点注册判断CPU性能主要指标是什么?_百度知道
判断CPU性能主要指标是什么?
CPU的性能好坏最主要看:主频,外频,总线频率,倍频系数,缓存几个参数。主频主频也叫时钟频率,单位是兆赫(MHz)或千兆赫(GHz),用来表示CPU的运算、处理数据的速度。通常,主频越高,CPU处理数据的速度就越快。CPU的主频=外频×倍频系数。主频和实际的运算速度存在一定的关系,但并不是一个简单的线性关系。 所以,CPU的主频与CPU实际的运算能力是没有直接关系的,主频表示在CPU内数字脉冲信号震荡的速度。在Intel的处理器产品中,也可以看到这样的例子:1 GHz Itanium芯片能够表现得差不多跟2.66 GHz至强(Xeon)/Opteron一样快,或是1.5 GHz Itanium 2大约跟4 GHz Xeon/Opteron一样快。CPU的运算速度还要看CPU的流水线、总线等各方面的性能指标。外频外频是CPU的基准频率,单位是MHz。CPU的外频决定着整块主板的运行速度。通俗地说,在台式机中,所说的超频,都是超CPU的外频(当然一般情况下,CPU的倍频都是被锁住的)相信这点是很好理解的。但对于服务器CPU来讲,超频是绝对不允许的。前面说到CPU决定着主板的运行速度,两者是同步运行的,如果把服务器CPU超频了,改变了外频,会产生异步运行,(台式机很多主板都支持异步运行)这样会造成整个服务器系统的不稳定。绝大部分电脑系统中外频与主板前端总线不是同步速度的,而外频与前端总线(FSB)频率又很容易被混为一谈。总线频率AMD 羿龙II X4 955黑盒前端总线(FSB)是将CPU连接到北桥芯片的总线。前端总线(FSB)频率(即总线频率)是直接影响CPU与内存直接数据交换速度。有一条公式可以计算,即数据带宽=(总线频率×数据位宽)/8,数据传输最大带宽取决于所有同时传输的数据的宽度和传输频率。比方,支持64位的至强Nocona,前端总线是800MHz,按照公式,它的数据传输最大带宽是6.4GB/秒。外频与前端总线(FSB)频率的区别:前端总线的速度指的是数据传输的速度,外频是CPU与主板之间同步运行的速度。也就是说,100MHz外频特指数字脉冲信号在每秒钟震荡一亿次;而100MHz前端总线指的是每秒钟CPU可接受的数据传输量是100MHz×64bit÷8bit/Byte=800MB/s。倍频系数倍频系数是指CPU主频与外频之间的相对比例关系。在相同的外频下,倍频越高CPU的频率也越高。但实际上,在相同外频的前提下,高倍频的CPU本身意义并不大。这是因为CPU与系统之间数据传输速度是有限的,一味追求高主频而得到高倍频的CPU就会出现明显的“瓶颈”效应-CPU从系统中得到数据的极限速度不能够满足CPU运算的速度。一般除了工程样版的Intel的CPU都是锁了倍频的,少量的如Intel酷睿2核心的奔腾双核E6500K和一些至尊版的CPU不锁倍频,而AMD之前都没有锁,AMD推出了黑盒版CPU(即不锁倍频版本,用户可以自由调节倍频,调节倍频的超频方式比调节外频稳定得多)。缓存缓存大小也是CPU的重要指标之一,而且缓存的结构和大小对CPU速度的影响非常大,CPU内缓存的运行频率极高,一般是和处理器同频运作,工作效率远远大于系统内存和硬盘。实际工作时,CPU往往需要重复读取同样的数据块,而缓存容量的增大,可以大幅度提升CPU内部读取数据的命中率,而不用再到内存或者硬盘上寻找,以此提高系统性能。但是由于CPU芯片面积和成本的因素来考虑,缓存都很小。L1 Cache(一级缓存)是CPU第一层高速缓存,分为数据缓存和指令缓存。内置的L1高速缓存的容量和结构对CPU的性能影响较大,不过高速缓冲存储器均由静态RAM组成,结构较复杂,在CPU管芯面积不能太大的情况下,L1级高速缓存的容量不可能做得太大。一般服务器CPU的L1缓存的容量通常在32-256KB。L2 Cache(二级缓存)是CPU的第二层高速缓存,分内部和外部两种芯片。内部的芯片二级缓存运行速度与主频相同,而外部的二级缓存则只有主频的一半。L2高速缓存容量也会影响CPU的性能,原则是越大越好,以前家庭用CPU容量最大的是512KB,笔记本电脑中也可以达到2M,而服务器和工作站上用CPU的L2高速缓存更高,可以达到8M以上。L3 Cache(三级缓存),分为两种,早期的是外置,内存延迟,同时提升大数据量计算时处理器的性能。降低内存延迟和提升大数据量计算能力对游戏都很有帮助。而在服务器领域增加L3缓存在性能方面仍然有显著的提升。比方具有较大L3缓存的配置利用物理内存会更有效,故它比较慢的磁盘I/O子系统可以处理更多的数据请求。具有较大L3缓存的处理器提供更有效的文件系统缓存行为及较短消息和处理器队列长度。
其他类似问题
为您推荐:
提问者采纳
而采用写通(Write-through)结构的高速缓存,并且将采用铜配线技术。
第六,L1级高速缓存的容量不可能做得太大。超标量是指在一个时钟周期内CPU可以执行一条以上的指令。在486以上的计算机中基本采用了回写式高速缓存,CPU一般都内置了协处理器.18微米,随着CPU的制造工艺与主频的提高,容量为512K。流水线的工作方式就象工业生产上的装配流水线,乱序执行是指CPU采用了允许将多条指令不按程序规定的顺序分开发送给各相应电路单元处理的技术,来协调两者之间的差异,把处理多媒体的能力提高了60%左右。分枝有无条件分枝和有条件分枝。 第四。它对读和写操作均有可提供缓存,最新的CPU制造工艺可以达到0、286。超流水线是指某型 CPU内部的流水线超过通常的5~6步以上,因此提高了CPU的运算速度,Intel最新出品的Coppermine已经采用1,只有Pentium级以上CPU才具有这种超标量结构,一般等同于CPU的外频。比如Intel的MMX技术,而内存总线速度就是指CPU与二级(L2)高速缓存和内存之间的工作频率.25微米、8088等等微机CPU的浮点运算性能都相当落后:流水线技术.5V/而倍频则是指CPU外频与主频相差的倍数,因此才能适应工作主频更高的CPU,也就是CPU的时钟频率。Pentium Pro处理器的L2和CPU运行在相同频率下的,因此386。这在486或者以前的CPU上是很难想象的、PIII 550都是指CPU的主频而言的。 第五:协处理器或者叫数学协处理器。现在CPU的浮点单元(协处理器)往往对多媒体指令进行了优化,因此需要“分枝预测”技术处理的是条件分枝,自从486以后。分枝是指程序运行时需要改变的节点, PII和赛扬可以达到0:L2高速缓存.35微米。 第二,仅对读操作有效。内存总线的速度对整个系统性能来说很重要,它们的工作电压一般为5V。将流水线设计的步(级)数越多:工作电压。不过由于各种CPU的内部结构也不尽相同。在486以前的CPU里面,所以出现了二级缓存、图形和通信应用方面而采取的新技术, Pentium CPU的制造工艺是0.3V&#47,一个时钟周期完成的指令数是固定的,在CPU管芯面积不能太大的情况下;2:制造工艺,例如Pentium pro的流水线就长达14步:乱序执行和分枝预测。 第九。内置的L1高速缓存的容量和结构对CPU的性能影响较大.6V的工作电压了,所以主频越高,也就是我们经常说的一级高速缓存。为降低成本Intel公司曾生产了一种不带L2的CPU名为赛扬。
第三,而条件分枝则必须根据处理结果再决定程序运行方向是否改变;3,是没有内置协处理器的,但成本昂贵,然后将一条X86指令分成5~6步后再由这些电路单元分别执行。工作电压指的也就是CPU正常工作所需的电压。 第七。早期CPU(386,CPU的速度也就越快了,可以极大地提高CPU的集成度和工作频率,指CPU外部的高速缓存。
第八。采用回写(Write Back)结构的高速缓存,这样就能实现在一个CPU时钟周期完成一条指令。MMX是Intel公司在1996年为增强Pentium CPU在音像,这对于笔记本电脑尤其重要。在CPU里面内置了高速缓存可以提高CPU的运行效率:主频。流水线(pipeline)是 Intel首次在486芯片中开始使用的、超标量,结构较复杂、486)由于工艺落后,MMX是“多媒体扩展指令集”的缩写。至于外频就是系统总线的工作频率,不过高速缓冲存储器均由静态RAM组成,CPU的工作电压有逐步下降的趋势:L1高速缓存:内存总线速度或者叫系统总路线速度。低电压能解决耗电过大和发热过高的问题。用公式表示就是,其中无条件分枝只需要CPU按指令顺序执行,所以才会超标量的CPU:主频=外频×倍频。在CPU中由5~6个不同功能的电路单元组成一条指令处理流水线,为了缓解内存带来的瓶颈;这是因为现代的CPU越来越多的采用了RISC技术。我们通常说的赛扬433,其完成一条指令的速度越快。为CPU新增加57条MMX指令,简单地说也就是CPU的工作频率,协处理器的功能也不再局限于增强浮点运算,发展到奔腾586时。由于协处理器主要的功能就是负责浮点运算,已经是3.8V了,由于内存速度的发展滞后于CPU的发展速度,所以并不能完全用主频来概括CPU的性能。一般说来第一,所以Pentium II运行在相当于CPU频率一半下的
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁衡量CPU性能的几个参数指标介绍_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
衡量CPU性能的几个参数指标介绍
上传于||文档简介
&&衡​量​C​P​U​性​能​的​几​个​参​数​指​标​介​绍
阅读已结束,如果下载本文需要使用
想免费下载本文?
下载文档到电脑,查找使用更方便
还剩1页未读,继续阅读
你可能喜欢您所在位置: &
斑马GT820 能让你体验到卓越的性能和出色的可靠性,强大的32位处理器和超快的打印速度,帮你显著的提高工作效率
上传产品高清图片 >>
斑马GT820 能让你体验到卓越的性能和出色的可靠性,强大的32位处理器和超快的打印速度,帮你显著的提高工作效率
商家名称:郑州平行线电子
联 系 人:王经理
在线QQ:&&&&
联系电话:8
公司网址:
公司地址:郑州市科技市场创新大厦一楼A115-2 工厂地址:文化路与英才街交叉口向西500米
业务范围:条码打印耗材全系列,条码打印机,软件,收银纸,收款机,小票打印机,数据采集器,扫描枪,读卡器,密码键盘等
豫ICP备号 Copyright 2008-
法律声明:本站只提供信息交流平台,交易者自行分辨真假,如有损失,本站概不负责。
上传高清图片联通公共基础知识复习题库判断题_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
联通公共基础知识复习题库判断题
上传于||暂无简介
阅读已结束,如果下载本文需要使用
想免费下载本文?
下载文档到电脑,查找使用更方便
还剩100页未读,继续阅读
你可能喜欢}

我要回帖

更多关于 人工效率的衡量指标 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信