如何看待 "致常熟市龙芯网校15周年 胡伟武披露常熟市龙芯网校3号开发历程

龙芯15周年 胡伟武披露龙芯3号开发历程
中科院计算技术研究所研究员
关键字: 龙芯CPU处理器芯片胡伟武
近日,龙芯中科宣布3A3000四核处理器芯片完成流片并通过系统测试。根据现有的测试结果,龙芯3A3000达到了预定的设计性能目标。其中,综合计算性能方面,在1.5GHz主频下,GCC编译的SPEC CPU 2006定点和浮点单核分值分别超过11分和10分;访存性能方面,Steam分值超过13GBps。龙芯3A3000的流片成功,标志着我国自主研发的高性能微处理器芯片,可以超越目前引进的同类芯片性能。
龙芯CPU首席科学家胡伟武日前撰写了2万字长文,纪念龙芯诞生15周年,披露了龙芯3号开发的历程。观察者网获授权转载全文如下:
2016年是红军长征胜利80周年,2016年研制成功的龙芯3A3000处理器即以CZ80命名,每颗芯片的硅片上都刻有CZ80字样。
1936年10月,红一、二、四方面军经过艰苦卓绝的努力,三大主力会师,开创了中国革命的新局面。它雄辩地表明,只要坚持理想,实事求是,中国共产党完全有能力摧坚于正锐、挽澜于极危,从重大挫折中走出来。
2016年10月,以长征胜利80周年命名为CZ80的龙芯3A3000处理器研制成功。它雄辩地表明,只要坚持自主研发,进行持续改进,自主研发的CPU性能完全可以超过引进技术的CPU,满足自主信息化需求。
日,我怀着虔诚的心情走进毛主席纪念堂,向毛主席汇报龙芯3A3000的研制成功。步出毛主席纪念堂,我感慨万千。当十年前我开始龙芯3号研制时,完全没有想到龙芯3号系列CPU发展道路之曲折,奋斗之艰辛,付出之巨大。
日,以长征胜利70周年命名为CZ70的龙芯2E通过科技部组织的验收,时任科技部部长徐冠华亲自参加了龙芯2E的验收会。龙芯2E的研制是“十五”末国家863计划紧急安排的一个任务。当时“汉芯”造假事件被曝光,加上“十五”863计划早期支持的龙芯2C没有达到合同要求的SPEC CPU2000分值300分的目标,自主处理器研发受到普遍质疑。2005年4月,科技部高新司领导把我叫到办公室,问我到2005年年底前能不能完成863计划“十五”初制定的主频1GHz、SPEC CPU2000分值达到500分的目标。我说剩下不到一年时间,肯定来不及。他说根据有关规定,项目时间到期后三个月内(即2006年3月底前)提出验收申请就算按时完成。我硬着头皮接了该任务,因为我知道如果“十五”的任务完不成,那“十一五”国家是不是还支持自主CPU研发就成问题。经过艰苦的努力,龙芯2E在2005年11月底交付流片(把设计好的技术文件交给芯片生产厂家进行生产),日流片成功,达到了技术指标。虽然达到这些指标有些勉强(SPEC CPU2000分值达到500分是计算所的编译组做了很多编译优化实现的,但SPEC CPU的测试是允许进行编译优化的),但毕竟完成了指标。龙芯2E的意义从徐冠华部长参加完验收会后接受新闻联播记者采访时说的一句话可以看出:龙芯2E的成功表明,我国在“十五”期间安排的自主CPU研发是成功的。这也为“十一五”期间国家继续支持自主CPU研发打下了基础。
2005年深秋,利用龙芯2E流片后等待芯片回来的时间我带着部分龙芯课题组的骨干在香山别墅讨论龙芯3号的结构方案。香山别墅和香山饭店一样在香山公园内,但比香山饭店便宜而且清静。香山别墅三天讨论的成果是基本明确了龙芯3号系列CPU的可伸缩互连结构以及基于目录的Cache一致性协议。龙芯3号的互连结构中,每个结点四个处理器核通过交叉开关进行全相连,结点间(不论片上还是片间)通过可伸缩的mesh网络相连;多核的Cache一致性采用基于目录的一致性协议,目录设置在片上共享的最后一级Cache(LLC)上。上述结构有别于当时主流的环状多核互连以及基于侦听的Cache一致性协议。现在看来,该结构是成功的,目前商用主流处理器随着核数的增加也越来越多采用可伸缩的互连结构以及基于目录的Cache一致性协议。
在香山别墅的讨论中还明确了龙芯3号片内集成内存控制器以及HyperTransport(简称HT)接口。HT是AMD主推的系统总线接口。当时计算所高性能中心与AMD合作紧密,希望我们使用HT接口。此外HT接口比较开放,只要每年交5000美元就可以用于商业应用,但AMD开放的HT接口不支持多片互连的Cache一致性协议,我们自己进行了扩充。曾经有一段时间,我后悔选择了HT总线,觉得HT总线不如PCIE总线普及,一是HT总线没有现成的PHY(片内高速接口模块)可以买到,每次工艺升级都需要定制HT的PHY,而PCIE的PHY有很多;二是PCIE接口的外围器件很多,而HT接口的桥片只有AMD有。但现在觉得选用HT是对的。HT是系统总线,协议简单高效,相当于Intel的QPI系统总线,而PCIE是IO总线,通过HT总线可以方便地把多片龙芯3号直连起来形成多路服务器。虽然每次工艺升级都要定制HT PHY,但可以使龙芯CPU不依赖别人的IP,自主性强。龙芯3号所有CPU中,没有一款CPU需要到厂家merge第三方IP。尤其是龙芯3A0,除了厂家提供的标准单元库、单/双端口RAM以及低速IO单元,每一行代码(包括CPU核、内存控制器、HT控制器、互连网络等)以及每一个定制模块(包括多端口寄存器堆、锁相环、HT PHY、DDR2/3 PHY等)都自主设计。至于外围桥片,龙芯已经开始研制并提供外围桥片,桥片上支持足够多的PCIE接口。以后不论AMD是否继续发展HT接口,龙芯都能自成体系往前走了。
香山别墅会议的另外一个成果是明确了龙芯抗辐照CPU的发展。有一天晚上8点左右,我们正在会议室热烈地讨论龙芯3号的结构,当时在计算所科研处工作的夏洪流和傅信国给我打电话说是要来跟我谈一个项目的事。他们到香山别墅已是晚上9点多,我们就坐在香山别墅的走廊尽头谈,他们说科学院有一个抗辐照CPU的预研项目,希望龙芯课题组来承担。我刚开始不愿意做,结果他们好说歹说地让我勉强答应了,当时的一个理由是领导每年对他们争取的项目经费有要求,我如果不做这个抗辐照CPU项目,他们的任务就完不成了,我头脑一热就答应了。现在龙芯抗辐照CPU已经随着以北斗为代表的多颗卫星在天空翱翔,每年还为龙芯公司带来较可观的收入,成为龙芯公司的战略产品并开始走向系列化。真是非常感谢夏洪流和傅信国那天晚上的苦口婆心。
在龙芯3号结构基本确定后就展开了龙芯3号CPU的研发。但当时“十五”863课题结束了,“十一五”“核高基”(即“核心电子器件、高端通用芯片和基础软件产品”重大专项)课题迟迟启动不了。为此,科学院对龙芯3号的研制给了500万元的前期经费支持(执行期限2007年1月到2007年12月)。科技部高新司冯记春司长得知龙芯3号的第一款芯片龙芯3A1000已经基本完成设计,但缺少流片费时,在863计划内紧急安排了2000万的经费支持龙芯3号的研制(执行期限2008年1月到2010年12月)。原计算所所长李国杰院士曾经在计算所中层干部会上当众点我的名说,“胡伟武,你不能以任何经费的理由放缓龙芯3号的研制,计算所就是砸锅卖铁也要支持龙芯的研发”,并在所内设立了一个经费没有封顶的课题,到2010年龙芯第一笔“核高基”课题经费到账时,龙芯课题组已经预支了计算所七、八千万元经费。
在龙芯3号研制过程中,作为中法两国在IT领域战略合作的一部分,科技部安排龙芯CPU在意法半导体流片。日,在胡锦涛总书记和希拉克总统共同见证下,中国科学院与意法半导体在人民大会堂签署了关于龙芯CPU战略合作的文件。基于龙芯2E的成功,意法半导体还花三百多万美元授权费购买了龙芯2号系列产品的授权,其中龙芯的第一个产品芯片龙芯2F于日流片成功,目前仍在大量应用中。后来意法半导体由于自身业务的原因终止了购买龙芯2号系列的产品授权,计算所收回了龙芯2号的产品权利并同意不再收取剩余的三分之一左右授权费,但我们从龙芯2F的研制中学会了意法半导体的芯片质量管理,学会如何把一个样品变成产品。龙芯CPU在意法半导体的流片一直延续了下来,龙芯3A1000即使用意法半导体的65nm工艺流片。
不记得经历了多少加班加点,龙芯3A年底交付流片。只记得流片前的几个月每天晚上十点开例会安排工作。晚上十点例会是非常高效的一种工作方法,会后大家把有关设计在EDA服务器上跑起来再回家,第二天早上上班时刚好跑出结果来;如果是早上上班后开始在EDA服务器上跑,基本上大半天就在等待服务器运行出结果中度过。在此后龙芯CPU问题的攻关中,一直沿袭了晚上例会安排工作的方法。
日龙芯3A1000晶圆生产下线,9月28日样片回来,成功启动操作系统,主频800MHz-1GHz。这是龙芯CPU第一次启动多核操作系统,免不了调一通。印象最深刻的是10月2日晚上熬了个通宵,一起的有王剑等人,刚开始是挨个核跑单核操作系统,把每个核都跑一遍,再把多核操作系统搞稳定,一直到第二天早上才弄完。
本文仅代表作者个人观点。
责任编辑:孙武中国芯生存状态调查:龙芯还活着吗?查看: 26972|回复: 102
胡伟武谈龙芯15周年抓“虫”记
龙芯4000单核心整体性能会比3000提升50%,但是要用3年时间。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
RE: 胡伟武谈龙芯15周年抓“虫”记
这个说的是同频率吧,还是不错了。amd的zen出来前已经很久没啥提升了。当年ibm的移动芯片一年涨不了100m ...
单核心性能整体提升50%;
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
scxtx 发表于
我也搞不明白龙芯为何不先把主频提上去
从的历程看,不改前端,只改后端,1年就够了
纵观CPU发展史,都是先玩频率,频率玩不下去了,才开始提升微结构!
估计龙芯目前的GS464E架构就做不到高频(前端设计限制了后端提频),所以后续的提频必须逐渐修改微结构?!
龙芯为了提升IPC,牺牲了其它方面的可优化,可扩展性也不是不可能?!
龙芯目前走的路也不一定是正确的道路(站在通用CPU角度看)!
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
deam 发表于
很多非常重要的数据,给这里多年前的争议盖棺定论。
我咋没看出有啥重要的数据?
还是因为这个文章说的跟我预料的差不多?
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
RE: 胡伟武谈龙芯15周年抓“虫”记
一个是3a 1000的06跑分,这个当年我和花落庭院争了好久;
然后是当年花落庭院率先得到的,关于gs464e的i ...
最后就是3a 3000和a8的spec分数比较,最后结果是75%。
那个spec??
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
deam 发表于
<font color="#00吧,当初你说的就是spec 2000,龙芯这边的gcc成绩对a8的clang
龙芯3000的spec2000成绩就没有提高
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
花落庭院 发表于
老胡文章的原话,你是从那个地方知道spec2000没有提高?
同频,你算算啊
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
deam 发表于
同频提升6.7%啊
咋算的?& &&&
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
deam 发表于
频率提升50%的同时性能提升60%,ipc提升不就是1.6/1.5-1?
762*1.5=1143
HWW也说是1100多,这叫spec2000提升了?
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
花落庭院 发表于
芯片设计可能八字没一撇,算分数干什么?再你这样算gcc分数,这个11分是什么版本gcc编译的?
4.4.7或更新的版本,搞不好就是4.8
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
RE: 胡伟武谈龙芯15周年抓“虫”记
还有老胡不是说龙芯3000每ghz的spec06是7,个人怀疑他是11(定点)+10(浮点),然后除2,再除1.5刚好是7 ...
(11+10)/ 2 / 1.5 是等于7,你说的有些道理;
但是提升60,到底怎么算出来的?
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
RE: 胡伟武谈龙芯15周年抓“虫”记
定点单线程提升50%,你这是那里来的数据?假如是真的,定点ipc提升最多10%,因为向量扩展指令对单线程 ...
4000相对于3000, 单核心整体性能提升50%吧;
----------------------------------
可以计算一下:
1. 频率: 1.5 -& 2.0, 提升 33%
2. IPC:&&7.3 -& 10,&&提升36%
综合提升80%,这是极限提升,建立在1和2同时满足的条件下;
考虑到IPC提升到10可能有些困难(无论有没有Vector加成;但是必须用GCC,通用优化),且IPC随频率升高而下降; 打个折扣,7-8折吧,也就50-60%的提升了
龙芯4000的IPC提升到9还是“可以期望”的,10只能算是目标,绝对不可期望,更不能作为实际分数。这样算下来还是提升50-60%。
龙芯4000的IPC提升到8.5-9这是必须满足的,否则根本对不起“3年”这么长的时间,也会被飞腾,申威,兆芯等超过。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
RE: 胡伟武谈龙芯15周年抓“虫”记
根本看不懂你说什么?haswell在gcc7.0定点指令并行才有9.3/ghz,你凭什么要求龙芯4000用gcc4.8达到10/g ...
haswell是在将近4GHz的主频下平均下来的IPC,如果限定haswell为1G测试,IPC会不会有12呢?!
老胡的这个10能跟haswell的9.7比较么?
还有,老胡说的10具体代表啥,你也不要乱解析好不:
反正提升50%这个是非常可靠的消息,你也别失望,别不乐意;我比你更失望,更不乐意。
铁流也很失望,真是难得,一个如此忠实的龙芯粉也会失望!
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
RE: 胡伟武谈龙芯15周年抓“虫”记
根本看不懂你说什么?haswell在gcc7.0定点指令并行才有9.3/ghz,你凭什么要求龙芯4000用gcc4.8达到10/g ...
还有,好好看看;
龙芯&根本无法达到& 10分才是我的观点,我的观点是: 龙芯能有9分就相当不容易了;
达到10分是HWW画的饼;我们一致认为10分是达不到的,9分已经是很高了。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
RE: 胡伟武谈龙芯15周年抓“虫”记
我就是这个意思。
这里可以看出龙芯对IPC的某种理解,因为当时定目标时是内部目标没有宣传因素考虑, ...
单独说3A1000, 就把IPC拉高;
凸显3A2000, 就把3A1000的IPC拉低
反正 “衡量标准很多,没有对错之分,适用场景不同而已”。
就比如各种厂商,各种发布会,都是相对于abc以来最大的def,说的跟abc很差似得;但是宣传abc的时候,却又是另外一种说辞。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
RE: 胡伟武谈龙芯15周年抓“虫”记
关键在于,这个3倍的说法是一开始他们内部定目标时确定的,也就是说并没有宣传的考虑。
倒不如说以前 ...
指定目标的时候,所谓的3倍,肯定是基于“被夸大”的3A1000来的;而不是与2000对比中的3A1000;
目标么,一般都是高的,基本都得打个折扣。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
花落庭院 发表于
就你一个人yy目标是高的,龙芯公司说都达到预期设计目标。。。。。
任何人,只要站在HWW角度,都会说达到目标。
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
deam 发表于
显然,事实恰恰相反。
不存在反例!& && && && && &
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
花落庭院 发表于
你脑袋里估计都是火星技术,难道你以为gcc4.4.7就可以达到900分,假如有向量扩展,gcc4..4.7达到1000+就 ...
也不知道是谁说的:模拟器下/GHz(spec2000)
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
RE: 胡伟武谈龙芯15周年抓“虫”记
龙芯公司说gcc下可以达到900,就是gcc4.4.7可以到900+?我承认模拟器分数是我脑补的。。。。
那你给出gcc-4.8、5.x、6.x的龙芯3000分数啊,我也希望在新gcc下分数猛增啊;
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
花落庭院 发表于
为什么是我给?你质疑龙芯设计目标,不是我,你应该证明龙芯高版本gcc跑不到900,不是用gcc4.4.7证明。还 ...
怪不得,原来900只存在YY里
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
超大游击队员
花落庭院 发表于
yy也要有基础的,人家好歹gcc specint 06有7.33以上,你家飞腾处理器有多少?你家sw有spec06测试吗?还是 ...
是你龙芯官方发文:拳打飞腾,脚踢申威,藐视兆芯的。怎么,一提数据就开始装疯卖傻了?!
最具影响力军事论坛-超级大本营军事论坛欢迎你!超然物外,有容乃大。
声明:论坛言论仅代表网友个人观点,不代表超级大本营军事网站立场
Powered by Discuz &
超级大本营军事网站
(违法及不良信息举报电话:)
最具影响力中文军事论坛 - Most Influential Chinese Military Forum实践理解应用RTOS各组件
用三极管搭建深度电路系统
物联网安全从小白到大师
开关电源的芯片设计之秘
实战让你秒懂mbed OS
&08-08&20:00
&08-15&20:00
&08-11&20:00
&08-25&10:00
移入鼠标可放大二维码
一十五年如一日 龙芯成就中国梦 我们的龙芯15周年
来源:未知 作者:辰光日 16:00
[导读] 近日,在新闻上看到《我们的龙芯3号-致龙芯15周年》一文,是龙芯CPU首席科学家胡伟武的署名文章,披露了龙芯3号CPU开发过程中的真实经历。回想到若干年前看到的《我们的CPU》,《我们的龙芯1号》,《我们的龙芯2号》三篇文章,依然心潮澎湃。从龙芯1号到龙芯3号十五年来龙芯经历了注定不平凡的历程。我们能看到龙芯人为了中国信息产业的基础核心技术“CPU”能实现独立自主发展,实现民族复兴的中国梦而努力开拓,百折不挠的奋斗过程。
  近日,在新闻上看到《我们的龙芯3号-致龙芯15周年》一文,是龙芯CPU首席科学家胡伟武的署名文章,披露了龙芯3号CPU开发过程中的真实经历。回想到若干年前看到的《我们的CPU》,《我们的龙芯1号》,《我们的龙芯2号》三篇文章,依然心潮澎湃。从龙芯1号到龙芯3号十五年来龙芯经历了注定不平凡的历程。我们能看到龙芯人为了中国信息产业的基础核心技术&CPU&能实现独立自主发展,实现民族复兴的中国梦而努力开拓,百折不挠的奋斗过程。
  龙芯3A3000芯片
  龙芯俱乐部采用龙芯3A2000 CPU的龙芯开源电脑
  笔者爱看历史,中国很早以来就是繁荣先进的文明。这和我们的祖先很早就发明了文字,竹简,文房四宝等在当时世界上领先的信息技术工具不无关系,还有就是先进的计算工具-&算盘&。中国发明的算盘有一千多年的悠久历史,在古代就是当时最先进的&计算机&,是中国古代在信息技术领域的一项伟大、领先的发明,也是古代中国经济能持续繁荣的重要基础。
  中国古代就发明了世界领先的计算工具-算盘(中国国家博物馆收藏的明代算盘)
  也是由于历史原因,中国在以电子计算机为代表的现代信息时代暂时落后了,曾经几乎全盘丧失了信息产业基础核心技术的自主能力和信心,这既不符合国家信息产业的安全需要,也不符合民族伟大复兴的目标。但我毫不怀疑当代中国人能实现伟大的复兴,因为这在漫长的历史长河中已经证明了多次,而现在我们比任何时期都接近民族复兴的目标。
  龙芯应用于北斗导航卫星为中国航天产业提供支持
  在每次民族复兴的光荣时刻都有一批仁人志士抛头颅洒热血,忍辱负重,不惧牺牲,走在时代的最前面,就如80年前的伟大长征。正因为龙芯人身负历史的重任,选择了建立自主IT生态的目标,所以走上了最难,最长的发展路线,在很长的时间里看不到回报,也面临不解者的质疑。从文章里我们能看到看到十五年前,龙芯人在龙芯1号,龙芯2号的研发过程的热情投入并一直坚持到今天龙芯3A3000流片成功。在国产CPU从无到有,从弱到强的的过程中,十五年的坚持是对龙芯人最好的诠释。当前龙芯的道路正越走越宽,也就如80年前的长征一样,经历了无数曲折,艰难与困惑,生死一线和痛苦抉择,而如今,坚持终得到回报,成功的曙光已经出现。
  龙芯15年来发展出完善的大中小CPU产品线
龙芯相关文章
龙芯相关下载
处理器相关文章
处理器相关下载
日,来自华为运营商BG Marketing部副总裁樊黎峰在2017中国国际物联网和智慧中国高峰论坛上发表了《NB-IoT开启规模商用的“黄金时代”》的主题演...
8月16日,在物联传媒举办的2017中国国际物联网与智慧中国高峰论坛上,来自中国电信广研院行业应用中心总经理钟致民先生发表了《拥抱5G,加速万物互联...
创新实用技术专题
供应链服务
商务及广告合作
Jeffery Guo
关注我们的微信
供应链服务 PCB/IC/PCBA
版权所有 (C) 深圳华强聚丰电子科技有限公司
电信与信息服务业务经营许可证:粤B2-}

我要回帖

更多关于 常熟市龙芯网校 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信