今天龙芯中科发布了龙芯4000系列CPU芯片,分别是3A4000和3B4000。性能方面,3A4000/3B4000采用28nm FDSOI工艺,其微架构是GS464V的核心,通用处理性能提升一倍以上,将成为我国自主CPU发展史上的又一里程碑。
据悉,龙芯4000系列对虚拟机的支持进一步提升,效率达到95%以上。相同主频下,龙芯4000系列的流水线效率比3A3000高50%,主频1.8GHz-2.0GHz。
龙芯中科总裁、中科院计算所总工程师、龙芯CPU首席科学家胡博士介绍,龙芯4000系列是首款全面集成可信模块、国产密码算法、访问控制等安全机制的CPU芯片。
也就是说,龙芯4000系列处理器不仅性能大幅提升,还具备片上安全机制和高效云化的特点。
据报道,龙芯2019年的芯片出货量已经超过50万片。未来龙芯中科将重点提升CPU主频和核心数,3A5000和3C5000芯片将分别在2020年上半年和下半年铺开。
▲龙芯中科总裁、中科院计算所总工程师、龙芯CPU首席科学家胡魏武博士
一、中国自主CPU发展的里程碑 龙芯中科是国内自主高性能通用处理器技术领导者和产品提供商,搭载龙芯中科CPU的计算机进入政府采购目录。
龙芯,脱胎于中国科学院计算研究所,研发了中国第一款具有自主知识产权的通用高性能微处理器芯片。
CPU芯片长期被英特尔等国外巨头垄断。龙芯首次推出龙芯一号和龙芯二号,打破了中国没有自主研发CPU芯片的历史,是中国计算机产业拥有自主知识产权道路上的里程碑。
从2001年开始,龙芯开发了龙芯1号、龙芯2号、龙芯3号三个系列处理器和龙芯桥芯片系列。
龙芯一号系列是32位低功耗低成本处理器,主要面向低端嵌入式和特殊应用。龙芯2系列是64位低功耗单核或双核处理器,主要应用于工业控制和终端。龙芯3系列是64位多核系列处理器,主要应用于桌面和服务器领域。
今天发布的龙芯3A4000是龙芯3系列处理器的最新产品,距离上一代龙芯3A3000发布已经过去两年。
2017年,龙芯全年营收达到1.5亿元,利润超过2000万元。2018年营收和利润比2017年翻了一番,利润达到历史最高水平。交的税已经超过了国家给龙芯的各种补贴的总和。
胡表示,今年上半年,龙芯的营收已经超过去年全年,利润是去年全年的1.3倍左右。据估计,到2021年,龙芯给国家的税收将超过R&D以前所有的**。
其次,采用GS464v架构实现了三个特点。 龙芯3A4000是龙芯第三代高性能处理器核心。采用新一代处理器架构GS464V,双DDR4-2400/2133内存通道,双HT3.0系统总线,效率翻倍。
性能方面,其主频1.8GHz,睿频2.0GHz,采用37.5mm*37.5mm封装工艺,典型功耗30-40 W..
据胡介绍,龙芯3A4000有三个主要特点:
1.相同过程的性能成倍增加。
龙芯3A4000采用28nm工艺,通过设计优化进一步提升处理器性能。SPEC INT2000反映传统台式机性能的单核基础分从930提高到2090。
此外,与3A3000相比,科学计算性能提升4倍以上,支持128/256位向量。而3B4000支持四路直连,相比3B3000双路服务器,四路服务器的性能也提升了4倍。
与此同时,龙芯3A4000虚拟机的效率得到了大幅提升,从88%提升到了98%。胡表示,其单核性能已经高于用14nm实现的Arm处理器。
2.片上安全机制
龙芯3A4000支持AES、MD5、SHA等加解密算法。片上集成安全与信任模块支持国家秘密算法。
此外,支持操作系统内核栈保护机制、IO保护、安全执行环境等访问控制,高性能密码算法服务能力支持商及以上算法。
3.独立研发
龙芯3A4000的所有模块源代码和各类全定制模块都是自主开发的,除了厂商提供的标准单元库和内存编译器,没有第三方IP。
此外,龙芯3A4000在电源管理和封装方面也做了进一步的改进。
一方面,它的第五核(GS132E)监控主核的运行,并进行动态电源管理。比如搭载龙芯3A4000的笔记本电脑,工作时间是3A3000的两倍以上。
另一方面,龙芯3A4000的封装尺寸比3A3000更小,支持BGA、LGA、CBGA等多种封装,其桌面主板可支持四层布线。
值得一提的是,龙芯4000系列中用于片间互联和桥接的HT控制器带宽提升了一倍以上,内存控制器从DDR3升级到DDR4,SPEC CPU2006的定点和浮点单核分数提升到20分。
不过,胡也指出,龙芯4000系列处理器仍然存在两大问题。
第一,DDR4内存频率不够高。DDR4的指定速率范围是1600到3200,而龙芯4000系列的DDR4最高工作速率是2400/2133,离指定范围还很远。
第二,功耗太高。非矢量模式典型功耗30-40W,主要是技术不够先进,设计优化极端。建议在科学计算环境中使用256位浮点向量时,适当降低电压和频率。
三、未来重点突破频率和核数 胡表示,龙芯下一步的研发重点将放在提高主频和核数上。
一方面,龙芯3A5000将主频提升至2.5GHz,单核性能用12nm工艺提升至30分钟左右,计划2020年上半年铺开。
同时,其内存控制器延迟/带宽进一步优化,LLC翻倍,实现了操作系统级别的二进制兼容。
另一方面,龙芯3C5000将增加核心数量,同样采用12nm工艺,支持4-16路服务器。计划2020年下半年铺开。
在胡看来,目前国内CPU企业发展核心技术主要有两种方式。一是以市场换技术,如汽车工业;二是市场带来技术,比如航天工业,而龙芯科技走的是第二条路。
龙芯科技有限公司通过体制内的市场引导带动技术进步后,将进一步参与体制外的市场竞争。同时,龙芯CPU自主编译CPU源代码,在应用中不断进化,注重自主CPU的自主生态建设,逐步提升产品性能,完善生态。
虽然龙芯的发展至今为中国半导体产业的崛起提供了不可或缺的力量。但胡认为,我国自主CPU在通用处理能力、单核性能、设计能力等方面与国外先进水平仍有较大差距。
“龙芯需要练好内功,通过设计优化提高单核的通用处理性能。”胡表示,3A4000和3B4000基本填补了单核通用处理性能的缺陷,性能提升了2到3倍(约20到30分),达到了AMD的水平。
目前市面上主流CPU用GCC编制的单核分数是20到40。
第四,龙芯操作系统支持软件生态建设。
胡表示,龙芯的操作系统目前有业务和技术两种模式。
针对专业化企业,龙芯提供桌面和Windows服务器系统;对于设备企业,龙芯基于开源OS维护基础版,支持OS、整机、应用企业。
事实上,龙芯已经为三种不同的平台开发了相应的操作系统:
1.通用信息系统。该系统基于通用Linux平台进行改进和优化,为统一操作系统UOS龙芯版提供支持。
2.LoongOS用于高度可靠的实时终端。该系统基于Linux/RT-Linux构建简洁高效的操作系统。
3.面向实时嵌入式应用的LoongWorks。针对历史应用,该系统基于VxWorks内核,改进了图形和网络API。
另一方面,龙芯操作系统还针对不同的硬件和应用提出了两种不同的二进制兼容性。
此外,胡还提到,龙芯将进一步统一系统架构,构建标准规范体系,实现操作系统跨主板、跨CPU代的兼容。
从龙芯3A4000开始,龙芯还将以参考设计全面支持统一系统架构,开发支持ACPI主板、固件、内核和OS的参考设计,以及基于ACPI/EC笔记本标准的解决方案。
结论:中国自主CPU研发的里程碑
经过近20年的发展,龙芯中科已经成为中国国产自主高性能通用处理器的技术引领者,不仅打破了中国没有自主研发CPU芯片的历史,也是中国自主知识产权计算机产业形成的里程碑。
近二十年来,龙芯的独立CPU和OS已经成熟。胡表示,龙芯CPU单核通用处理性能已经达到AMD水平,OS成熟度接近Windows XP。
但龙芯尚不丰富的应用和产业不匹配,这无疑是未来自主CPU和OS发展的障碍。未来,龙芯将如何完善基础软件环境和配套芯片,推动CPU和OS生态进一步成熟发展,值得我们期待。
感谢阅读。点击关注上船,带你走科技前沿~