研发了国产自主龙芯CPU的龙芯中科日前透露,目前主推的产品是龙芯3A5000、3C5000系列,下一代的龙芯3A6000已经完成设计,到产品上市及体现在收入上还需要一定时间。
龙芯还提到重点已经从提高CPU性能转向提高整系统的性价比,包括产业链规模、生态完善、配套芯片齐全等等,以此增强市场竞争力,为未来龙芯走向开放市场奠定坚实的基础。
此外,龙芯表示,目前没有涨价的打算。
根据龙芯之前的资料,3A6000也不会继续提升工艺,依然会采用现有的12nm工艺,但会大幅改进架构设计,架构会从目前的GS464V升级到LA664,因此单核性能有较大提升,达到市场上主流设计。
龙芯给出了仿真测试结果,龙芯3A6000处理器单核SPEC CPU 2006定点/浮点base分值(GCC)从26/28分提高到35/45分,分别提升37%及68%。
作为参照,11代酷睿的IPC大约是定点13+/G,12代酷睿IPC大约是定点15+/G,Zen3的IPC大约是定点13/G。
因此,如果龙芯LA664能够达到定点13/G,浮点16/G,这已经追平或接近Zen3和11代酷睿。
龙芯中科除了发展桌面处理器之外,也推出了面向服务器的龙芯,6月份发布的龙芯3C5000为16核架构,峰值性能相当于ARM 64核,接下来还会有32核的,龙芯确认已经完成研发。
据龙芯中科在投资者活动上的信息,服务器市场上,龙芯16核产品3C5000 陆续在出货,在服务器市场的布局今年就会有所体现,32核的3D5000产品已经研发完成,产品化还需一定时间,服务器市场对龙芯来讲都是增量市场。
今年6月6日,龙芯正式发布了龙芯3C系列处理器,3C5000系列是面向服务器领域的高性能通用处理器,采用纯自主LoongArch指令架构,可满足通用计算、大型数据中心、云计算中心的计算需求。
性能方面,官方表示16核心单芯片unixbench分值9500以上,双精度计算能力达560GFlops,16核处理器峰值性能与典型ARM 64核处理器的峰值性能相当,并支持最高16路互连,搭配新一代龙芯7A2000桥片,PCIe吞吐带宽比上一代提升400%以上。
安全方面,该处理器通过芯片级安全机制可为等保2.0、可信计算、国密算法替代、网络安全漏洞防护等提供CPU级内生支持。
在生态适配方面,龙芯中科也是接连取得可喜的突破。
近期,OpenCV开源社区正式合入了对龙芯处理器LoongArch龙架构的支持代码,基于龙架构自主指令系统,优化后的OpenCV性能显著提升。
OpenCV是一款跨平台的计算机视觉、机器学习软件平台,应用非常广泛,是目前AI应用的重要基础平台。
针对当前主要的CPU架构,OpenCV均有支持,包括x86、Arm等等,而随着此次代码合入,龙架构也正式加入了OpenCV大家庭。
龙芯中科表示,围绕龙架构,公司积极投入AI平台建设,构建形成了多层级的AI软件生态体系,以及全域异构硬件支撑体系,满足云、边、端不同AI应用场景的需求,服务安防、交通、教育、能源、数据中心等众多行业。
基于龙架构,在高性能算子库方面,OpenBLAS、OneDNN、FBGEMM等基础库均完成适配并优化。
在编程框架方面,国际国内常用的深度学习编程框架TensorFlow、PyTorch、Caffe、OnnxRuntime、PaddlePaddle、NCNN均完成适配并优化。计算机视觉、NLP领域常用算法模型可正常部署运行。
另外,围绕龙架构,天数智芯、登临科技、云天励飞等国内众多AI加速卡厂商均已完成适配,涉及GPGPU、ASIC、FPGA多个方向。
另外,国际主流网卡驱动开源社区DPDK也已支持LoongArch架构。
据介绍,2022年11月27日,DPDK官方社区发布了22.11版本,从该版本开始DPDK将支持龙架构(LoongArch)。
随着社区对DPDK项目的演进,LoongArch成为继X86、PowerPC、ARM、RISC-V后DPDK所支持的又一独立自主指令系统架构。
DPDK(Data Plane Development Kit)是Linux基金会下托管的开源项目,它提供了一系列数据平面的代码库和基于轮询模式的网卡驱动。
DPDK能够加速网络 I/O,在提升网络吞吐量和降低网络延时方面具有重要的作用。
DPDK提供了一整套用户空间下的高效数据包处理库和一个完整的应用编程框架,能够为高速网络数据包处理应用提供更短的产品开发周期。
许多流行的Linux发行版都把 DPDK 的支持作为其标准包装的一部分。
在LoongArch平台上,由龙芯公司维护的Loongnix-Server和 Loongnix-Desktop系统中,均可通过软件包管理工具安装基于LoongArch架构的DPDK 运行环境和开发环境。
DPDK实现对LoongArch 架构的支持后,用户可以直接在基于LoongArch64架构的物理机上运行和开发DPDK应用,能够方便用户测试和开发基于DPDK的应用,提高软件开发效率。
用户除了可以在支持龙芯3A5000,3C5000等机器上原生编译和测试DPDK程序,还可以在X86架构上交叉编译LoongArch DPDK,这为用户开发多架构支持的网络数据包处理产品提供了便利。
龙芯相关技术团队经过了8个版本迭代最终支持了LoongArch架构。
在迭代过程中,社区一直比较关注LoongArch DPDK CI的支持问题。
在经过调研以及和社区沟通后,龙芯相关技术团队为社区提供了运行在LoongArch平台上的DPDK CI节点,为社区的补丁合入提供了更多的测试结果参考。