【导读】龙芯中科在投资者互动平台上透露,公司首款GPGPU芯片9A1000的研发已基本完成,预计将在2025年第三季度内交付流片。
龙芯中科在投资者互动平台上透露,公司首款GPGPU芯片9A1000的研发已基本完成,预计将在2025年第三季度内交付流片。
这款芯片于2023年开始研发,是龙芯从CPU向GPU领域拓展的重要里程碑。成功与否尚需等待流片返回后的测试结果才能最终确定。
01 技术特性:面积缩减20%,频率提升25%
龙芯9A1000采用了多项创新技术设计。最新消息显示,龙芯已将每个GPU基础计算单元的面积缩小了20% 。
在面积优化的同时,芯片的运行频率提升了25%,并在轻负载场景下实现了高达70% 的功耗降低。
芯片支持OpenGL 4.0和OpenCL ES 3.2 API,确保了良好的软件兼容性。同时还支持H.264/H.265硬件编解码。
02 性能表现:AI算力达40TOPS,媲美国际主流
9A1000在性能表现上可圈可点。其AI算力达到40 TOPS(INT8),略低于AMD即将推出的Ryzen AI Max+芯片中XDNA 2 NPU提供的50 TOPS算力。
在图形处理方面,9A1000的性能比龙芯2K3000处理器中集成的LG200显卡提升了约4倍。
芯片的像素填充率达到每秒160亿像素(16 GP/s),纹理填充率达到32 GT/s(每秒320亿纹理元素)。
03 市场定位:入门级AI加速显卡
龙芯将9A1000定位为一款支持AI加速的入门级显卡,瞄准的是通用计算和轻量级人工智能任务市场。
这与另一款国产显卡砺算G100不同,后者主打高性能游戏场景,传闻性能接近GeForce RTX 4060。
9A1000在图形性能方面对标的是AMD的RX550,这是一款八年前发布的显卡。
04 技术规格:支持PCIe 4.0与LPDDR4X显存
根据技术资料,9A1000支持PCIe 4.0系统总线,并配备128位位宽的LPDDR4X高速显存。
芯片内部集成了八个计算集群,采用片上网络(NoC)互联结构和二级缓存机制,展现出较为先进的整体布局设计。
在浮点运算方面,其FP32单精度算力可达1 TFLOPS,FP64双精度约为64 GFLOPS;而在INT8整数运算模式下,峰值算力高达32 TFLOPS。
05 产品规划:9A2000和9A3000已在路上
9A1000只是龙芯GPU路线图的起点。公司已在开发下一代产品9A2000,据称其性能将是9A1000的10倍,有望达到NVIDIA GeForce RTX 2080级别的水平。
龙芯还规划了9A3000作为9A2000的后续产品,虽然目前尚未公布详细规格信息,但龙芯中科董事长胡伟武透露,如果采用先进的Xnm工艺,性能可能会带来3-5倍的提升。
龙芯中科从CPU向GPU领域扩展,标志着中国芯片产业正在向全栈自主可控方向迈进。
9A1000的量产和后续9A2000的开发,不仅展示了龙芯的技术实力,也为中国本土GPU产业注入了新的活力。
如果流片成功,龙芯将成为中国本土少数同时掌握CPU和GPU设计技术的公司之一,为国产算力平台自主化奠定坚实基础。
推荐阅读: