国产自主GPU时代来临：龙芯9A1000即将流片，AI算力达40TOPS-市场-电子元件技术网

你的位置：首页 > 市场 > 正文

国产自主GPU时代来临：龙芯9A1000即将流片，AI算力达40TOPS

发布时间：2025-09-16 责任编辑：lina

【导读】龙芯中科在投资者互动平台上透露，公司首款GPGPU芯片9A1000的研发已基本完成，预计将在2025年第三季度内交付流片。

龙芯中科在投资者互动平台上透露，公司首款GPGPU芯片9A1000的研发已基本完成，预计将在2025年第三季度内交付流片。

这款芯片于2023年开始研发，是龙芯从CPU向GPU领域拓展的重要里程碑。成功与否尚需等待流片返回后的测试结果才能最终确定。

01 技术特性：面积缩减20%，频率提升25%

龙芯9A1000采用了多项创新技术设计。最新消息显示，龙芯已将每个GPU基础计算单元的面积缩小了20% 。

在面积优化的同时，芯片的运行频率提升了25%，并在轻负载场景下实现了高达70% 的功耗降低。

芯片支持OpenGL 4.0和OpenCL ES 3.2 API，确保了良好的软件兼容性。同时还支持H.264/H.265硬件编解码。

02 性能表现：AI算力达40TOPS，媲美国际主流

9A1000在性能表现上可圈可点。其AI算力达到40 TOPS（INT8），略低于AMD即将推出的Ryzen AI Max+芯片中XDNA 2 NPU提供的50 TOPS算力。

在图形处理方面，9A1000的性能比龙芯2K3000处理器中集成的LG200显卡提升了约4倍。

芯片的像素填充率达到每秒160亿像素（16 GP/s），纹理填充率达到32 GT/s（每秒320亿纹理元素）。

03 市场定位：入门级AI加速显卡

龙芯将9A1000定位为一款支持AI加速的入门级显卡，瞄准的是通用计算和轻量级人工智能任务市场。

这与另一款国产显卡砺算G100不同，后者主打高性能游戏场景，传闻性能接近GeForce RTX 4060。

9A1000在图形性能方面对标的是AMD的RX550，这是一款八年前发布的显卡。

04 技术规格：支持PCIe 4.0与LPDDR4X显存

根据技术资料，9A1000支持PCIe 4.0系统总线，并配备128位位宽的LPDDR4X高速显存。

芯片内部集成了八个计算集群，采用片上网络（NoC）互联结构和二级缓存机制，展现出较为先进的整体布局设计。

在浮点运算方面，其FP32单精度算力可达1 TFLOPS，FP64双精度约为64 GFLOPS；而在INT8整数运算模式下，峰值算力高达32 TFLOPS。

05 产品规划：9A2000和9A3000已在路上

9A1000只是龙芯GPU路线图的起点。公司已在开发下一代产品9A2000，据称其性能将是9A1000的10倍，有望达到NVIDIA GeForce RTX 2080级别的水平。

龙芯还规划了9A3000作为9A2000的后续产品，虽然目前尚未公布详细规格信息，但龙芯中科董事长胡伟武透露，如果采用先进的Xnm工艺，性能可能会带来3-5倍的提升。

龙芯中科从CPU向GPU领域扩展，标志着中国芯片产业正在向全栈自主可控方向迈进。

9A1000的量产和后续9A2000的开发，不仅展示了龙芯的技术实力，也为中国本土GPU产业注入了新的活力。

如果流片成功，龙芯将成为中国本土少数同时掌握CPU和GPU设计技术的公司之一，为国产算力平台自主化奠定坚实基础。