你的位置:首页 > 市场 > 正文

当企业追逐AI代理时,科学家已驶向下一个浪潮

发布时间:2025-10-22 责任编辑:fanjiali

在2022年OpenAI发布ChatGPT、使人工智能进入公众视野之前,这项技术主要在研究实验室和学术会议中悄然演进。如今,尽管企业界的目光大多聚焦于AI代理及其重塑产业生态的巨大潜力,一群工程师与科学家却已将目光投向更远的未来。

湾区机器学习研讨会(BayLearn)——一个汇聚硅谷顶尖科学家与工程师的年度活动——为我们揭示了这一趋势。今年会议由圣克拉拉大学工程学院于周四主办,与会者得以一窥在企业和研究实验室持续优化AI方法的同时,该领域的前沿思想者如何看待技术未来的影响。

“我们不仅是在构建系统,更在思考这些系统所要解决的根本性问题,”英伟达应用深度学习研究副总裁布莱恩·卡坦扎罗(如图)在会上表示。

1760927528750086.jpg

英伟达 Nemotron 推动加速计算进程

英伟达系统性思维的一个重要体现是 Nemotron,这是该芯片制造商推出的一套开源AI技术组合,旨在提升人工智能开发各阶段的效率。它包括多模态模型与数据集、训练前/后工具、精准算法,以及用于在GPU集群上扩展AI的软件。

Nemotron 这一名称融合了“神经模块”与变形金刚角色“威震天”,它处于英伟达加速计算愿景的核心位置。

“Nemotron 体现了英伟达对未来加速计算的思考,”卡坦扎罗指出,“加速计算本质上是关于专业化……是关于实现通用计算机无法完成的任务。它不仅仅是一枚芯片。”

英伟达同时认为,AI的未来进展将得益于开源社区的贡献。卡坦扎罗在会后接受SiliconANGLE采访时提到,Meta、阿里巴巴以及中国的DeepSeek等公司都已参与到Nemotron生态中。

“各方贡献非常丰富,”他说,“Nemotron 数据集正被广泛采用。”

卡坦扎罗本人也为AI进步作出了独特贡献。正如斯蒂芬·威特在记录英伟达崛起的《思考机器》一书中所写,创始人兼CEO黄仁勋决定将公司转向AI领域,正是源于与卡坦扎罗的交流——后者当时已认识到深度学习是AI未来的关键。

在与SiliconANGLE的对话中,卡坦扎罗回顾了他早期在FPGA方面的工作如何让他认识到英伟达基于GPU的CUDA架构的速度优势。他敏锐察觉到这项技术在AI中的应用前景,并于2013年与黄仁勋探讨了将其用于机器学习的可能性。

“我当时就觉得,英伟达为CUDA设计的编程方式有其独特之处,”卡坦扎罗回忆,“那时CUDA的重点还不是机器学习,而是高性能计算。那段探索历程令人振奋……之后的发展,已是众所周知的历史。”

迈向交互式AI

AI的发展历程同样离不开像克里斯托弗·曼宁教授这样的计算机科学家的贡献。作为自然语言处理领域的著名学者,曼宁在BayLearn提醒听众:二十多年前,大型语言模型甚至未受学界重视——当年计算语言学协会会议上发表的33篇AI论文中,无一涉及LLM。

“1993年有多少LLM论文?零。”曼宁说,“事后看来,当时没有人讨论语言模型确实令人惊讶。我们本可以更早推动LLM的发展,但当时人们普遍不认为它们会有多大用处。”

最终推动AI走向广泛应用的是基于自然语言功能的应用程序。曼宁在斯坦福大学的研究为深度学习在NLP中的应用奠定基础,成为当今AI技术发展的基石之一。

作为斯坦福大学以人为本AI研究所的创始人兼副所长,曼宁对当前AI领域急功近利、忽视技术通过与世界互动实现自我提升的潜力表示担忧。

“目前的LLM根本不具备交互能力,”他指出,“人类能以比现有模型少几个数量级的数据进行学习,我们的学习效率远高于机器。”

曼宁提出的解决之道是“系统泛化”——让AI模型突破当前依赖海量数据的范式,进入可通过交互进行学习的智能体世界。目标是构建能够将已知元素组合为全新含义的AI系统。他表示,这将需要开发能够通过“浏览网站”等探索行为自主提升的模型。

“一定程度而言,堆数据是有效的,但这不是人类的学习方式,”曼宁强调,“我们需要更高效的模型,以实现系统化泛化。”

新的机器学习与机器人工具

实现系统泛化需要构建新的AI框架,以在计算网络上更高效地运行。苹果公司正致力于开发此类解决方案,并持续增强其面向Apple芯片的机器学习软件——MLX。

这一开源机器学习框架专为Mac电脑开发。MLX发布近两年来,已能将高级Python代码转换为优化的机器代码。有消息称,苹果正与英伟达合作,为MLX添加CUDA后端支持,以降低构建机器学习框架的成本。

“我们认为这是一个机会,可以打造真正契合硬件特性的机器学习软件,”苹果研究科学家罗南·科洛伯特在BayLearn上表示,“我们必须从系统角度思考如何可靠地部署AI。”

对普通消费者而言,工程师对机器学习框架与编码优化的热情或许不易感知。但AI的进步同时也在机器人领域引发变革,其影响或将很快显现于日常生活。

谷歌旗下DeepMind研究部门一直致力于开发提升机器人智能的模型。上月,该公司发布了Gemini Robotics 1.5与ER 1.5模型,它们展现出帮助机器人实现真正“思考”的推理能力。

DeepMind此前的方法主要让机器人掌握单一技能,例如折纸。如今,它们已能执行更复杂的任务,比如根据天气预报选择合适的衣物。

谷歌DeepMind研究副总裁Ed Chi指出,AI正在通用机器人领域取得进展——机器已能根据简单的自然语言指令拾取并丢弃物品。这促使工程师重新构想一个宏大的未来图景:在通用人工智能的赋能下,机器人能够理解、学习并将知识应用于无限范围的人类任务。

“在我还没有能打扫房子的机器人时,厌倦了所有关于AGI的讨论,”Chi在一次小组讨论中坦言,“如今我们在通用机器人领域取得的进展已经足够实用。”

“足够好”或许正成为AI开发者的共识——在技术以惊人速度迭代、企业持续追求即时效益的背景下,AI正推动社会与经济变革,其步伐甚至令资深从业者感到震撼。然而,许多人相信,随着AI能力持续增强,其影响将是深远的。

“我们正身处一个非凡的时代,”斯坦福大学的曼宁总结道,“我们走在一条持续进步的道路上,并将伴随这项技术的发展,踏上一段激动人心的旅程。”


特别推荐
技术文章更多>>
技术白皮书下载更多>>
热门搜索
 

关闭

 

关闭