解放日报

仿佛一夜之间,来自中国企业Monica的Manus火了。但不同于DeepSeek引发的惊喜,很多科技圈内人有点懵:它既不是第一个AI智能体,也没有实现真正意义上的通用智能体,怎么就火了呢?

我们姑且不讨论背后是否有企业营销以及自媒体的蹭流量、博关注,Manus客观上引发了大众对AI智能体的好奇和关注。

究竟什么是AI智能体?Manus是否有技术创新之处?记者专访了上海交通大学人工智能学院长聘教轨副教授谢伟迪。

没有什么太多技术创新

Manus在宣介视频中展示的筛选简历、研究纽约房地产和分析股票,是否有技术创新?

“从技术角度看,它并没有什么太多技术创新,只是把已有大模型技术的交互感包装得更好。尤其是像DeepSeek在架构、算法和高效性上的硬核底层技术创新,Manus是没有的。它更像是一个不错的基于AI智能体完成的产品。”谢伟迪认为。

不过,他也提到由Manus参与制作的这个宣介视频“挺棒的”,使得大众对于AI智能体有了更多认识。

智能体是强化学习中的一个概念,前两天2025年图灵奖就授予了强化学习领域两位先驱。强化学习对于当前具备推理能力的大语言模型的训练至关重要,例如GPT-o1、DeepSeek-R1等。

智能体的核心是与环境交互,“人”就是一个典型的智能体。一个理想的AI智能体,应具有感知、决策和行动能力,能够在特定环境中自主地执行任务。

AI智能体还处于初级阶段

当下,AI智能体在国际上发展到了什么水平?

“整体而言,还处于初级阶段。目前,AI智能体主要依靠和调用各种各样的工具和大模型,尚未出现真正自主的智能体。”谢伟迪说。

微软、OpenAI和Anthropic是最早一批布局AI智能体的公司。特别是Anthropic公司在成立之初确定的技术路线就是面向未来多智能体的大模型训练。

微软推出的AI智能体产品Copilot,不仅可以帮助用户分析数据、识别趋势,为决策提供支持,还可以为用户定制解决方案等。

Operator是OpenAI发布的首款AI智能体,其通过自主调用大模型来完成任务,具备了图形用户界面交互的能力,可以独立完成填写表格、购买杂物等工作。

就在上个月,Anthropic推出Claude 3.7 Sonnet,这是全球首款“混合推理”模型,既能即时响应,又能深度推理,在数学、物理、指令遵循、编码等任务上有了显著改进。该模型可用于创建直接与客户交互的AI助手与智能体。

AI智能体何时有质的飞跃

目前,大模型尚无法充分满足个性化要求,但在大模型基础上通过搭建AI智能体系统,可以为用户定制产品和服务。

比如,不同科室的医生都想找AI程序员写各自的代码,但由于数据不同无法通用,这势必导致重复劳动。谢伟迪团队日前开发了一个自动写代码的多智能体系统,解决了这一问题。

“一个模型可能解决不了很多问题,但同时利用一堆模型,这个事情就不同了。AI智能体本身就是一个智慧的载体,多智能体的最终目标是人类和机器一起合作。”谢伟迪说。

作为未来AI发展的一个重要方向,AI智能体何时会有一个质的飞跃?

在谢伟迪看来,这和底层大模型能力的跃迁有很大关系。如果底层大模型比如DeepSeek变得更加强大,集纳和调用大模型的AI智能体也会变得更强大。从逻辑上来说,先要实现通用人工智能,才会有强大的通用AI智能体。通用人工智能是一种类似飞行能力的抽象目标,而通用AI智能体是为了实现飞行能力而制造的“飞机”。(记者 黄海华)