近日,中央经济工作会议在京召开,确定2025年九项重点任务,其中之一是以科技创新引领新质生产力发展,建设现代化产业体系,开展“人工智能+”行动。而智能体(AI Agent)已发展成为人工智能应用的主流形态,是连接用户与各类服务的新桥梁。
为了进一步推动智能体技术创新和行业应用,北京海外高层次人才协会联合中国计算机学会自然语言处理专委会、中关村数智人工智能产业联盟、中国智能产业科技创新联盟,于2024年12月19日举办“后大语言模型时代,智能体技术和应用研讨会”。北京海外高层次人才协会副理事长、秘书长武沂,副理事长、澜舟科技创始人兼CEO周明博士为活动致辞,来自著名高校和智能体科创企业的7位学者和专家分享了智能体最新进展。本次研讨会由北京海外高层次人才协会人工智能专委会、北京澜舟科技有限公司承办,Datafun和始智AI协办,共吸引全平台4000余人次观看。
北京海外高层次人才协会副理事长、秘书长武沂在致辞中表示,协会以支持北京科创中心建设为核心目标,始终坚持“团结、凝聚、服务在京地区优秀创新创业海外人才”的宗旨,搭平台、拓渠道、整合资源、深耕合作,大力促进海外人才聚集和发展。举办本次活动旨在希望通过分享智能体技术的应用实践及案例,共话产业新热点,洞见发展新趋势,从而推动人工智能领域持续创新发展,为首都经济转型升级和高质量发展注入新活力。
北京海外高层次人才协会副理事长、澜舟科技创始人兼CEO周明博士表示,LLM作为人工智能的基础模型,技术已趋向成熟。从两年前GPT系列的初次亮相,到如今种类繁多的大模型,它们不仅在语言理解、生成、推理等方面能力持续提升,还在编码、图片以及视频的理解与生成上取得了显著进展,为广泛的应用奠定了基础。
经过两年多的努力,LLM的scaling law受到数据、算力和算法诸要素的制约,预训练技术创新速度有所放缓,大家开始关注推理部分的创新。总体来看,尽管技术在持续进化,但短期内难以再出现LLM诞生初期那般革命性的技术飞跃。
人们开始更加重视AI技术的实际应用与社会价值,而不再单纯迷恋其技术的先进性。此外,LLM所引发的技术风险与伦理挑战也日益成为社会各界关注的焦点。
在此背景下,智能体脱颖而出,成为后LLM时代最为重要的技术。智能体是一种能够感知环境、进行决策并采取行动以实现特定目标的实体,既可以是软件程序,也可以是具备一定智能的硬件设备。智能体凭借其强大的语言理解能力与多模态能力,成为连接人类与数字世界的桥梁。它们能够理解人类的指令,处理各种复杂任务,并以高效、准确的方式给予回应。智能体也被认为是最终实现AGI的的必由道路。
智能体已经广泛地应用到各行各业。相关技术不断发展,同时也有很大的挑战,这些都引起业界广泛的关注。
PART1:AI智能体来了
1. 智能体基本理论和研究
智能体是一种能够感知环境、进行决策并采取行动以实现特定目标的实体,既可以是软件程序,也可以是具备一定智能的硬件设备。智能体凭借其强大的语言理解能力与多模态能力,成为连接人类与数字世界的桥梁。它们能够理解人类的指令,处理各种复杂任务,并以高效、准确的方式给予回应。一般来讲,智能体包括用户界面、任务管理、记忆、知识存储、推理、学习和行动执行等模块。
清华大学万国数据教授、智能产业研究院执行院长刘洋表示可进化性是自主智能体区分于大模型的一个重要特性,认为自主智能体能够在虚拟世界中进行长期进化,从而有可能在特定任务上超越人类水平的。他介绍了医疗虚拟世界Agent Hospital,其中的患者、医生和护士都是由大模型驱动的自主智能体扮演。实验表明,医生智能体在虚拟世界中进化之后,诊疗能力获得了显著的提升。
2.智能体基座模型构建
复旦大学副研究员桂韬表示智能体基座模型的构建对人工智能领域有重要作用,并指出智能体是具有感知环境、做出决策和采取行动能力的实体。他还提到了大型语言模型智能体的潜力,并探讨了如何通过交互式训练平台、多样化环境与任务以及自我演化算法来提升这些智能体的能力,并特别强调了AgentGym在线互动训练和评估平台的重要性,以及在多样化环境中培养具有基本能力和先验知识的基座智能体的必要性。
3.基于大模型的GUI终端智能体
上海交通大学网络空间安全学院长聘教轨助理教授张倬胜表示大模型智能体得到快速发展,极大地拓展了大模型能力边界和应用场景,应用落地水平不断提升。代表性的例子为图形用户界面(GUI)智能体,在终端设备上动态交互,完成类人操作,打通海量应用之间的壁垒,让多样化应用融为一体,得到了广泛的关注。然而,现阶段的智能体依然面临着环境理解、场景泛化、轻量化、安全等挑战,易过拟合、易被攻击,导致无法正确完成指令,甚至对用户或环境的破坏。保障智能体安全对齐任重道远,一方面需要保障智能体的内在安全可靠,另一方面需要防御系统层的攻击风险。
4.AgentCLUE:可执行环境下的中文智能体评估基准
CLUE中文自然语言理解评价基准、SuperCLUE中文大模型综合性测评基准负责人徐亮介绍,AgentCLUE旨在构建一个具备调用工具能力、多轮交互和可执行环境的中文Agent测评体系,以考察模型在理解任务需求、准确调用工具以及结合环境反馈进行反思改进的能力。AgentCLUE基于中文场景,提供可执行的测评环境,允许模型在与环境交互中反思改进,并通过多轮对话、函数缺失、参数缺失和长上下文干扰等多种任务类型进行测试;AgentCLUE的可调用函数涵盖即时消息、文件系统、旅游出行、智能座舱、博客、金融交易等多个常用场景。并通过对比模型回复的函数调用执行结果和系统环境状态与人工标注的正确答案,来评估模型的回答是否正确;未来AgentCLUE将扩展测评场景,包括休闲娱乐、办公助手、医疗等,并扩展测评环境,支持PC端、移动端以及多模态能力的Agent测试。
PART2:智能体应用
1.AI Agent怎么赋能企业软件智能化
澜码创始人兼CEO周健表示企业软件经历了电算化,信息化,数字化几个浪潮之后,现在又迎来了智能化的新机遇。AI Agent应运而生,它通过学习企业内专家的知识/经验并结合企业内已有的私域数据帮助应用智能化,从而给企业数智化转型带来新质生产力。
2.智能体技术应用实践与落地案例
未来式智能创始人兼CEO杨劲松表示借助Agent将大语言模型认知智能,串联感知、决策与行动智能,实现对现实世界的端到端全流程业务智能,最终通往AGI。
3.智能体关键技术和应用案例
澜舟科技合伙人、CTO曾一杰表示随着大语言模型技术逐渐趋向成熟,技术迭代速度有所放缓,在此背景下智能体技术已成为大语言模型应用的主要载体,在大语言模型技术应用落地中发挥了重要作用。澜舟科技推出的澜舟智搭平台已在众多业务场景中落地应用,并分享了在智能客服的实际应用案例。