随着大模型迭代的浪潮一波接一波地推高技术前沿,Agent技术已经成为大模型落地的主流选择,并被视为赋予大模型更广阔能力的最佳路径。从理解复杂的指令,到处理多模态信息,从简单的问答系统到复杂的决策支持系统,从个性化推荐到自动化的业务流程管理,陆续在更多领域展现出其巨大的潜力和价值,它正在为社会带来深刻的变革。
在这场趋之若鹜的群体行动中,面对这项持续发展变化的技术簇,我们应采取一种积极探索与谨慎评估并重的策略——既要保持理性,也要保持乐观,以此来应对不确定性。技术的更新迭代需要时间与耐心,而技术的应用则需了解其限制和准确判断业务场景。
要有效利用大模型,首先,必须明确他们的优势和不足(图1)。接下来,整理业务操作流程即业务SOP,确保对业务场景有深刻理解和准确的认知。其次,对领域知识进行必要的梳理。第四,在搭建Agent的过程中,尽可能的规避LLM的局限(例如,通过多轮对话精准捕捉识别用户意图)。第五,要做好企业内专业资料的处理和必要工具的建设。最后,准备好对Agent进行持续的优化(效果优化),从而在应用大型模型时发挥其优势,规避弱点。
一、大模型原生能力&局限
大模型擅长语义理解、逻辑推理以及生成和创作内容。然而,它们目前存在一些限制,包括对特定领域的深入理解和时效性不足、有限的记忆能力、在实际情况中的鲁棒性不够,导致错误、潜在的安全风险、推理和规划能力尚待提升、缺少合作意识而无法协同解决复杂问题、以及缺乏视觉和听觉等感官能力,有时生成的信息可能不精确或是虚构的。在构建Agent时,可以通过集成其他技术和能力来补充和改进大模型的这些不足。
另外,一些限制更多地取决于大型模型自身能力的提升。例如,泛化能力和过度拟合现象,这可能导致对含糊不清的信息的理解出现歧义,或者混淆了特定领域的知识。模型处理上下文的能力也受到长度的限制。模型的可解释性和可调试性不足,使其在某些情况下表现得像一个局部的黑箱。由于模型参数众多,推理过程耗时较长。此外,微调模型对高性能的GPU和TPU计算资源的需求也相对较大。
二、Agent
为让大模型更充分的发挥价值,突破当前的局限,主流趋势是通过Agent增强能力(大脑),为大模型增加眼耳鼻口手脚的能力。
2.1 Agent框架
Agent为大模型提供了执行复杂任务、与环境交互、自主决策和长期记忆等关键能力,使得大模型的应用从单纯的语言处理扩展到更广泛的领域,包括自动化任务执行、客户服务、内容创作等,极大地扩展了AI的实用性和影响力。为了实现这样一套解决方案(图2),背后需要用工程化的手段落地——工具链。
2.2 一站式AI Agent开发工具链
Agent开发平台是面向智能体生产场景的一站式开发工具,具备智能体编排、流程搭建、知识库管理、大小模型交互、计量、开放、私有化部署等功能,能够有效提升智能体研发效率,降低研发成本。目前国内知名的Agent开发平台包括百度的千帆、阿里的百炼、字节的Coze、Dify以及腾讯的元器等。
2.3 工具链竞品分析
1)字节Coze
Coze平台专为零代码或低代码(可视化编排)开发者设计,极大地降低了开发门槛,使得非技术人员也能快速上手。
优势:
功能强大(图像流、通过触发器实现自动化的任务调度和执行、多渠道发布)
高度可定制
支持丰富的主流第三方插件
数据源多样
但整体的动线繁琐,用好的门槛比较高。
2)腾讯元器
网站风格一如既往的“节制”,功能布局清晰易懂,用户无需花费脑力去理解网站的结构、布局和导航。该有的元素都有,后续在生态建设上,期待看到更多的可能,包括且不限于更丰富的大模型可选、插件……
3)Dify
是做LLM应用开发平台中最早的一批之一,且功能性甚至比国内头部大厂更突出,相比之下,目前它是是Github上Star数最多的大模型应用开发工具(54000星),是全球LLM Tools增速Top1的开源项目(300万的安装量)。
优势:
AI生态相对最好:支持40多家厂商的大模型,对接大模型平台、对接开源大模型,全链路免费。上百种插件
成功打开海外市场
提供云服务和本地部署两种方式,满足了不同用户的需求,同时支持多平台发布应用
自动化流程搭建和数据处理方面具有明显的优势,适合需要构建复杂自动化流程或处理大量数据的用户
4)百度千帆AppBuilder
千帆AppBuilder提供全面便捷的应用开发套件与资源环境,包括大模型驱动的开发组件(文字识别、文生图等多模态能力),内置RAG(检索增强生成)、Agent(智能体)、GBI(智能数据分析)等常用的AI原生应用框架,语音识别、TTS、文生图等AI能力组件,以及各类IAAS云资源。使得开发者能够在一个平台上完成从应用开发到部署的全过程,大大提高了开发效率。
优势:
千帆大模型平台提供了从模型设计、训练到部署、优化的全流程支持
平台42个大模型,预置41个数据集。内置103套Prompt模版及自动化Prompt工程能力
预置的安全模块可以有效控制输入和输出的安全风险,为用户提供全面的模型安全、内容安全和数据安全保障
自研集群,为企业节约了算力成本和时间成本
生态能力强大,预置100+优质官方组件
自主规划准确,支持人工编排以高效还原业务SOP