所谓agent是有记忆和规划技能的大模型,主要能力是感知环境、做出决策。
一个精简的agent决策流程可以概括为:感知(perception)→规划(planning)→行动(action)
在淘宝业务场景中,平台希望把agent技术与智能助手业务结合起来做用户侧的创新。
而在业务实践中,主要诉求也主要是:提供一个交互页面,可以使用LLM智能体的自然语言理解能力、思维规划能力、工具使用等能力,直接理解用户输入的需求,然后通过agent规划能力,决策出实现用户诉求的行动路径,并调用智能体对应的工具实现用户需求,最后把结果展示在页面上,解决用户需求。
具体来说需要完成:
1. 搭建端到LLM直接信息传输链路,完成工程侧业务管理能力建设。
2. 搭建用户会话管理、多场景识别、链路分发机制。
3. 完成Agent模版到工具协议串联,把工具抽象化、按照协议“喂”给tpp Agent模版工程,完成Agent的使用工具的动态构建和在线灵活管理。
4. 完成Agent工具抽象模版化建设以及工具描述的步步调优,提升Agent整体链路规划准确性。
5. 完成工具&LLM输出到端展示的视图层转换,页面流式协议引入,提升端上输出稳定性。
而完成以上,可以实现覆盖每一个既定场景的端上交互,然后再根据用户下一步的输入或选择,继续新一轮交互。.
整理了实践过程与问题总结,内容比较多,一次不能完全看懂,可以反复参看,会有不少启发。
原文链接:
© 版权声明