1 定义
智能助手(Agent Assistant),利用LLM的推理能力,自主对复杂的人类任务进行目标规划、任务拆解、工具调用、过程迭代,在无人类干预的情况下完成任务。
2 咋用智能助手?
“探索”中找到Agent的应用模板,添加到工作区或在此基础自定义。在工作室也可从0编排一个Agent。
选择智能助手的推理模型,智能助手的任务完成能力取决于模型推理能力,建议用Agent时选择推理能力更强的模型系列如 gpt-4,以获得更稳定的任务完成效果。
可在“提示词”中编写Agent的指令,为达到更优预期效果,可在指令中明确它的任务目标、工作流程、资源和限制等。
2.1 添加工具
“上下文”中,可添加用于查询的知识库工具,帮助它获取外部背景知识。
在“工具”中,可添加需使用的工具,以扩展 LLM 的能力,如联网搜索、科学计算或绘制图片,赋予并增强了 LLM 连接外部世界的能力。Dify提供:
- 内置工具
- 自定义工具,支持 OpenAPI / Swagger 和 OpenAI Plugin 规范
意义
允许用户借助外部能力,创建更强大 AI 应用。为Agent编排合适工具,它可通过任务推理、步骤拆解、调用工具完成复杂任务。
也方便将你的应用与其他系统或服务连接,与外部环境交互。如代码执行、对专属信息源的访问等。只需在对话框谈及需要调用的某工具名,即可自动调用该工具。
2.2 Agent设置
为Agent提供两种推理模式:
- Function calling(函数调用):支持的模型系列如 gpt-3.5/gpt-4 拥有效果更佳、更稳定的表现
- ReAct:尚未支持 Function calling 的模型系列,支持了 ReAct 推理框架实现类似效果
Agent设置中,可修改助手的迭代次数限制:
ReAct 模式:
Function Calling 模式:
2.3 配置对话开场白
为Agent配置一套会话开场白和开场问题,配置的对话开场白将在每次用户初次对话中展示:
- 助手可完成啥样任务
- 可提出的问题示例
2.4 文件上传
部分多模态 LLM 原生支持处理文件,如 Claude 3.5 Sonnet 或 Gemini 1.5 Pro。可在对应 LLM 官网了解文件上传能力支持。
选支持读取文件的 LLM,开启 “文档” 功能,即可让当前 Chatbot 具备文件识别能力:
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!
- 🚀 魔都架构师 | 全网30W+技术追随者
- 🔧 大厂分布式系统/数据中台实战专家
- 🏆 主导交易系统亿级流量调优 & 车联网平台架构
- 🧠 AIGC应用开发先行者 | 区块链落地实践者
- 🌍 以技术驱动创新,我们的征途是改变世界!
- 👉 实战干货:编程严选网
共同学习,写下你的评论
评论加载中...
作者其他优质文章