下一个大热门? Gartner 认为人工智能代理将会是未来的趋势。OpenAI、Nvidia 和 Microsoft 正在押注于此领域,Salesforce 等公司也是如此认为,尽管它们在人工智能领域一向较为低调。
现在这件事真的开始火了,而且
„AI代理“ 在Google Trends上(trends.google.com)
哇!
所以,这种趋势背后真正的秘密是什么?关键在于理解代理人的自主权。
与传统的生成式AI系统不同,代理不仅仅只是回应用户的输入。相反,它们能够从头到尾处理像保险理赔这样的复杂任务。这包括理解理赔的文本、图像和PDF,从客户数据库中检索信息,将案例与保险条款和条件进行对照,向客户提问并等待他们的回复——即使需要几天——而不会丢失上下文信息。
这些代理自主地进行这项操作——不需要人来检查AI是否都在好好干活。
意式咖啡机和咖啡师:与现有的AI系统和所有那些帮助员工工作的副驾不同,AI代理实际上是真正的员工,拥有巨大的自动化流程潜力。
想象一下 — 一个能完成目前由人类员工或整个部门处理的复杂多步骤任务的AI:
- 计划、设计、执行、评估和优化营销活动
- 定位物流中的丢失货件,通过与承运商、客户和仓库沟通来查找——或者,如果仍然找不到,从负责的合作伙伴那里索赔。
- 每天搜索商标数据库,查看是否有新的商标注册与自己的商标冲突,并立即提出反对意见。
- 收集相关数据或询问员工,检查数据并编制一份ESG报告
目前,AI模型可以帮助完成诸如生成活动内容或评估电子邮件等任务,但它们缺乏执行整个过程的能力。一个AI助手能够做到这一点。
传统的生成式AI可以在过程中帮助人类团队的合作(黄色),AI代理可以执行整个流程(橙色)。图片来源:Maximilian Vogel
传统的模型就像一台优秀的咖啡机,而基于代理的AI则是那位咖啡师。 它(们)不仅能制作咖啡,还能迎宾、点单、上咖啡、收钱、把用过的杯子放进洗碗机,甚至晚上关门。即使世界上最好的咖啡机也无法单独运营一家咖啡馆,但咖啡师却可以。
为什么AI代理和咖啡师(barista)能做到这一点?他们擅长处理各种复杂的子任务,并能独立选择接下来要处理哪个任务。他们可以与人沟通,例如需要更多信息时(要牛奶还是燕麦奶?)。在遇到问题时,他们可以决定该向谁求助(咖啡豆用完了=>老板,咖啡机出故障了=>机器供应商的客服人员)。
AI代理 vs. 传统生成式AI。图片来源: Maximilian Vogel
AI工作者:剖析但是闲聊到此为止吧,让我们开始构建AI助手吧。看看相关的流程。
让我们根据上面的保险流程图来创建一个代理。这个代理需要从提交保险理赔开始,直到完成报销整个过程。
我们这里正在开发的是业务架构和流程流。不过,我不能深入到编码中,因为这很快就会变得非常繁琐。
1. 分类并将任务送入处理流程。当客户向保险公司发送包含家庭保险理赔要求的消息时,我们的工作流程就开始了。
我们的代理是做什么的?它通过分析信息的内容来了解客户的需求。
根据这种分类,系统开启一个处理流程。这不仅限于功能调用;它首先涉及对过程做出基本判断,然后执行许多具体的步骤。
AI助手:1. 对邮件分类并分配到不同的处理通道。图片来源:Maximilian Vogel
2 抽取数据接下来,提取数据。代理的主要任务之一是将非结构化数据转换为结构化数据,……以使处理过程系统化、安全且可靠。
分类将文本归类到预定义的类别,而提取是从文本中提取和解读数据。 不过,语言模型不会直接从输入提示中照搬数据;相反,它生成回应。这可以对数据进行格式化,例如将电话号码从‘(718) 123–45678’转换为‘+1 718 123 45678’。
AI代理:2. 从邮件及其附件中提取数据。(图:Maximilian Vogel)
数据提取不仅限于邮件正文中的文本内容,还可以包括图片、PDF和其他文档中的数据。为此,我们使用多种模型,比如大型语言模型(LLMs)、图像识别模型、光学字符识别(OCR)等。上述过程其实大大简化了。实际上,我们经常将图片发送到OCR系统来提取扫描的发票或表格中的文字。此外,在分析之前我们还会对附件进行分类。
我们要求模型以 JSON 格式输出,以确保数据结构化和规范。
这是电子邮件输入——非结构化数据:
你好,
我想报告损坏并要求赔偿。
昨天,我儿子拉贾德(Rajad)和朋友玩耍时,用足球踢到了客厅的吊灯,吊灯从固定处脱落摔碎,它是玻璃做的。
幸运的是没有人受伤,但吊灯已经无法修复。
附件中有发票和一些损坏的吊灯照片。
深帕克·贾马尔
合同号:HC12-223873923
123 主街
纽约市 10008
(718) 123-4567
以下为模型输出:一个JSON,结构化的数据:
{
"name": "Deepak",
"surname": "Jamal",
"address": "123 Main Street, 纽约市, 纽约 10008",
"phone": "+1 718 123 45678",
"contract_no": "HC12-223873923",
"claim_description": "[2024年12月8日] 昨天,在我和朋友玩耍的时候,我9岁的儿子Rajad 不小心踢到客厅里的吊灯,吊灯从固定装置上脱落下来并摔到地上摔碎了(它是由玻璃制成的)。\n幸运的是没有人受伤,但是吊灯已经无法修复。\n"
}
3. 调用外部服务,保持上下文有效
许多生成式AI系统可以直接回答查询——有时通过预训练的数据、微调,或者在某些文档上的RAG。但这对代理来说还不够。几乎每一个功能强大的AI代理都需要访问企业内部或外部数据库。
为了在当前会话之外保持流程的上下文持久性,它还必须将数据写入系统和数据库。在我们的情况下,代理会将合同号与客户数据库进行核查,并将索赔的状态写入问题跟踪系统。它还可以——记得:这里是一个代理!——像客户这样的外部方请求缺失的数据。
AI代理:3. 调用外部服务并保持上下文持久性。图片来源:Maximilian Vogel
4. 评估、RAG、推理判断和自信每个行政工作的核心在于处理新案件并根据各种规则进行解读。AI在这方面特别擅长,因为它能够快速准确地完成这项任务。因为在调用模型时,我们无法提供所有背景信息(例如政策内容或条款条件),我们使用向量检索数据库来检索相关片段——这种技术叫做RAG。
我们让AI在做出评估前“出声思考”。在给出结果前先思考可以提高答案质量——这是我们从小学三年级学到的一个道理。我们还可以以多种明显和不那么明显的方式来利用模型推理的输出:
- 为客户提供的答案提供支持
- 帮助提示工程师和数据科学家找出模型出错的原因
- 进行检查:模型是否是碰巧得到了正确答案,还是通过其推理我们可以看出答案是不可避免的?
自信是提高准确性的关键。 如果模型能够评估其置信度——亲爱的提示工程师们,这也需要非常好的少量样本学习案例来涵盖各种置信度值——那么我们可以配置系统以实现极高的安全性和高度自动化:我们设定一个置信度阈值,低于该阈值的所有情况都应交给人类支持。较高的阈值确保了最小的错误率,但需要更多的手动处理,而较低的阈值则允许更多情况自动处理,但是错误的风险会增加。
AI代理们:4. 使用RAG、推理和置信度来获得可靠的评价。图片来源:Maximilian Vogel,
就这样!如果你刚完成了上面提到的2到3步,你就已经开发出了一个代理。我只简单介绍了这些AI代理的关键部分。你可以想象其他的组件。你可以借助像crewAI、langGraph、langFlow这样的框架来实现,或者直接用纯Python来搭。
值得注意的是,这种系统可以自动化理赔管理部门70%到90%的工作。而这是简单的预训练生成式AI系统所做不到的。两年前,我从未想到这一切会如此迅速地变为现实。
太长不看?这里是一句概括AI代理的精华。
AI人工智能代理的三大定律:图片来源:Maximilian Vogel,借鉴了艾萨克·阿西莫夫的明显作品。
这些代理商肯定会让我在未来几个月里忙个不停——我们团队刚刚启动了一个大型物流系统。
祝你在AI及其代理系统方面取得一切成功!
如果你想的话:
关注我在 Medium 上的发布 (⇈) 或者在 LinkedIn 上,获取有关生成式 AI、AI 工作者和提示工程的最新消息和新故事。
共同学习,写下你的评论
评论加载中...
作者其他优质文章