这个标题通俗易懂,并且符合中文的口语表达习惯。它简洁地传达了文章的核心议题——AI代理的概念及其重要性,同时以疑问句的形式激发读者的兴趣,引导他们思考为什么这个话题值得关心。
什么是AI代理?数据工程师又为什么需要了解如何调度它们呢?代理型AI(又称AI代理)似乎是今年的关键术语。例如NVIDIA、Gartner、IBM、Google、Blue Prism以及UI Path这些公司认为代理型AI将是2025年的顶尖技术趋势,值得关注。研究人员如Chip Huyen和Andrew Ng对AI代理的潜力充满期待。
梗源:Roy Hassan https://www.linkedin.com/in/royhasson/
今年早些时候,OpenAI 宣布了 Operator——一个能用它自己的浏览器为你完成任务的智能助手。之后不久,OpenAI 推出了 Deep Research——一个能自主执行复杂网络研究任务的人工智能系统,通过主动搜索、分析和整合来自不同来源的信息,模仿人类的研究方式,生成详尽的报告,整个过程遵循一个结构化、多步骤的流程。
在我们能够体会到深度研究的力量之前,Perplexity AI 和 Google 已经分别发布了人工智能驱动的深度研究工具,能够快速回答复杂问题。而 OpenAI 和 Google 则将这种深度研究工具提供给了付费用户,但 Perplexity AI 却对所有用户免费提供。
我是不是生活在真空里?Agentic AI 是个流行词还是真有其事?作为数据工程师、数据科学家和数据从业者,我们为什么要关心?
我的朋友们、家人和同事们,还有我在硅谷认识的每一个人,都在一家开发代理的AI初创公司工作。
一个AI代理的历史我是不是活在一个泡泡里?从地理位置的角度来看,也许是这样!
代理AI是流行词汇还是真正的创新技术?让我们来拆解看看!
自20世纪50年代以来,AI代理作为理论概念与人工智能领域一样久远。早期的AI代理是基于规则的系统,根据预设的规则来做出决策。但到了90年代,随着机器学习技术的兴起,AI代理开始采用数据驱动的方法,不再仅仅依赖于硬编码的规则。
什么是AI助手?梗来源:Nathan Lambert(via https://www.linkedin.com/in/natolambert/)
IBM说:Perplexity AI 表示:“人工智能(AI)代理程序是指一种能够自主代表用户执行任务的系统或程序,通过设计其工作流程并利用可用工具来完成任务。”
谷歌 Gemini 表示:“一个AI代理程序是一个自主的软件,它能够感知环境、做出决策并执行行动以实现特定目标,无需持续的人类干预。”
一个什么样的人才能成为代理人? 三个关键短语浮现如下: 1. 自主:“AI代理程序是能够感知其所处环境、自主决策并采取行动以达成特定目标的软件程序。它们通常利用机器学习来随着时间的推移适应环境并提升性能。”
代理需要能够自主运行。自动化工作流在技术界里并不新鲜。然而,大多数工作流自动化工具都是基于规则的,它们无法适应环境变化和信息变化。
但是,一个智能代理程序需要在没有人类干预的情况下自主运行,并适应环境变化。
2. 做决定一个代理需要根据感知到的信息或环境来做出决策。例如,当你向ChatGPT提问时,它会返回一个答案。它不会基于答案做决定,而是你来决定。ChatGPT或Google搜索并不算是一个代理。
3. 行动起来代理在做出决定后,还需要根据这个决定采取行动来达成目标。例如,当你在亚马逊上查找想买的书时,你会浏览书目和价格,然后决定买哪一本。光做决定还不够,还需要付诸行动,比如下单购买。同样,代理人也需要能采取行动。
好的,大家都知道什么是AI实体。一个AI实体就是使用人工智能在任意步骤或所有步骤中实现特定目标的实体。
为何这很重要?AI代理最大的承诺之一是,它能以智能的方式帮助我们自动化处理任务,同时不需要人工介入。
有什么新鲜事吗?
流程自动化并不新鲜,数字化转型和自动化已经改变了企业的运营模式几十年了。
图片来源自:Google Trends.
在对AI代理的恐慌发生之前,数字化工作流程的自动化有多种方式。
- 可以调用第三方软件的 API(应用程序编程接口)来实现应用程序和系统之间的通信,以增强流畅性。
- 如果无法访问 API,会使用网页抓取工具作为自动化工作流程的一部分。
- 另一个有趣的方法是机器人流程自动化(RPA)。它用来自动化重复、手动且基于规则的任务。这些任务通常通过用户界面与应用程序或系统交互,就像人一样操作。像 UI Path、MuleSoft 和 Blue Prism 这样的公司多年来一直在开发 RPA 工具。
但当出现API更新、UI更新,或者当任务变得动态并需要判断时,会发生什么呢?
我们来看个例子理解一下!
示例场景1:自动预约网球场地 预约网球场地竟然这么难,让人好难过 😭😭我住的公寓里有网球场设施,需要通过一个App来预约。预约从午夜零点开始开放,提供的是1小时的时段。
凌晨12点起来为了预订球场,真是太有意思了。可不是闹着玩的!
当然,我不得不写了一个Selenium脚本来自动化预订过程。一切顺利……直到,直到他们改了应用程序的界面,脚本也就不管用了。真是不爽,对吧?
这些自动化框架和工具通过模拟用户交互,如点击按钮、填写表单、鼠标移动等来工作。如果“预订按钮”位置移动了,工具就看不见新位置,仍然会在原来按钮的位置点击,从而导致程序崩溃。也就是说,自动化就会失败。
相比之下,一个AI代理能够应对这些变化。如何做到?代理可能会调用一个多模态AI模型。这些先进的AI模型能够利用高级的对象识别技术和自然语言理解能力来识别网页应用中的预订按钮位置。这些AI模型可以让代理像人一样理解和操作网页应用,并采取相应行动。
示例2:数据分析用的AI助手_简单来说,AI 代理可以处理复杂的非结构化数据任务,通常需要具备适应性。在企业环境中进行重复性高、数量大的任务时,AI 代理会变得非常强大。_
一个用于数据分析的AI代理的结构可能如下。
有几个代理被赋予了不同的专长。主管代理监督各个任务代理以确保完成你设定的目标。
作为数据从业者,你为什么应该关心呢?如果你来自数据工程的世界,代理系统和数据管道中的任务及DAG非常相似。代理也可以按照周期时间表进行编排。
仔细看看代理架构,并将其与数据管道作比较。
关键的区别在于执行的任务的性质。数据管道通常涉及结果可预测的确定性任务,而代理架构(Agent架构)则包括能够做决策和适应环境的智能任务。尽管存在这些差异,这两个系统在实现上都使用了类似的工具和框架。
数据工程师在这个不断变化的环境中具有优势,因为他们管理和协调复杂系统的经验非常适合管理AI代理程序。
随着领域的发展,数据工程师可能会发现自己需要构建和管理多个AI代理,这需要对生成式AI术语、代理构建及编排的基础知识,以及有效地将AI整合到现有工作流程中的策略有扎实的理解。
下一步是什么?打造你的第一个AI代理 — 看看我们即将为你带来什么!
谢谢您的阅读!如果你喜欢我的作品,想支持我一下。
共同学习,写下你的评论
评论加载中...
作者其他优质文章