……在商业应用方面已经出现转变,重点已经从AI代理转向代理工作流和数据合成。
为何现在大家对AI的关注变少了?像 Salesforce 和 Service 这样的公司已经开始使用 AI 代理,然而,实际情况是,这项技术在准确性上还有很大的提升空间。
如果撇开市场营销的炒作不谈,尽管有许多炫酷的AI代理原型和演示,但它们的准确度目前还无法满足实际生产的需要。
克劳德AI代理的计算机界面(ACI)的性能仅为人类性能的14%。
下面的图表来自TheAgentFactory,展示了AI代理在成本、步骤和成功率方面的分布情况。可以看出成功率大约只有20%。
这些数字残酷地反映了当前的情况。
随着最近OpenAI发布的Operator,计算机和网络浏览器的使用准确率达到了30%到50%,但这个数字仍然远低于人类70%以上的水平。
(更多详情)更多详情
另外,还有一些有趣的研究表明,具有网页浏览功能的AI代理容易成为恶意弹窗攻击的目标。
有两种方式可以让AI代理像人一样完成任务;一种是通过网络浏览器(如Webvoyager、OpenAI Operator等)。另一种是通过操作系统的完整GUI(如Anthropic)。
这些方法利用图形用户界面(GUI)作为AI代理的接口。
最初的尝试是使用单独的API,但这样做并不实际,因为每个API集成都会带来集成的额外开销。此外,对于许多商业应用来说,根本没有提供API。
基于代理工作流为什么重要?大家都认为现代知识工作出了状况,相关数据显示,有报告称员工花30%的时间找信息。
知识工作者们在回答复杂问题并需要从不同文档中整合信息时也会遇到难题。
代理任务流程(如下图所示)支持推理,并将复杂任务拆解成更简单的子任务,将这些任务按顺序衔接起来。
通过执行这个序列,就引入了如可观察性、可检查性和可发现性等特性。
数据整合将变得越来越重要。知识工作者使用的一种代理工作流就是一个例子,它能够将工作数据和资源整合,为工作者提供一个综合的答案。
语言模型提供商不再仅仅提供模型,而是进一步扩展到用户体验方面。ChatGPT中的深度研究并不是一个新的模型,而是一种新的代理能力,存在于ChatGPT中,能够在网络上进行多步骤研究,处理各种复杂任务。这种能力能在十几分钟内完成的任务,人类可能需要数小时才能完成。
这也是一个将不同的数据来源整合起来以回答用户问题的好例子。
我觉得这个概念的核心在于LlamaIndex提出的“代理增强检索生成(Agentic RAG)”,其核心在于在某个特定时刻,为“单个用户”整合数据将变得越来越重要。
在未来几个月里,将会有大量的关注集中在个人代理任务管理、信息整合以及所谓的桌面编排上。
推理与解决问题现代的人工智能模型越来越注重将推理作为核心功能。这样,它们能够通过把复杂问题拆解为可管理的部分来解决这些问题。
这种转变是由一种创新的方法来支撑的,这种方法将问题拆分成更小的部分,让模型能够系统地处理每个部分。
这些模型通过将推理视为内部机制,可以模拟类似人类的思考方式,从而提高提供准确和细致回应的能力。
分解策略不仅提升了问题解决的效率,还提高了结论形成过程的透明度。
因此,用户可以从更易于理解的输出结果中受益,这有助于将复杂的计算方法与可理解的决策之间进行连接。
最初,用户需要告诉模型如何推理和拆解复杂或组合任务,并通过少量示例让模型模仿。
最后的总结组织应调整其重点,从专注于特定工具或趋势——比如那些曾经被称为RAG公司、Prompt工程平台——转而优先解决实际的业务问题。
世界以前所未有的速度向前发展,新技术几乎每天都在涌现,每项技术都承诺将给行业带来革命性变化。
但是,真正的创新并不在于掌握最新技术,而在于把这些进步应用到创造实实在在的价值。
不论是改善客户体验、简化运营流程,还是满足社会需求,问题在于,我们如何运用技术来提供有实际意义的解决方案?
通过拥有这种心态,企业可以确保自己在未来仍然保持其相关性,并为自己打下坚实的基础。
[首席传道师(Chief Evangelist)](@Kore.ai 的首席传道师 Cobus Greyling) | 我喜欢分享关于这些技术如何影响未来的见解和想法。从语言模型、AI代理到代理应用,再到数据驱动的生产力工具和开发框架,我探讨这些技术如何塑造未来。
共同学习,写下你的评论
评论加载中...
作者其他优质文章