过去的一年对于人工智能来说是变革性的,见证了众多突破性创新,新兴的监管,以及向提高生产力的实用工具转变。展望2025,让我们看看2024年的主要进展,并探讨未来的可能性。
第一部分:2024年回顾篇OpenAI 带头
在2024年,OpenAI依然处于AI创新的前沿。5月推出的GPT-4o标志着一个重要里程碑,作为首个前沿的多模态模型,它可以理解和生成多种媒体的内容。9月,o1和它的轻量级版本o1-mini相继发布,同年12月,o3的发布也得到了确认。
值得一提的是,OpenAI的Sora项目革新了视频生成领域。该项目在二月宣布,并在十二月引入了Sora Turbo,展现了从文本描述生成逼真视频内容的前所未有的能力。
AI代理, 和 AI助手
不是取代工作,2024年的AI通过创新工具和助手来提高生产力。谷歌推出了几个开创性项目:Astra,一款适用于手机和智能眼镜的AI助手,以及Mariner,一个能够使Gemini与你的浏览器交流的Chrome扩展程序。这些工具标志着从简单的聊天界面转向更智能的交互式代理,它们能够理解和操控我们的数字世界。
Anthropic让Claude像人类一样使用计算机——看屏幕、操作光标和与界面进行互动——加入了这一趋势。这一发展开启了新的可能,让AI在日常计算机任务中提供更多帮助。
开发社区看到了一些特别令人兴奋的进步。GitHub的Copilot和Cursor AI在开发社区中大受欢迎。另一方面,像Devin和GitHub Workspace这样的自主编码工具仍然有些粗糙。这些工具并不会取代开发者的工作;相反,它们通过处理日常任务和提出改进建议来增强开发者的效率。
AI管治
2024年,AI监管方面取得了一些显著进展,特别是欧盟的《人工智能法》。这一具有里程碑意义的法案建立了第一个全面的人工智能监管体系,制定了AI系统开发和部署的相关规则,同时在创新、安全和伦理方面保持平衡。
第二部分:展望2025小型专业模型
尽管像GPT和Claude这样的只解码模型一直占据着头条新闻,但在2025年,只编码的模型依然很重要。就在年底最后一周,ModernBERT发布了,这标志着长期以来,这一领域一直期待的重大进步。这些模型对于检索增强生成(RAG)场景特别重要,尤其是在这种场景中,它们在信息检索和分类方面表现出色,并且运行成本显著降低。
类似地,目前代理系统的发展趋势更倾向于小型且专门化的模型。这些模型在特定任务上达到与前沿模型相当的水平,它们在代理工作流程中协同使用时,可以构建出更加强大且资源高效的人工智能系统。
多模态模型和测试时计算
我们可以期待在多模态能力方面取得重大进展,AI系统将更加自然地处理和回应各种形式的输入——文本、声音、图像和视频。同时,这些改进将使AI交互更加自然,更能适应情境。
2024年,“测试时计算”——给予模型更多思考时间的概念出现,成为改变游戏规则的存在,并且在2025年可能会更加突出。前沿模型如OpenAI的o3在推理、数学和编码基准测试中表现优异,它们在复杂推理任务中持续击败人类,这让我们不禁思考通用型人工智能还有多远的路要走。
测试时计算不仅在前沿模型中表现出色,而且在小型模型中也表现出色。在小型模型中使用时,即使规模较小,也能在给予更多处理时间时,超越更大规模模型的表现。例如,采用256次迭代的测试计算策略,在Math-500基准测试中,Llama 3.2 3B超越了Llama 3.1 70B。
人工智能监管的演变.
在欧盟的引领下,我们可能会看到更多的地区在2025年实施与人工智能相关的法规。有趣的是,大型科技公司正积极呼吁加强监管,这可能是一种策略,旨在塑造监管环境,以利于自身发展,并提高竞争对手进入市场的门槛。
总结2024年,人工智能领域取得了显著的进步。我们发现越来越多的新方法将人工智能融入日常生活,同时也出现了许多改进模型的方法,使它们更接近通用人工智能(AGI)的目标。进入2025年,重点似乎转向了更专业和高效的AI系统,并利用测试时计算等技术提高推理能力,并更侧重于利用AI工具提高生产力。
共同学习,写下你的评论
评论加载中...
作者其他优质文章