近日,人工智能领域迎来了一场地震!埃隆·马斯克旗下 xAI 公司正式发布了其最新一代大语言模型 Grok 3,并将其誉为“地球上最聪明的 AI”。这款模型不仅在多项基准测试中全面超越 GPT-4o、Gemini 2.0 Pro、DeepSeek-V3 和 Claude 3.5 Sonnet 等当前所有主流基础模型,更以其惊人的推理能力,标志着 xAI 在构建具备强大推理能力的智能体方面迈出了关键一步。
性能怪兽,推理能力比肩人类思考
Grok 3 在 xAI 的 Colossus 超级集群上进行训练,其计算能力是之前最先进模型的 10 倍!这使得 Grok 3 在推理、数学、编码、世界知识和指令遵循任务方面取得了显著的进步。通过大规模强化学习 (RL) 的精炼,Grok 3 的推理能力得到了质的飞跃,能够模拟人类解决复杂问题时的过程:分析问题、探索多种方案、纠正错误、验证答案,最终在几秒到几分钟内给出精确的解答。
在 Chatbot Arena 基准测试中,Grok 3 获得了高达 1402 的 Elo 评分,力压群雄。在具体的学术测试中,Grok 3 (Think) 更是展现出惊人的实力:
- 2025 年美国数学邀请赛 (AIME):93.3% (最高级别的测试时计算 cons@64)
- 研究生水平专家推理 (GPQA):84.6%
- LiveCodeBench (代码生成与问题解决):79.4%
即使在关闭推理功能的情况下,Grok 3 依然能在多项基准测试中提供即时、高质量的响应,并取得领先结果。此外,Grok 3 在图像理解 (MMMU) 和视频理解 (EgoSchema) 任务中也表现出色,堪称全能型选手。
100 万 Token 上下文窗口,长文本处理能力飙升
Grok 3 拥有高达 100 万个 token 的上下文窗口,是 xAI 之前模型的 8 倍!这意味着 Grok 3 能够处理更长的文本输入,理解更复杂的指令,并在处理长文档时保持更高的准确性。在针对长上下文 RAG 用例的 LOFT (128k) 基准测试中,Grok 3 在 12 个不同的任务中均取得了最先进的平均准确率,充分展示了其强大的信息检索能力。
不止于强大,更有高性价比的 Grok 3 mini
除了性能炸裂的 Grok 3 (Think) 之外,xAI 还贴心地推出了 Grok 3 mini (Think),旨在为不需要大量世界知识的 STEM 任务提供高性价比的推理解决方案。Grok 3 mini 在 AIME 2024 上达到了 95.8%,在 LiveCodeBench 上达到了 80.4%,展现出令人瞩目的性能。
DeepSearch:通往通用人工智能的桥梁
为了实现“理解宇宙”的愿景,xAI 还推出了 Grok 3 的首个应用——DeepSearch。DeepSearch 是一个闪电般快速的 AI 智能体,它能够访问互联网并利用代码解释器,在整个人类知识库中进行深度搜索和推理,综合关键信息,处理矛盾观点,并最终生成简洁、全面的报告。这标志着 xAI 在迈向通用人工智能的道路上迈出了坚实的一步。
如何抢先体验 Grok 3?
目前,Grok 3 已率先向 X 平台(原 Twitter)的 SuperGrok 订阅用户开放使用。xAI 同时推出了更高级的 SuperGrok 订阅计划,旨在为用户提供更丰富的功能和更流畅的体验。
想要抢先体验这款“地球上最聪明的 AI”,你有两种选择:
1. SuperGrok 订阅(付费):
- 优势: 享受更高的速率限制、更深入的“思维模式”、更强大的 DeepSearch 功能、无限图像生成等特权。
- 价格: 每月 30 美元起。
- 订阅步骤:
- 注册 X 账号:访问 [X 官网],选择使用 Google 账号、Apple 账号或邮箱注册,并完成验证。
- 订阅 SuperGrok:登录 X 账号后,在主页面左侧导航栏找到并点击“订阅”按钮,选择 SuperGrok 计划。
- 订阅 SuperGrok: 自己没有条件支付可以参考
uiuihao.com
这类平台(推荐)。
2. 限时免费试用:
xAI 宣布 Grok 3 将提供限时免费试用,直至服务器负载达到上限。这意味着你可以免费体验这款强大的 AI 模型!
- 体验方式:
- X 平台: 在 X 平台的聊天界面直接与 Grok 3 对话。
- Grok 官网: 访问 [Grok 官网],在聊天界面与 Grok 3 互动。
- Grok 应用程序: 下载并安装 Grok 应用程序(支持 iOS 和 Android),在应用内与 Grok 3 交流。
注意事项: 想要获得更稳定、更全面的体验,建议订阅 Premium+ 或 SuperGrok 服务。
持续进化,未来可期
需要强调的是,目前发布的 Grok 3 和 Grok 3 mini 仍处于预览阶段,并且仍在持续训练中。xAI 表示,将在接下来的几周内发布 Grok 3 和 Grok 3 mini 的 API,让更多开发者能够体验到 Grok 3 的强大能力。随着 xAI 在其 200,000 个 GPU 集群上训练更大规模的模型,我们有理由相信,Grok 系列模型将在未来带来更多惊喜,推动人工智能领域迈向新的高度。
Grok 3 的发布标志着人工智能领域又一重大突破。赶快行动,体验这款备受瞩目的 AI 模型吧! 让我们一起见证 AI 新纪元的到来!
共同学习,写下你的评论
评论加载中...
作者其他优质文章