导读: xAI 推出两项重磅更新: Grok 4.1 Fast 与 Agent Tools API ,支持超长 200 万上下文、更快推理、更低成本。工具集成能力升级,可实时查阅 X 动态、搜索网页、执行代码,在多项评测中领先同类产品,强调“真实业务场景”表现。
xAI 今天发布了两项面向开发者的重要更新: Grok 4.1 Fast ,以及一套全新的 Agent Tools API 。这两者组合在一起,旨在让开发者更轻松地构建可在真实环境中独立完成任务的智能代理。
Grok 4.1 Fast 被定位为 xAI 目前最强的工具调用版本,支持 200 万上下文 ,处理任务的速度和准确度相比之前有明显提升,尤其是客服、金融等对响应质量要求很高的领域。
长上下文能力不掉链子 不少智能代理在对话轮次增加或上下文拉长之后性能会明显下滑。为了解决这点,Grok 4.1 Fast 采用了面向长任务链的训练方式,在多轮对话和长上下文测试中都保持了较高准确率,这也是其被定位为“生产可用”的主要原因。
Agent Tools API:让代理真正具备行动能力 另一项更新是 Agent Tools API 。简单来说,它为 Grok 4.1 Fast 配备了能“上手干活”的工具,包括:
- 实时读取 X 平台数据
- 进行网页搜索
- 执行 Python 代码
- 搜索开发者上传的文件
- 连接第三方 MCP 服务
开发者只需写几行代码,Grok 就能浏览网页、分析趋势、运行脚本,甚至同时调用多种工具完成复杂任务。所有工具运行都由 xAI 的基础设施托管,不必再为 API Key、沙箱或检索系统操心。
在多项衡量智能代理“多跳搜索”和“深度检索”能力的基准中,Grok 4.1 Fast 与 Agent Tools API 的组合表现领先。此外,在事实性评估(FActScore)中,它保持了与现有版本接近的准确度,同时将错误率降低近一半,展现出更可靠的输出质量。
xAI 将提供两个接口版本:
- grok-4-1-fast-reasoning :专注更高推理能力
- grok-4-1-fast-non-reasoning :响应更快
未来两周内,Grok 4.1 Fast 将在部分平台免费开放使用,Agent Tools API 也将免费至 12 月 3 日。
定价表
| 项目 | 计费标准 | 说明 |
|---|---|---|
| 输入 Tokens | $0.20 / 100 万 tokens | 普通输入内容的计费方式 |
| 缓存输入 Tokens | $0.05 / 100 万 tokens | 用于重复调用的缓存上下文,更低成本 |
| 输出 Tokens | $0.50 / 100 万 tokens | 模型生成文字的计费方式 |
| 工具调用(Tool Calls) | 从 $5 / 1000 次成功调用起 | 按成功调用次数计费,具体费用视工具而定 |
限时免费政策
| 内容 | 免费范围 | 截止时间 |
|---|---|---|
| Grok 4.1 Fast(全部模型) | 在 OpenRouter 上免费使用 | 官方未指定截止日期(限时活动) |
| Agent Tools API | 所有工具完全免费 | 免费至 12 月 3 日 |

