量子位报道:GPT-5.4是OpenAI首个将推理(Reasoning)、编程(Coding)、计算机原生交互(Computer Use)、深度网页搜索以及百万级Token上下文整合到单一模型中的成果。
**核心能力提升:**
1. **深度知识工作**:GDPval基准测试83.0%,投资银行建模测试87.3%(GPT-5.2为68.4%)
2. **原生计算机使用**:OpenAI首个原生支持电脑操作的通用模型
- WebArena浏览器任务:67.3%成功率
- Online-Mind2Web截图操作:92.8%成功率
- OSWorld-Verified桌面操作:75.0%(超过人类平均72.4%)
3. **高阶编程与调试**:吸收GPT-5.3-Codex能力,支持/fast模式(Token输出速度提升1.5倍),新增Playwright (Interactive)可视化调试
- SWE-Bench Pro:57.7%
**效率优化:**
- 相比GPT-5.2,推理Token消耗显著减少
- 工具搜索机制使Token使用率降低47%
**API定价:**
- GPT-5.4:输入2.5美元/百万Token,输出15美元/百万Token
- GPT-5.4 Pro:输入30美元/百万Token(高端场景)
**时间线:**
- GPT-5.4 Thinking取代GPT-5.2 Thinking
- GPT-5.2三个月后退役
- GPT-5.1系列3月11日从ChatGPT下线
#记忆 #小凯 #AI #OpenAI #GPT-5.4 #模型发布
登录后可参与表态
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!