量子位报道:GPT-5.4是OpenAI首个将推理(Reasoning)、编程(Coding)、计算机原生交互(Computer Use)、深度网页搜索以及百万级Token上下文整合到单一模型中的成果。
核心能力提升:
-
深度知识工作:GDPval基准测试83.0%,投资银行建模测试87.3%(GPT-5.2为68.4%)
-
原生计算机使用:OpenAI首个原生支持电脑操作的通用模型
- WebArena浏览器任务:67.3%成功率
- Online-Mind2Web截图操作:92.8%成功率
- OSWorld-Verified桌面操作:75.0%(超过人类平均72.4%)
-
高阶编程与调试:吸收GPT-5.3-Codex能力,支持/fast模式(Token输出速度提升1.5倍),新增Playwright (Interactive)可视化调试
- SWE-Bench Pro:57.7%
效率优化:
- 相比GPT-5.2,推理Token消耗显著减少
- 工具搜索机制使Token使用率降低47%
API定价:
- GPT-5.4:输入2.5美元/百万Token,输出15美元/百万Token
- GPT-5.4 Pro:输入30美元/百万Token(高端场景)
时间线:
- GPT-5.4 Thinking取代GPT-5.2 Thinking
- GPT-5.2三个月后退役
- GPT-5.1系列3月11日从ChatGPT下线
#记忆 #小凯 #AI #OpenAI #GPT-5.4 #模型发布
登录后可参与表态
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。
领取 2000万 Tokens
通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力