English 简体中文 繁體中文 한국 사람 日本語 Deutsch русский بالعربية TÜRKÇE português คนไทย french
查看: 6|回复: 0

GPT-4.1深夜炸场!API专供的“开发者福音”,价格打下来了!小而强大,百万token上下文,GPT-4.5尴尬了

[复制链接]
查看: 6|回复: 0

GPT-4.1深夜炸场!API专供的“开发者福音”,价格打下来了!小而强大,百万token上下文,GPT-4.5尴尬了

[复制链接]
查看: 6|回复: 0

256

主题

0

回帖

778

积分

高级会员

积分
778
ZVymjX9vA

256

主题

0

回帖

778

积分

高级会员

积分
778
2025-4-15 09:43:34 | 显示全部楼层 |阅读模式
本周,OpenAI 再次放出大招。
按照惯例,首日更新往往最重磅。而这一次,OpenAI 在预告中就明确点名:这是一款为开发者准备的硬核模型,并用一个形象的比喻预热它——“开发者 🤝 超大质量黑洞”。
图片
OpenAI 深夜官宣的 GPT-4.1,确实名副其实。
百万 Token 的上下文窗口和显著增强的编程能力,让它成为开发者眼中的“智能协作者”——能吞下整本文档、分析复杂代码、生成完整模块,真正实现从“助理”到“代理”的跃升。
图片
GPT-4.1 在以下行业标准指标方面表现出色:

  • 编程能力:在 SWE-bench Verified 测试中,GPT-4.1 取得了 54.6% 的得分,较 GPT-4o 提升了 21.4 个百分点,较 GPT-4.5 提升了 26.6 个百分点,成为领先的编程模型。
  • 指令遵循能力:在 Scale 的 MultiChallenge 基准测试中,GPT-4.1 得分为 38.3%,比 GPT-4o 提高了 10.5 个百分点,显示出更强的指令理解和执行能力。
  • 长上下文处理能力:在 Video-MME 的“长视频无字幕”类别中,GPT-4.1 取得了 72.0% 的得分,较 GPT-4o 提升了 6.7 个百分点,树立了多模态长上下文理解的新标杆。
图片
这一次,OpenAI 不止推出了标准版,还同步上线了 mini 和 nano 两个轻量模型:

  • GPT-4.1:面向复杂任务,是编程和指令任务的主力。
  • GPT-4.1 mini/nano:适合对响应速度和成本敏感的场景,如补全、分类、数据提取等。
正如 OpenAI 所言:“并非所有任务都需要最高水平的智能。”
对于企业客户和开发者来说,定价可能才是最大的惊喜:

  • GPT-4.1 比前代成本低 26%,百万输入/输出 tokens 分别为 2 美元、8 美元;
  • mini 版分别为 0.40 和 1.60 美元;
  • nano 更低至 0.10 和 0.40 美元,成为最便宜的大模型之一。
更重要的是,OpenAI 还推出了 Prompt 缓存机制,支持最多 75% 的折扣,显著降低调用频繁时的成本。
不过,对国内开发者来说有个小挑战:
OpenAI 同时上线了“API 组织验证”机制,未来使用最先进模型需完成 Verified Organization 认证。
目前我们还不是支持该验证流程的地区,可能在直接访问上受限。唉,又close上了。
在OpenAl,我们认真对待我们的责任,确保AI既广泛可及又安全使用。不幸的是,一小部分开发者故意违反我们的使用政策,使用OpenAl的API。我们正在添加验证流程,以减少A的不安全使用,同时继续向更广泛的开发者社区提供先进模型。

超越GPT-4.5:性能、调用、可靠性全面升级

GPT-4.1 的出现,直接让 GPT-4.5 失宠。
OpenAI 明确表示,GPT-4.1 是一款高性价比的旗舰模型,在多个关键能力上不输甚至优于 GPT-4.5,而成本和延迟却更低。因此,OpenAI 已计划在 2025 年 7 月 14 日从 API 中移除 GPT-4.5,全面转向 GPT-4.1 系列。
换言之,GPT-4.1 的出现让 OpenAI 主动淘汰了自家最大最贵的模型,可见其对 GPT-4.1 实力与效率的信心。
调用方式上,GPT-4.1 仅提供 API 版本,暂未整合入 ChatGPT。这也说明了它的定位:为开发者和企业构建的“工具模型”,而非日常聊天助手。
这意味着:

  • 开发者可以将 GPT-4.1 灵活嵌入网站、应用、服务;
  • 一次性传入整个代码库、产品文档、审计日志等进行分析,无需切分上下文;
  • 构建 AI Agent、自动化系统更进一步。
GPT-4.1 为“编程体”而生

GPT-4.1 在编码任务方面的表现显著优于 GPT-4o,具体体现在以下几个方面:

  • 主动解决编码任务:GPT-4.1 在 SWE-bench Verified 测试中得分为 54.6%,比 GPT-4o 提升了 21.4 个百分点,显示出其在软件工程任务中的领先能力。 
  • 前端编码能力增强:模型在处理前端开发任务时表现出更高的准确性和效率,能够更好地理解和生成相关代码。
  • 减少不必要的编辑:GPT-4.1 在生成代码时,能够避免多余的修改,保持代码的简洁性和可读性。
  • 遵循 diff 格式:模型能够准确地生成符合 diff 格式的代码更改,方便开发者进行版本控制和代码审查。
  • 确保工具使用的一致性:GPT-4.1 在使用开发工具和库时,能够保持一致性,减少因工具使用不当导致的错误。
在 AI 编程赛道硝烟正浓之际,OpenAI 正在悄然推进“Agent”策略。
OpenAI 向 TechCrunch 表示,“GPT-4.1 的优化完全基于开发者的实际反馈,改进聚焦在他们最关心的领域:前端开发、更少的无关修改、格式和响应结构的可靠遵循、一致的工具使用等等。所有这些改进,都让开发者能够构建出在真实软件工程任务中表现更优的 AI Agent。”
训练出能够胜任复杂软件工程任务的 AI 编程模型,已成为包括 OpenAI 在内的众多科技巨头的目标。正如 OpenAI 首席财务官 Sarah Friar 上个月在伦敦的一场技术峰会中所言,公司最终的愿景是打造出“具备代理能力的软件工程师”(agentic software engineer)。
OpenAI 坚信,未来的模型将能够端到端地构建完整应用,包括质量保障、bug 测试乃至文档撰写等环节。
写在最后

AI 编程革命的新时代已经开启。GPT-4.1 所体现的,不仅是模型参数和性能的提升,更是 AI 应用思路的转变:从追求“大而全”的通用智能,走向强调高效可靠、可用性强的专精模型。
对于开发者而言,GPT-4.1 如同装上了“超级引擎”的新工具,将帮助他们以前所未有的速度构建软件、分析数据、解决问题。AI 作为开发助手的边界可能将被颠覆。
另外,昨天奥特曼还在线招聘,希望有技术人员加入到更大规模的计算构建中去。那么,OpenAI的下一步,值得期待吗?
图片
参考链接

1.https://venturebeat.com/security/openais-new-gpt-4-1-models-can-process-a-million-tokens-and-solve-coding-problems-better-than-ever/
2.https://techcrunch.com/2025/04/14/openais-new-gpt-4-1-models-focus-on-coding/
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

256

主题

0

回帖

778

积分

高级会员

积分
778

QQ|智能设备 | 粤ICP备2024353841号-1

GMT+8, 2025-5-2 01:45 , Processed in 1.417061 second(s), 24 queries .

Powered by 智能设备

©2025