OpenAI推出Flex处理功能,用于更便宜但更慢的人工智能任务

为了更积极地与谷歌等竞争对手人工智能公司展开竞争,OpenAI 正在推出Flex处理功能,这是一种应用程序编程接口(API)选项,它以较慢的响应时间和 “偶尔的资源不可用” 为代价,提供更低的人工智能模型使用价格。

OpenAI表示,Flex处理功能目前以测试版的形式应用于该公司最近发布的o3和o4-mini推理模型,其目标是处理优先级较低的 “非生产性” 任务,例如模型评估、数据充实和异步工作负载。

它将API成本精确地降低了一半。对于o3模型,Flex处理功能的价格为每百万输入令牌(约75万个单词)5美元,每百万输出令牌20美元,而标准价格为每百万输入令牌10美元,每百万输出令牌40美元。对于o4-mini模型,Flex将价格从每百万输入令牌1.10美元和每百万输出令牌4.40美元,降低到每百万输入令牌0.55美元和每百万输出令牌2.20美元。

Flex处理功能推出之际,前沿人工智能的价格持续攀升,而竞争对手则发布了更便宜、更高效的面向预算的模型。周四,谷歌推出了Gemini 2.5 Flash,这是一个推理模型,在性能方面与DeepSeek的R1相当甚至更优,同时输入令牌成本更低。

在一封向客户宣布推出Flex定价的电子邮件中,OpenAI还表示,其使用层级体系中1至3级的开发人员必须完成新引入的身份验证流程,才能访问o3模型。层级是由在OpenAI服务上的花费金额决定的。o3模型以及其他模型的推理摘要和流式API支持也需在身份验证后才能使用。

OpenAI此前曾表示,身份验证旨在阻止不良行为者违反其使用政策。

Frontiers
Frontiers
文章: 93