OpenAI 近期对其人工智能模型进行了底层系统优化,据称此举已将模型运行(即推理)的成本削减了一半。所谓的推理成本,是指模型在处理用户请求并生成响应过程中所耗费的计算资源。
此次成本降低的关键在于提高了现有服务器资源的利用效率,而非通过增加新的计算芯片来实现。这意味着运行其人工智能系统所需的英伟达(Nvidia)芯片数量得以减少。由此产生的成本节约,可以用于调低 API 的定价,或者相应地增加用户的使用额度,这对于关注 AI 算力支出的开发者和企业来说,无疑是一个好消息,尤其是在全球对人工智能技术,包括其在大型体育赛事如足球世界杯中的应用需求日益增长的背景下。


