OpenAI 在其应用程序编程接口 (API) 中推出了新的音频模型,提高了语音转文本和文本转语音 (TTS) 功能的性能。这家总部位于旧金山的 AI 公司推出了三种创新模型,旨在帮助开发人员创建具有复杂工作流程的应用程序。这些进步有望简化客户支持操作并改善整体用户体验。
OpenAI 在最近的一篇博客文章中概述了其新的 API 专用音频模型的功能。该公司强调了其开发 AI 代理的历史,包括 Operator、Deep Research 和包含内置工具的 Responses API。然而,OpenAI 指出,这些代理的全部潜力只有在它们直观地操作并在文本以外的各种媒介上进行交互时才能实现。