OpenAI发布语音模型GPT-realtime—新闻

作者：张佳欣来源：科技日报发布时间：2025/9/2 7:51:23

选择字号：小中大

OpenAI发布语音模型GPT-realtime

图片来源：美国OpenAI官网

科技日报讯（记者张佳欣）8月28日，美国人工智能公司OpenAI发布了其所谓“最先进的语音到语音模型”GPT-realtime，以及配套的Realtime API（实时应用程序接口）。

据OpenAI公司介绍，该模型在理解复杂指令、精准调用工具以及生成自然、富有表现力的语音方面表现突出，并在客户服务、教育、个人助理等多种场景中具备广泛应用潜力。

与传统语音模型不同，GPT-realtime新增了Marin与Cedar两种极具特色的语音，同时对原有8种语音进行了全面升级。模型不仅能生成自然流畅的语音，还能够敏锐捕捉笑声等非语言信号，在句子中间自如切换语言，并可根据场景需求灵活调整语气，使语音交互更贴近真实人类沟通。

通过Realtime API，开发者可实现实时语音输入输出，不必再经过繁琐的多模型转换流程。在实际应用中，这套技术可用于客户服务系统，让虚拟助手即时解答问题，提高效率和体验。它还可应用于教育领域，实现语音对话和口语练习。而在个人助理、办公或智能家居场景中，用户能通过语音快速完成安排或查询信息。结合图像或文本输入，开发者还能打造更智能的虚拟助手或机器人系统。

OpenAI表示，GPT-realtime和Realtime API已于8月28日起面向所有付费开发者开放。

特别声明：本文转载仅仅是出于传播信息的需要，并不意味着代表本网站观点或证实其内容的真实性；如其他媒体、网站或个人从本网站转载使用，须保留本网站注明的“来源”，并自负版权等法律责任；作者如果不希望被转载或者联系转载稿费等事宜，请与我们接洽。

编辑部推荐博文
论文投稿新问题！审稿人说插图AI感太重…… 为何常成为论文评审中的薄弱环节？多场耦合烧结技术引领高性能材料制备新纪元紫荆、紫藤和紫薇！掌控情绪的钥匙我用OpenClaw帮我做这些事情，夯爆了更多>>