OpenAI的ChatGPT推出高级语音模式

2024年8月1日

作者

Giovanna Rossi

3 分钟阅读

互联网人工智能

OpenAI的ChatGPT推出高级语音模式，实现实时对话

想象一下，有一个聊天机器人不仅能回应你，而且回应的方式让你感觉像是在进行真正的对话。OpenAI的ChatGPT刚刚推出了其高级语音模式，允许订阅者进行实时、逼真的口头互动。这一开创性功能目前处于alpha测试阶段，为用户提供流畅自然的体验。

特别令人印象深刻的是，它能够模仿不同的口音，根据情绪调整语调，并通过音效增强讲故事的效果。此外，它还能即兴创造独特的角色，甚至模拟猫的声音。但需要注意的是，为了确保道德使用，存在一些限制，例如禁止模仿特定声音和生成受版权保护的音频。

OpenAI计划逐步扩大这一功能的访问权限，目标是到秋季让所有Plus订阅者都能使用。因此，如果你对与听起来非常像人类的AI进行对话感到好奇，请密切关注。

关键要点

ChatGPT的高级语音模式允许进行实时、自然的对话，目前仅对部分订阅者开放alpha测试。
该功能支持多种语言和口音，并能根据用户情绪进行调整。
OpenAI通过限制特定声音的模仿和受版权保护的音频，实施了道德准则。
用户可以与AI进行讲故事、音效和实时翻译，增强互动体验。

分析

OpenAI的ChatGPT高级语音模式的推出有可能颠覆语音AI领域，影响科技巨头和初创企业。此外，其向所有Plus订阅者的扩展可能会显著影响OpenAI的收入和用户参与度。短期内，这一发展可能会促使竞争对手加快自己的AI语音技术进步，而从长远来看，AI在日常生活中的更广泛集成是预期的。

你知道吗？

高级语音模式：
- 解释：OpenAI的ChatGPT中的这一新功能支持口头对话，模拟自然人类互动，提供实时、逼真的回应。它包括模仿口音、根据情绪调整语调以及在讲故事中添加音效等元素。
预设能力：
- 解释：指ChatGPT高级语音模式中预定义的功能和限制。这些包括模拟不同的口音和声音，同时尊重道德边界，不允许特定声音的模仿或创建受版权保护的音频。
实时翻译：
- 解释：这一功能支持在对话中即时翻译口头或书面语言。它促进多语言沟通，消除语言障碍，增强整体互动体验。

您可能也喜欢

本文是根据我们的用户在新闻提交规则和指南下提交的。封面照片是计算机生成的艺术作品，仅用于说明目的；不表明实际内容。如果您认为本文侵犯了版权，请毫不犹豫地通过发送电子邮件给我们来举报。您的警惕和合作对帮助我们维护尊重和合法合规的社区至关重要。

订阅我们的通讯

通过独家预览了解我们的新产品，获取企业业务和技术的最新资讯

我们网站使用Cookie来启用某些功能，为您提供更相关的信息并优化您在我们网站上的体验。更多信息请参阅我们的隐私政策和我们的服务条款。强制性信息可在法律声明