Microsoft推出了Personal Voice,这是一项新功能,允许个人和企业使用自己的语音样本生成基于AI的声音。在 Ignite 2023 开发者大会上宣布,Azure AI 语音服务的最新功能将彻底改变 AI 语音的创建方式,为游戏、语言配音和个性化语音助手提供机会。
简化语音合成
这项新功能建立在 Microsoft 现有的自定义神经语音功能之上,简化了创建与特定人语音非常相似的合成语音的过程。与可能复杂或昂贵的传统方法相比,个人语音使用户只需 60 秒的录音即可合成反映自己声音的声音。
这种技术进步被认为对娱乐业来说特别具有变革性,它可以用来用各种语言为演员的声音配音,从而保持一致的声音存在。在游戏中,玩家可能会为他们的角色注入反映他们实际语言的声音,从而提供更加身临其境的体验。
Microsoft在Skype TruVoice功能中使用了类似的AI功能。Skype 现在支持视频通话的实时翻译,翻译将使用你的个人语音 (TruVoice)。这意味着听到你说话的翻译的人会以你的实际声音听到它。
道德考量和可用性
鉴于潜在的滥用行为,例如创建欺骗性的音频剪辑,Microsoft强调了道德行为的重要性。用户必须通过录制的声明表示同意,承认他们知道将创建和使用其声音的数字版本。所有用户都必须遵守 Microsoft 制定的准则和行为准则。
最初,个人语音将在有限的区域内访问,包括西欧、美国东部和东南亚。该公司准备于 12 月 1 日推出公开预览版。Microsoft的倡议可以说代表了自然主义人工智能交互向前迈出的一步,将尖端人工智能与人类个体声音的独特性融合在一起。凭借细致的指导方针和负责任的使用,Personal Voice 可能很快就会重新定义各个领域的合成语音应用。
正文完