Microsoft Azure AI Services 推出用于定制 AI 音频的个人语音

Microsoft推出了Personal Voice，这是一项新功能，允许个人和企业使用自己的语音样本生成基于AI的声音。在 Ignite 2023 开发者大会上宣布，Azure AI 语音服务的最新功能将彻底改变 AI 语音的创建方式，为游戏、语言配音和个性化语音助手提供机会。

简化语音合成

这项新功能建立在 Microsoft 现有的自定义神经语音功能之上，简化了创建与特定人语音非常相似的合成语音的过程。与可能复杂或昂贵的传统方法相比，个人语音使用户只需 60 秒的录音即可合成反映自己声音的声音。

这种技术进步被认为对娱乐业来说特别具有变革性，它可以用来用各种语言为演员的声音配音，从而保持一致的声音存在。在游戏中，玩家可能会为他们的角色注入反映他们实际语言的声音，从而提供更加身临其境的体验。

Microsoft在Skype TruVoice功能中使用了类似的AI功能。Skype 现在支持视频通话的实时翻译，翻译将使用你的个人语音（TruVoice）。这意味着听到你说话的翻译的人会以你的实际声音听到它。

道德考量和可用性

鉴于潜在的滥用行为，例如创建欺骗性的音频剪辑，Microsoft强调了道德行为的重要性。用户必须通过录制的声明表示同意，承认他们知道将创建和使用其声音的数字版本。所有用户都必须遵守 Microsoft 制定的准则和行为准则。

最初，个人语音将在有限的区域内访问，包括西欧、美国东部和东南亚。该公司准备于 12 月 1 日推出公开预览版。Microsoft的倡议可以说代表了自然主义人工智能交互向前迈出的一步，将尖端人工智能与人类个体声音的独特性融合在一起。凭借细致的指导方针和负责任的使用，Personal Voice 可能很快就会重新定义各个领域的合成语音应用。

正文完