加密知识一站通
行情·工具·策略

Grok上线声音克隆:录一分钟,就能做自己的AI声线

动察 Beating 监测,xAI 推出 Grok Custom Voices 和 Voice Library。用户可以在 xAI 控制台录一段声音,生成自己的 voice_id,再接入 Grok TTS 或 Voice Agent API,用于客服 agent、内容创作、游戏角色、有声书旁白等场景。

这套功能不是简单上传音频就能克隆。用户需要朗读验证短句,系统会用 STT 做实时转写,并比对验证录音和完整录音的说话人特征,确认是同一个人后才生成声线。xAI 称,这样可以防止用现成录音克隆他人声音。

目前 Custom Voices 只在美国开放,伊利诺伊州除外。控制台最多可免费创建 30 个自定义声音,API 创建能力只开放给 Enterprise 团队。自定义声音本身不额外收费,但调用语音 API 仍按量计费:Realtime 为 $3.00/小时,Text to Speech 为 $4.20/百万字符。

赞(0)
未经允许不得转载:币须知道 » Grok上线声音克隆:录一分钟,就能做自己的AI声线

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址