据动察 Beating 监测,xAI 推出 Grok Custom Voices 和 Voice Library。用户可以在 xAI 控制台录一段声音,生成自己的 voice_id,再接入 Grok TTS 或 Voice Agent API,用于客服 agent、内容创作、游戏角色、有声书旁白等场景。
这套功能不是简单上传音频就能克隆。用户需要朗读验证短句,系统会用 STT 做实时转写,并比对验证录音和完整录音的说话人特征,确认是同一个人后才生成声线。xAI 称,这样可以防止用现成录音克隆他人声音。
目前 Custom Voices 只在美国开放,伊利诺伊州除外。控制台最多可免费创建 30 个自定义声音,API 创建能力只开放给 Enterprise 团队。自定义声音本身不额外收费,但调用语音 API 仍按量计费:Realtime 为 $3.00/小时,Text to Speech 为 $4.20/百万字符。
币须知道