加密知识一站通
行情·工具·策略

OpenAI正秘密为Codex开发实时语音模式

动察 Beating 监测,开发者 @DevAdventur3s 近日从 OpenAI Codex 的代码库中挖出 1536 行尚未激活的 Rust 代码,曝光了 Codex 正在内测的实时语音模式。这次更新最大的变化是彻底切分了交互与执行,实现了前台连麦与后台写代码的双线并行。

从泄露的界面和源码注释来看,用户用语音下达重构等复杂指令后,前台会立刻唤起一个代号为 gpt-realtime-1.5 的语音模型,通过 WebRTC 与用户实时通话并口头汇报进度。与此同时,真正拉取文件、修改代码和跑测试的重体力活,则全部交由后台另一个参数量更大的模型静默完成。

AI 编程的交互体验正从回合制文本问答,走向类似结对编程同事的实时通话。目前这套底层逻辑和配套 UI 均已合并进主干代码,只等 OpenAI 服务器端开启权限即可激活上线。

赞(0)
未经允许不得转载:币须知道 » OpenAI正秘密为Codex开发实时语音模式

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址