语音通话(插件)
通过插件为 OpenClaw 提供语音通话功能。支持外呼通知和多轮对话的来电策略。 当前支持的提供商:twilio(Programmable Voice + Media Streams)telnyx(Call Control v2)plivo(Voice API + XML transfer + GetInput speech)mock(开发环境/无网络)
- 安装插件
- 重启 Gateway网关
- 在
plugins.entries.voice-call.config下进行配置 - 使用
openclaw voicecall ...或voice_call工具
运行位置(本地 vs 远程)
语音通话插件运行在 Gateway网关进程内部。 如果你使用远程 Gateway网关,请在运行 Gateway网关的机器上安装和配置插件,然后重启 Gateway网关以加载它。安装
方式 A:从 npm 安装(推荐)
方式 B:从本地文件夹安装(开发环境,不复制文件)
配置
在plugins.entries.voice-call.config 下设置配置:
- Twilio/Telnyx 需要一个可公网访问的 webhook URL。
- Plivo 需要一个可公网访问的 webhook URL。
mock是本地开发提供商(不进行网络调用)。skipSignatureVerification仅用于本地测试。- 如果你使用 ngrok 免费版,请将
publicUrl设置为精确的 ngrok URL;签名验证始终强制执行。 tunnel.allowNgrokFreeTierLoopbackBypass: true允许在tunnel.provider="ngrok"且serve.bind为 local loopback(ngrok 本地代理)时,接受签名无效的 Twilio webhook。仅用于本地开发。- Ngrok 免费版 URL 可能会变化或出现插页行为;如果
publicUrl偏移,Twilio 签名将会失败。生产环境建议使用稳定域名或 Tailscale funnel。
通话的 TTS
语音通话使用核心messages.tts 配置(OpenAI 或 ElevenLabs)来进行通话中的流式语音合成。你可以在插件配置下使用相同的结构进行覆盖——它会与 messages.tts 进行深度合并。
- 语音通话会忽略 Edge TTS(电话音频需要 PCM;Edge 输出不可靠)。
- 当启用 Twilio 媒体流时使用核心 TTS;否则通话将回退到提供商原生语音。
更多示例
仅使用核心 TTS(不覆盖):来电
来电策略默认为disabled。要启用来电,请设置:
responseModelresponseSystemPromptresponseTimeoutMs
CLI
智能体工具
工具名称:voice_call
操作:
initiate_call(message、to?、mode?)continue_call(callId、message)speak_to_user(callId、message)end_call(callId)get_status(callId)
skills/voice-call/SKILL.md。
Gateway网关 RPC
voicecall.initiate(to?、message、mode?)voicecall.continue(callId、message)voicecall.speak(callId、message)voicecall.end(callId)voicecall.status(callId)