语音通话(插件)
通过插件为 OpenClaw 提供语音通话。支持出站通知和多轮对话,带有入站策略。 当前提供程序:twilio(可编程语音 + 媒体流)telnyx(呼叫控制 v2)plivo(语音 API + XML 传输 + GetInput 语音)mock(开发/无网络)
- 安装插件
- 重启网关
- 在
plugins.entries.voice-call.config下配置 - 使用
openclaw voicecall ...或voice_call工具
它在哪里运行(本地 vs 远程)
语音通话插件在网关进程内运行。 如果您使用远程网关,请在运行网关的机器上安装/配置插件,然后重启网关以加载它。安装
选项 A: 从 npm 安装(推荐)
选项 B: 从本地文件夹安装(开发,无复制)
配置
在plugins.entries.voice-call.config 下设置配置:
- Twilio/Telnyx 需要公开可访问的 webhook URL。
- Plivo 需要公开可访问的 webhook URL。
mock是本地开发提供程序(无网络调用)。skipSignatureVerification仅用于本地测试。- 如果您使用 ngrok 免费层,将
publicUrl设置为确切的 ngrok URL;始终强制执行签名验证。 tunnel.allowNgrokFreeTierLoopbackBypass: true允许仅当tunnel.provider="ngrok"且serve.bind为环回(ngrok 本地代理)时具有无效签名的 Twilio webhook。仅用于本地开发。- Ngrok 免费层 URL 可能会更改或添加间隙行为;如果
publicUrl漂移,Twilio 签名将失败。对于生产,首选稳定域或 Tailscale funnel。
通话的 TTS
语音通话使用核心messages.tts 配置(OpenAI 或 ElevenLabs)在通话中流式传输语音。您可以在插件配置下使用相同的形状覆盖它 - 它与 messages.tts 深度合并。
- 语音通话忽略 Edge TTS(电话音频需要 PCM;Edge 输出不可靠)。
- 启用 Twilio 媒体流时使用核心 TTS;否则通话回退到提供程序本机语音。
更多示例
仅使用核心 TTS(无覆盖):入站通话
入站策略默认为disabled。要启用入站通话,设置:
responseModelresponseSystemPromptresponseTimeoutMs
CLI
代理工具
工具名称:voice_call
操作:
initiate_call(message, to?, mode?)continue_call(callId, message)speak_to_user(callId, message)end_call(callId)get_status(callId)
skills/voice-call/SKILL.md 提供匹配的技能文档。
网关 RPC
voicecall.initiate(to?,message,mode?)voicecall.continue(callId,message)voicecall.speak(callId,message)voicecall.end(callId)voicecall.status(callId)