技术架构
AI 能力云端
通话系统私有化部署
跟纯 SaaS 不同,VIPCTI 把通话系统放在客户本地,AI 大脑放在云端——用真正的双产品架构兼顾合规与持续迭代。
客户端系统(私有化部署)
- 通话引擎
- FreeSWITCH
- 业务后端
- Go (Gin + GORM)
- 数据库
- PostgreSQL 16 + Redis 7
- 管理后台
- React 18 + UmiJS 4 + Ant Design 5
- 坐席客户端
- Tauri 2 桌面应用
- 通话协议
- SIP + WebRTC (JsSIP)
AI 云平台(自运营)
- LLM
- DeepSeek / 通义千问
- ASR
- 阿里云实时语音识别
- TTS
- 阿里云 CosyVoice 流式
- 向量检索
- pgvector
- 对话引擎
- Go 自研流程执行器
- 授权服务
- Ed25519 签名 + 云端激活
设计原则
四条不妥协的架构选择
01
通话数据不出本地
客户的音频流、原始号码、通话录音全部留在客户内网。客户本地通过 HTTPS 仅向云端传输脱敏文本(ASR 结果、LLM 提示词),云端无法重建用户身份和通话内容。
02
Go 后端·防反编译
客户端系统用 Go 编译为单二进制。相比 Java/Python 反编译几乎无门槛,Go 的逆向难度高一个数量级,更适合需要交付给客户私有化部署的场景。
03
全链路流式·低延迟
ASR、LLM、TTS 全部流式调用。ASR 流式输出 + LLM 流式生成 + TTS 流式合成,端到端延迟优化目标 1 秒以内,让对话节奏接近真人。
04
双层授权·远程吊销
第一层:机器指纹 + Ed25519 离线签名校验,防止 License 文件拷贝。第二层:AI 云 API Key 云端校验+计量,绕过第一层也无法使用 AI 能力,云端可远程吊销。
数据流
敏感数据走向,一目了然
通话音频、原始号码、录音从未离开客户本地。本地与云端之间只有脱敏文本交互。
- FreeSWITCH(本地)RTP本地音频流
- 本地音频流脱敏文本(仅 ASR 结果)AI 云对话引擎
- AI 云对话引擎回复文本(不含敏感信息)本地 TTS 播放
- 通话录音永不离开客户内网本地存储
- 客户号码永不离开客户内网本地数据库