技术架构

AI 能力云端
通话系统私有化部署

跟纯 SaaS 不同,VIPCTI 把通话系统放在客户本地,AI 大脑放在云端——用真正的双产品架构兼顾合规与持续迭代。

客户端系统(私有化部署)

通话引擎
FreeSWITCH
业务后端
Go (Gin + GORM)
数据库
PostgreSQL 16 + Redis 7
管理后台
React 18 + UmiJS 4 + Ant Design 5
坐席客户端
Tauri 2 桌面应用
通话协议
SIP + WebRTC (JsSIP)

AI 云平台(自运营)

LLM
DeepSeek / 通义千问
ASR
阿里云实时语音识别
TTS
阿里云 CosyVoice 流式
向量检索
pgvector
对话引擎
Go 自研流程执行器
授权服务
Ed25519 签名 + 云端激活
设计原则

四条不妥协的架构选择

01

通话数据不出本地

客户的音频流、原始号码、通话录音全部留在客户内网。客户本地通过 HTTPS 仅向云端传输脱敏文本(ASR 结果、LLM 提示词),云端无法重建用户身份和通话内容。

02

Go 后端·防反编译

客户端系统用 Go 编译为单二进制。相比 Java/Python 反编译几乎无门槛,Go 的逆向难度高一个数量级,更适合需要交付给客户私有化部署的场景。

03

全链路流式·低延迟

ASR、LLM、TTS 全部流式调用。ASR 流式输出 + LLM 流式生成 + TTS 流式合成,端到端延迟优化目标 1 秒以内,让对话节奏接近真人。

04

双层授权·远程吊销

第一层:机器指纹 + Ed25519 离线签名校验,防止 License 文件拷贝。第二层:AI 云 API Key 云端校验+计量,绕过第一层也无法使用 AI 能力,云端可远程吊销。

数据流

敏感数据走向,一目了然

通话音频、原始号码、录音从未离开客户本地。本地与云端之间只有脱敏文本交互。

  • FreeSWITCH(本地)
    RTP
    本地音频流
  • 本地音频流
    脱敏文本(仅 ASR 结果)
    AI 云对话引擎
  • AI 云对话引擎
    回复文本(不含敏感信息)
    本地 TTS 播放
  • 通话录音
    永不离开客户内网
    本地存储
  • 客户号码
    永不离开客户内网
    本地数据库

技术问题想深入聊?

FreeSWITCH 调优、流式 ASR/TTS、Go 服务化部署、License 设计——欢迎来一次技术对谈。

预约技术沟通