|
|
|
|
# 声纹识别启用指南
|
|
|
|
|
|
|
|
|
|
本教程包含2个部分
|
|
|
|
|
- 1、如何部署声纹识别这个服务
|
|
|
|
|
- 2、全模块部署时,怎么配置声纹识别接口
|
|
|
|
|
|
|
|
|
|
# 1、如何部署声纹识别这个服务
|
|
|
|
|
|
|
|
|
|
## 第一步,下载声纹识别项目源码
|
|
|
|
|
|
|
|
|
|
浏览器打开[声纹识别项目地址](https://github.com/xinnan-tech/voiceprint-api)
|
|
|
|
|
|
|
|
|
|
打开完,找到页面中一个绿色的按钮,写着`Code`的按钮,点开它,然后你就看到`Download ZIP`的按钮。
|
|
|
|
|
|
|
|
|
|
点击它,下载本项目源码压缩包。下载到你电脑后,解压它,此时它的名字可能叫`voiceprint-api-main`
|
|
|
|
|
你需要把它重命名成`voiceprint-api`。
|
|
|
|
|
|
|
|
|
|
## 第二步,启动程序
|
|
|
|
|
这个项目是一个很简单的项目,建议使用docker运行。不过如果你不想使用docker运行,你可以参考[这个页面](https://github.com/xinnan-tech/voiceprint-api/blob/main/README.md)使用源码运行。以下是docker运行的方法
|
|
|
|
|
|
|
|
|
|
```
|
|
|
|
|
# 进入本项目源码根目录
|
|
|
|
|
cd voiceprint-api
|
|
|
|
|
|
|
|
|
|
# 清除缓存
|
|
|
|
|
docker compose -f docker-compose.yml down
|
|
|
|
|
docker stop voiceprint-api
|
|
|
|
|
docker rm voiceprint-api
|
|
|
|
|
docker rmi ghcr.nju.edu.cn/xinnan-tech/voiceprint-api:latest
|
|
|
|
|
|
|
|
|
|
# 启动docker容器
|
|
|
|
|
docker compose -f docker-compose.yml up -d
|
|
|
|
|
# 查看日志
|
|
|
|
|
docker logs -f voiceprint-api
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
此时,日志里会输出类似以下的日志
|
|
|
|
|
```
|
|
|
|
|
250711 INFO-🚀 开始: 生产环境服务启动(Uvicorn),监听地址: 0.0.0.0:8005
|
|
|
|
|
250711 INFO-============================================================
|
|
|
|
|
250711 INFO-声纹接口地址: http://127.0.0.1:8005/voiceprint/health?key=abcd
|
|
|
|
|
250711 INFO-============================================================
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
请你把声纹接口地址复制出来:
|
|
|
|
|
|
|
|
|
|
由于你是docker部署,切不可直接使用上面的地址!
|
|
|
|
|
|
|
|
|
|
由于你是docker部署,切不可直接使用上面的地址!
|
|
|
|
|
|
|
|
|
|
由于你是docker部署,切不可直接使用上面的地址!
|
|
|
|
|
|
|
|
|
|
你先把地址复制出来,放在一个草稿里,你要知道你的电脑的局域网ip是什么,例如我的电脑局域网ip是`192.168.1.25`,那么
|
|
|
|
|
原来我的接口地址
|
|
|
|
|
```
|
|
|
|
|
http://127.0.0.1:8005/voiceprint/health?key=abcd
|
|
|
|
|
|
|
|
|
|
```
|
|
|
|
|
就要改成
|
|
|
|
|
```
|
|
|
|
|
http://192.168.1.25:8005/voiceprint/health?key=abcd
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
改好后,请使用浏览器直接访问`声纹接口地址`。当浏览器出现类似这样的代码,说明是成功了。
|
|
|
|
|
```
|
|
|
|
|
{"total_voiceprints":0,"status":"healthy"}
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
请你保留好修改后的`声纹接口地址`,下一步要用到。
|
|
|
|
|
|
|
|
|
|
# 2、全模块部署时,怎么配置声纹识别
|
|
|
|
|
|
|
|
|
|
## 第一步 配置接口
|
|
|
|
|
如果你是全模块部署,使用管理员账号,登录智控台,点击顶部`参数字典`,选择`参数管理`功能。
|
|
|
|
|
|
|
|
|
|
然后搜索参数`server.voice_print`,此时,它的值应该是`null`值。
|
|
|
|
|
点击修改按钮,把上一步得来的`声纹接口地址`粘贴到`参数值`里。然后保存。
|
|
|
|
|
|
|
|
|
|
如果能保存成功,说明一切顺利,你可以去智能体查看效果了。如果不成功,说明智控台无法访问声纹识别,很大概率是网络防火墙,或者没有填写正确的局域网ip。
|
|
|
|
|
|
|
|
|
|
## 第二步 设置智能体记忆模式
|
|
|
|
|
|
|
|
|
|
进入你的智能体的角色配置里,将记忆设置成`本地短期记忆`,一定要开启`上报文字+语音`。
|
|
|
|
|
|
|
|
|
|
## 第三步 和你的智能体聊天
|
|
|
|
|
|
|
|
|
|
将你的设备通电,然后和他用正常的语速和音调聊天。
|
|
|
|
|
|
|
|
|
|
## 第四步 设置声纹
|
|
|
|
|
|
|
|
|
|
在智控台,`智能体管理`页面,在智能体的面板里,有一个`声纹识别`按钮,点击它。在底部有一个`新增按钮`。就可以对某个人说的话进行声纹注册。
|
|
|
|
|
在弹出的框里,`描述`这个属性建议填写上,可以是这个人的职业、性格、爱好。方便智能体对说话人进行分析和了解。
|
|
|
|
|
|
|
|
|
|
## 第三步 和你的智能体聊天
|
|
|
|
|
|
|
|
|
|
将你的设备通电,问它,你知道我是谁吗?如果他能回答得出,说明声纹识别功能正常。
|