AIVoice
支持的芯片
芯片 |
RTL8721Dx |
RTL8720E |
RTL8713E |
RTL8726E |
RTL8730E |
---|---|---|---|---|---|
AFE 单麦 (识别模式) |
Y |
N |
Y |
Y |
Y |
AFE 单麦 (通话模式) |
N |
N |
Y |
Y |
Y |
AFE 双麦 (识别模式) |
N |
N |
Y |
Y |
Y |
KWS 固定唤醒词 |
Y |
N |
Y |
Y |
Y |
KWS 自定义唤醒词 |
N |
N |
Y |
Y |
Y |
VAD |
Y |
N |
Y |
Y |
Y |
ASR |
N |
N |
Y |
Y |
Y |
概述
AIVoice 是一套由 Realtek 自主研发的离线 AI 解决方案,包含声学信号处理、唤醒、端点检测、识别等本地算法模块,可用于在 Realtek SoC 上搭建语音相关应用。
AIVoice 可以作为纯离线方案单独使用,也可以结合语音识别、大语言模型等云端系统实现一个离、在线混合的语音交互方案。
应用
智能语音系统可以提升人机交互的效率和便捷性,广泛应用于多个领域,包括:
智能家居:如小爱音箱、天猫精灵等智能音箱设备,或是自带语音控制功能的家电产品。用户可以通过语音控制家中的灯光、温度和其他智能设备,提升居住的便利性和舒适度。
智能玩具:搭载智能语音系统的互动玩具(如 AI 故事机、语音教育机器人、陪伴机器人)正逐渐普及。这类玩具可通过语音与用户自然对话,回答十万个为什么、讲述定制化故事或进行双语教学。
车载系统:许多现代汽车配备了语音识别系统,允许驾驶员通过语音指令进行导航、拨打电话和播放音乐,确保驾驶安全并提升驾驶体验。
穿戴产品:如智能手表、智能耳机和健康监测设备等很多穿戴产品都配备了语音助手。用户可以通过语音指令查看和发送消息、控制音乐播放器、接听电话等,提升了用户体验和交互方式。
会议场景:语音识别技术可以实时转录会议内容,帮助与会者更好地记录和回顾讨论要点。
文件路径
芯片 |
操作系统 |
aivoice_lib_dir |
aivoice_example_dir |
---|---|---|---|
RTL8730E |
Linux |
{LINUXSDK}/apps/aivoice |
{LINUXSDK}/apps/aivoice/example |
RTL8721Dx/RTL8730E |
FreeRTOS |
{RTOSSDK}/component/aivoice |
{RTOSSDK}/component/example/aivoice |
RTL8713E/RTL8726E |
FreeRTOS |
{DSPSDK}/lib/aivoice |
{DSPSDK}/example/aivoice |
模块
模块 |
功能 |
---|---|
AFE(信号处理) |
增强语音信号、降噪 |
KWS(唤醒词检测) |
检测唤醒词以激活语音助手,如 |
VAD(语音端点检测) |
检测音频中的语音段或噪声段 |
ASR(语音识别) |
检测离线语音控制命令 |
流程
为了方便用户开发,部分算法流程已在 AIVoice 中实现:
Full Flow:一个完整的离线流程,包括 AFE、KWS 和 ASR。AFE 和 KWS 始终开启,当 KWS 检测到唤醒词时,ASR 开启并支持持续识别,超时后 ASR 退出。
AFE+KWS:离线流程包括 AFE 和 KWS,始终开启。
AFE+KWS+VAD:离线流程包括 AFE、KWS 和 VAD。AFE 和 KWS 始终开启,当 KWS 检测到唤醒词时,VAD 开启并支持持续检测语音端点,超时后 VAD 退出。