AIVoice

支持的芯片

芯片

RTL8721Dx

RTL8720E

RTL8713E

RTL8726E

RTL8730E

AFE 单麦 (识别模式)

Y

N

Y

Y

Y

AFE 单麦 (通话模式)

N

N

Y

Y

Y

AFE 双麦 (识别模式)

N

N

Y

Y

Y

KWS 固定唤醒词

Y

N

Y

Y

Y

KWS 自定义唤醒词

N

N

Y

Y

Y

VAD

Y

N

Y

Y

Y

ASR

N

N

Y

Y

Y

概述

AIVoice 是一套由 Realtek 自主研发的离线 AI 解决方案,包含声学信号处理、唤醒、端点检测、识别等本地算法模块,可用于在 Realtek SoC 上搭建语音相关应用。

AIVoice 可以作为纯离线方案单独使用,也可以结合语音识别、大语言模型等云端系统实现一个离、在线混合的语音交互方案。

应用

智能语音系统可以提升人机交互的效率和便捷性,广泛应用于多个领域,包括:

  • 智能家居:如小爱音箱、天猫精灵等智能音箱设备,或是自带语音控制功能的家电产品。用户可以通过语音控制家中的灯光、温度和其他智能设备,提升居住的便利性和舒适度。

  • 智能玩具:搭载智能语音系统的互动玩具(如 AI 故事机、语音教育机器人、陪伴机器人)正逐渐普及。这类玩具可通过语音与用户自然对话,回答十万个为什么、讲述定制化故事或进行双语教学。

  • 车载系统:许多现代汽车配备了语音识别系统,允许驾驶员通过语音指令进行导航、拨打电话和播放音乐,确保驾驶安全并提升驾驶体验。

  • 穿戴产品:如智能手表、智能耳机和健康监测设备等很多穿戴产品都配备了语音助手。用户可以通过语音指令查看和发送消息、控制音乐播放器、接听电话等,提升了用户体验和交互方式。

  • 会议场景:语音识别技术可以实时转录会议内容,帮助与会者更好地记录和回顾讨论要点。

文件路径

芯片

操作系统

aivoice_lib_dir

aivoice_example_dir

RTL8730E

Linux

{LINUXSDK}/apps/aivoice

{LINUXSDK}/apps/aivoice/example

RTL8721Dx/RTL8730E

FreeRTOS

{RTOSSDK}/component/aivoice

{RTOSSDK}/component/example/aivoice

RTL8713E/RTL8726E

FreeRTOS

{DSPSDK}/lib/aivoice

{DSPSDK}/example/aivoice

模块

模块

功能

AFE(信号处理)

增强语音信号、降噪

KWS(唤醒词检测)

检测唤醒词以激活语音助手,如 小爱同学天猫精灵

VAD(语音端点检测)

检测音频中的语音段或噪声段

ASR(语音识别)

检测离线语音控制命令

流程

为了方便用户开发,部分算法流程已在 AIVoice 中实现:

  • Full Flow:一个完整的离线流程,包括 AFE、KWS 和 ASR。AFE 和 KWS 始终开启,当 KWS 检测到唤醒词时,ASR 开启并支持持续识别,超时后 ASR 退出。

  • AFE+KWS:离线流程包括 AFE 和 KWS,始终开启。

  • AFE+KWS+VAD:离线流程包括 AFE、KWS 和 VAD。AFE 和 KWS 始终开启,当 KWS 检测到唤醒词时,VAD 开启并支持持续检测语音端点,超时后 VAD 退出。