术语

AEC: AEC (Acoustic Echo Cancellation)，声学回声消除，或回声消除，是指消除输入信号中的回声信号。回声信号是指麦克风采集到的设备自身扬声器播放的音频。
AFE: AFE (Audio Front End)，音频前端，或信号处理，是指用于原始音频信号预处理的一些模块的组合。通常在进行语音交互前执行以增强信号质量，包含多种语音增强算法。
AGC: AGC (Automatic Gain Control)，自动增益控制，用于动态调节信号的增益，自动调整信号幅值，以保持最佳信号强度。
ASR: ASR (Automatic Speech Recognition)，语音识别，是指把音频中的语音识别为文本。它可用于搭建语音用户界面，实现人类与人工智能设备的语音交互。
BF: BF (BeamForming)，波束形成，是指一种为麦克风阵列设计的空间滤波器，用于增强来自特定方向的信号同时衰减其他方向的信号。
KWS: KWS (Keyword Spotting)，关键词检测，或唤醒词检测、语音唤醒，是指从音频中识别特定的唤醒词。通常是语音交互的第一步，设备检测到唤醒词后，会进入等待语音指令状态。
NN: NN (Neural Network)，神经网络，是一种用于人工智能各类任务的机器学习模型。神经网络依靠训练数据学习并提升准确性。
NS: NS (Noise Suppression)，噪声抑制，或降噪，是指抑制信号中的环境噪声以增强语音信号，尤其是稳态噪声。
RES: RES (Residual Echo Suppression)，残余回声抑制，是指抑制 AEC 处理后的残余回声信号。是 AEC 的后置滤波器。
SSL: SSL (Sound Source Localization)，声源定位，是指利用麦克风阵列估计声源的空间方位。
TTS: TTS (Text-To-Speech)，语音合成，是一种将文本转换为语音的技术。它可用于各种需要将文本转换为人声的语音应用中。
VAD: VAD (Voice Activity Detection)，语音活性检测，或语音端点检测，是指从音频中检测有无语音信号。它被广泛用于语音增强、语音识别等系统中，也可用于去除音频会话中的非语音片段以减少计算、带宽等。

所有产品

通过功能选择芯片

HiFi DSP 系列 ›

Cortex-A Linux 系列 ›

显示系列 ›

Audio 系列 ›

Wi-Fi 6 + BLE 系列 ›

Wi-Fi 2.4G/5G + BLE 系列 ›

Wi-Fi + 经典蓝牙系列 ›

Wi-Fi R-MESH 系列 ›

通过应用选择芯片

IoT 控制 ›

应用指南

SDK

高级功能

Wi-Fi 高级功能 ›

语音识别 ›

工具

术语

用户登录