自动语音识别技术是一种将人的语音转换为文本的技术,由于语音信号的多样性和复杂性,目前语音识别系统只能在一定的限制条件下获得满意的性能(只能应用于某些特定的场合)。
自动语音识别定义
自动语音识别技术的目标是让计算机能够「听写」出不同人所说出的连续语音,也就是俗称的「语音听写机」,是实现「声音」到「文字」转换的技术。
性能影响因素
语音识别系统的性能大致取决于以下 4 类因素:
识别词汇表的大小和语音的复杂性;
语音信号的质量;
单个说话人还是多说话人;
硬件。
自动语音识别分类
自动语音识别通常有以下几种分类方法:
按系统的用户情况分:特定人和非特定人识别系统;
按系统词汇量分:小词汇量、中词汇量和大词汇量系统;
按语音的输入方式分:孤立词、连接词、连续语音系统等;
按输入语音的发音方式分:朗读式、口语(自然发音)式;
按输入语音的方言背景情况分:普通话、方言背景普通话、方言语音识别系统;
按输入语音的情感状态分;中性语音、情感语音识别系统。
自动语音识别定义
自动语音识别技术的目标是让计算机能够「听写」出不同人所说出的连续语音,也就是俗称的「语音听写机」,是实现「声音」到「文字」转换的技术。
性能影响因素
语音识别系统的性能大致取决于以下 4 类因素:
识别词汇表的大小和语音的复杂性;
语音信号的质量;
单个说话人还是多说话人;
硬件。
自动语音识别分类
自动语音识别通常有以下几种分类方法:
按系统的用户情况分:特定人和非特定人识别系统;
按系统词汇量分:小词汇量、中词汇量和大词汇量系统;
按语音的输入方式分:孤立词、连接词、连续语音系统等;
按输入语音的发音方式分:朗读式、口语(自然发音)式;
按输入语音的方言背景情况分:普通话、方言背景普通话、方言语音识别系统;
按输入语音的情感状态分;中性语音、情感语音识别系统。
