|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区
您需要 登录 才可以下载或查看,没有账号?立即注册
×
语音技术的发明最早可以追溯到半个世纪之前,1952年,贝尔实验室制作了一台高6英尺的自动数字识别机“Audrey”,能够识别数字0-9的发音,准确率达到90%以上。
不过这一系统主要基于简单的模板匹配方法识别个体说出的孤立数字,也导致作为模板的熟人说出的语音识别会更精准,而陌生人识别率会低一些。在此之后,连续语音识别系统开始出现,语音合成的参数合成法能够生成比较自然的语音。
到二十世纪八十年代中期,IBM创造了一台可以用语音控制的打字机“Tangora”,基于隐形马尔科夫链模型(HMM),在信号处理技术中加入了统计信息,可以让机器在听到第一个音节时,便能够预测单词。到了1984年,这一系统在5000个词汇量级上达到了95%的识别率。
时间来到2011年,微软研究院将DNN技术应用在大词汇量连续语音识别任务上,极大地降低了语音识别错误率。
2016年,微软团队已经将语音识别的词错率(WER)降低至了5.9%,这一数据已经相当于专业速录员速记同样一段话的水平。这标志着机器的语音识别准确率第一次达到人类水平,智能语音语言技术开始逐步落地。
到了这一阶段,端到端的语音识别开始被广泛应用,智能语音助手、智能音箱等多款应用智能语音识别的产品相继落地。发展到近期,语音识别的准确率进一步提升,且针对远场的语音识别和唤醒得到进一步发展,全双工语音交互开始出现。语音识别准确率已经达到98%以上,并且能根据实际应用痛点针对性强化。
从2011年第一款手机语音助手Siri伴随着iPhone 4S的亮相,让全球各大厂商纷纷入局,也标志着正式开启智能语音应用元年,到2017年下半年开始通过开放语音生态系统进行产业内合作,语音识别系统也开始向可穿戴、智能家居、车载等领域延伸。
据ReportLinker的预测:到2024年全球智能语音市场规模将达到215亿美元,其中智慧医疗健康、智慧金融以及各类智能终端智能语音技术需求将成为主要的驱动因素。目前国内主要智能语音服务商如百度、科大讯飞、思必驰、乐言科技、声扬科技、竹间智能等。 |
|