常用的语音助手用了哪些技术

常用的语音助手用了哪些技术

我们现在对人工智能技术的使用很多,尤其是在语音助手上,现在不仅是技术很重要,语音助手在生活中的使用占比也越来越大,那你知道语音助手还使用了哪些技术吗?

1、语音合成技术(TTS)

TTS(text to speech),文本转换技术,即是将计算机产生的、或是外部输入的文字信息转变为口语输出的技术。

如果将ASR类比为“耳朵”,听见人类的声音,那么TTS就是“嘴巴”,可以通过语音表达来回答人类的问题。

2、语音去噪

语音去噪又被称为语音增强,主要是针对于有人声的音频进行处理,目的是去除那些背景噪声,增强音频中人声的可懂性。其应用范围很广,可以用于人与人之间的语音通讯,也可以用于很多语音任务的预处理。

3、TTS的传统实现方法分为拼接法和参数法

前者直接通过已录制好的语音进行拼接,便能合成质量优质的语音,但不利的是,拼接法需要很丰富的语音数据库支持。

而后者则是在低资源的语音数据库中,通过统计模型产生语言参数,在转化成波形进行语音合成,成本较低,但语音质量相对而言不够优质。

之所以语音助手可以听到、听懂且执行人类的指令,便是因为前端降噪技术抑制了背景噪音,让语音助手通过语音识别技术“听得更清晰”。

再通过语义理解技术“听得更明白”,协助驾车人执行相应操作,最后通过语音合成技术“发出声音回应”,完成人机交互的体验。

这些你都了解了吗?返回搜狐,查看更多

责任编辑:

发布于:重庆梁平梁平县