常用的语音助手用了哪些技术

常用的语音助手用了哪些技术

我们现在对人工智能技术的使用很多，尤其是在语音助手上，现在不仅是技术很重要，语音助手在生活中的使用占比也越来越大，那你知道语音助手还使用了哪些技术吗？

1、语音合成技术（TTS）

TTS（text to speech），文本转换技术，即是将计算机产生的、或是外部输入的文字信息转变为口语输出的技术。

如果将ASR类比为“耳朵”，听见人类的声音，那么TTS就是“嘴巴”，可以通过语音表达来回答人类的问题。

2、语音去噪

语音去噪又被称为语音增强，主要是针对于有人声的音频进行处理，目的是去除那些背景噪声，增强音频中人声的可懂性。其应用范围很广，可以用于人与人之间的语音通讯，也可以用于很多语音任务的预处理。

3、TTS的传统实现方法分为拼接法和参数法

前者直接通过已录制好的语音进行拼接，便能合成质量优质的语音，但不利的是，拼接法需要很丰富的语音数据库支持。

而后者则是在低资源的语音数据库中，通过统计模型产生语言参数，在转化成波形进行语音合成，成本较低，但语音质量相对而言不够优质。

之所以语音助手可以听到、听懂且执行人类的指令，便是因为前端降噪技术抑制了背景噪音，让语音助手通过语音识别技术“听得更清晰”。

再通过语义理解技术“听得更明白”，协助驾车人执行相应操作，最后通过语音合成技术“发出声音回应”，完成人机交互的体验。

这些你都了解了吗？返回搜狐，查看更多

责任编辑：