在众多智能产品中,智能音箱以千万级的出货量在 ai 市场头部领跑,曾经的 ai 入口之争走向明朗。如果你问用户智能音箱存在哪些问题,绝大部分人会回答:不够智能。为什么不够智能?它总说自己没听清楚,经常是一家三口轮流对着音箱大吼大叫,欢乐的氛围荡然无存。更让用户心有余悸的是,当一家人在聊天时,它还会随便插话,让人惊心肉跳,很多用户不得不断电才能让它闭嘴。
究其技术原因,都是因为音频采集环节不够精准,才造成智能音箱像一个不够成熟的小孩“胡言乱语”,模拟的问题还要模拟专家来解决,我们先把目光对准模拟老大 ti。“我们为了增强音频领域的实力,收购了 burr brown,并一直延续这一品牌在音频上独特的技术,包括 adc、dac、高性能 d 类放大器,数据转换器,以及音频运算放大器。” ti 音频产品市场工程师 abhi muppiri 对与非网记者表示,“新发布的 tlv320adc5140 是业界具备同等性能的体积更小的四通道音频 adc,可以在嘈杂的环境中实现低失真录音,还可以在任何环境中进行远场高保真录音。”
ti 音频产品市场工程师 abhi muppiri
让智能音箱听得清的“秘诀”
用户都在等待智能音箱“长大”的那一天,tlv320adc5140或许可以在音频采集端让它“耳聪目明”。abhi 介绍,“tlv320adc5140 具有内置的 120db 动态范围增强器(dre)。在系统层面,即使在非常靠近音箱输出的情况下,dre 方案仍可在保持低失真录音的同时增强低音量音频信号。dre 还可以改善所有环境中的远场高保真录音。”
dre 其实是一个关键技术,这个技术是 ti 和合作伙伴一起研发的,可以将动态范围从 106 db 提高到 120db。而且 dre 是一个闭环控制,经过信号采样、转换,然后送到 dre,如果 dre 发现信号存在问题,再将信号返回进行调整,然后再输入。经过这样的筛选就能保证所采集的音频准确性大大提高。
tlv320adc5140 最多可支持麦克风输入的四个模拟通道或八个数字通道(或其组合)进行同步采样,从而确保了系统灵活性,另外还提供增益和相位校准等可编程功能,以均衡麦克风阵列失配。其他功能包括可编程增益放大器、高通滤波器、通道混合以及线性相位或超低延迟滤波器。
另外,tlv320adc5140 还具有体积小,系统功耗低的优势,其内置功能可以帮助工程师减轻数字信号处理任务的负担,从而可以在不牺牲系统可靠性的情况下缩小设计体积。在 48khz 时,每个通道的功耗仅为 9.5mw。
远场录音声音再小也能“听清”并采集
dre 技术不仅用于智能音箱,还可以用于录音系统。目前的录音系统如果超过一定的距离,音频就模糊不清,甚至造成内容丢失。尤其是在酒店、机场等环境嘈杂的场所中,原音和噪音很难分辨,tlv320adc5140 的处理方式是将原音和噪音全部录制下来,然后发送给处理器过滤噪声。另外,如果原音和噪音声音都比较小,tlv320adc5140 可以将原音和噪音进行放大,然后再发给处理器进行处理。abhi 强调,“我们现有的方案,动态范围比较高,可以收集到很小的声音信号,能够在 10 米以外进行远场语音采集,对难以捕捉的声音命令的识别能力增强很多。”
麦克风也分为数字和模拟两种,数字麦克风输出的是数字信号,工作时未必用到 adc 的所有功能,模拟麦克风会用到 adc 的全部特性。abhi 解释,这款产品更适合模拟麦克风。但是也要看用户的实际应用,比如摄像头,同时包含数字和模拟部分;在笔记本中,数字麦克风比较多,至于智能音箱会选择数字还是模拟,这取决于用户对音质的要求,自然是模拟麦克风的音质更好。随着用户越来越追求更好的品质,模拟产品更有优势。我们为客户提供更灵活的方案,既支持模拟也支持数字。
其实在智能语音领域,在国内不仅智能语音算法成熟,而且有些设备公司已经开始涉足语音处理芯片,包括出门问问、rokid 等,不仅芯片本身更契合自身的语音设备,而且在成本上更有优势。ti 作为模拟市场的老大,在 2011 年发布过一款 dm3725 处理器用于语音处理市场以后,后来就迟迟没有再次深入发力,是市场竞争太激烈 ti 想走差异化路线?abhi 的回复是,ti 还是倾向于发挥自己所擅长的领域,我们的模拟占比很大,优势在于工艺、制造,我们想集中精力办大事,把 adc 产品做精做好。
tlv320adc 系列产品分为高中低三档,其中 tlv320adc3140 是入门级,没有 dre 特性,检测距离也不是很远,tlv320adc 5140 处于中档,能够改善跨房间的音频采集,并增强对高端智能音箱、条形音箱、无线音箱、高清电视、ip 网络摄像机、电话会议系统和智能家电等应用中的难以捕捉的声音命令的识别;tlv320adc6140 是高端产品,用于专业级录音场景,具有更高的 sdr,动态范围可以达到 130db。这三款产品定价分别在 1k 片 1.99 美元、2.99 美元、4.99 美元,折合成人民币最高可达到 30 多元,对于竞争异常激烈的中国市场,或许用户在价格面前会有所犹豫,但是随着购买数量的增加,ti 表示价格会有所浮动。
虽然 adc 技术不能完全决定智能音箱产品的“聪明”程度,但是在音频采集前端能够让音箱听得更清晰,后期加上处理和算法的精进,智能音箱产品一定会越来越契合用户的需求。
作者:郭云云