加拿大进出口外贸德诺迈斯为您讲述:声控智能家居必过5关



加拿大外贸

随着国内外巨头们对语音交互领域投入的增加,语音核心技术正逐步成熟,曾经的技术瓶颈亦在慢慢被突破。这其中语音识别技术是语音交互的基础与核心,「语音识别」技术相当于给计算机系统安装上「耳朵」,使其具备「能听」的功能。该技术经过语音信号处理、语音特征处理、模型训练及解码引擎等复杂步骤,使机器最终能够将语音中的内容、说话人、语种等信息识别出来。

  了解了语音识别的基础内容和系统框架之后我们来看看,语音识别技术要在智能家居生活中真正实用,必须要过哪 5 关?

  一、距离:远场识别技术打破距离瓶颈

  近场识别技术目前已经比较成熟,现在手机上使用的语音输入功能就属于近场识别技术,用户必须在离手机比较近的距离内说话,但在智能家居环境中,用户和智能终端之间的距离被大大增加了,用户能随意用语音控制智能家居的一个必要条件就是在无论你在客厅哪个角落发出指令,设备都能准确的识别,语音识别技术必须突破距离的障碍。

  目前室内的语音交互受到背景噪音、其他人声干扰、回声、混响等多重复杂因素影响,导致识别率低甚至无法使用,只能在相对安静、近距离的环境下使用。而远场识别技术将能够很好的解决这些问题。

  目前的远场识别技术已经能够支持超过 5 米的语音识别,突破了语音交互距离瓶颈,大幅度改进了语音交互的自由度。该技术利用麦克风阵列的空域滤波特性--在目标说话人方向形成拾音波束(BeamForming),抑制波束之外的噪声,结合独特的去混响算法,最大程度的吸收反射声,从而达到去除混响的目的,用户在客厅的任意角落通过语音操控智能家电已成为现实。

  二、效率:又快又准

  近年来,随着深度学习理论的爆发式发展及其在语音识别领域获得的显著效果,同时 Kaldi等开源语音识别工具也在工业界和学术界逐渐普及,语音识别的门槛持续降低,许多公司都具备了语音识别的能力及相关产品,但其实很多使用过 Siri的国内用户都会有这样的感觉: Siri的反应太慢,说出一句话往往要等待很久才能显示结果,另外,准确率也不高,离好用还有很远的距离。

  要持续优化准确率和响应速度的问题,必须要在核心技术和产品特性上做出创新,目前国内领先的解决方案是在把深度神经网络技术引入语音识别的基础上,基于深度神经网络的语音增强算法对输入语音进行「识别关键信息无损」的降噪,通过海量训练语料基础上的高精度声学模型和语言模型训练,并结合极致的解码引擎工程技术,实现了在很小延迟的情况下,做到将去除原始语音的噪声干扰和识别几乎同时,大大提高了语音输入的响应速度和用户体验,最终实现在大词汇连续语音识别率上可以达到 95%以上,命令词识别率达到 99%以上,解码引擎可以在用户说完话 40 毫秒之内给出结果,真正实现「秒懂」。

  三、个性化:越来越懂你

  每个人在说话时,口音、语速、口头禅都不一样,那么家里的智能设备只会识别一些基本词句显然是远远不够的,它们必须要更懂你。比如,懂你的口音、方言、口头禅以及时不时蹦出的专业词汇等。

  让智能设备适应每个人的使用习惯可能吗?答案是肯定的。这里要用的到就是语音识别的另外一项关键技术——个性化识别技术。个性化识别指的是语音识别系统具备自动学习并适应用户使用习惯的能力,你用的越多,它越懂你。一般来说,个性化识别包括发音和语言两方面。其中发音个性化主要是指系统对用户语速、口音等发音习惯的学习,而语言个性化主要是指系统可以对用户的特定词汇(例如人名、地名、口头禅、专业词汇等)具备更好的辨识性。

  目前业内成熟的个性化识别技术已能针对每个人的兴趣点、知识背景等来进行个性化语言模型建模,从而准确识别出个性化的词汇内容。以后你用的越多,语音识别系统就会越懂你。

  四、方言:普通话标不标 zun 也照样能用

  众所周知,中国的语音及语言博大精深,虽然国家在推广标准普通话方面不遗余力,但是中国真正掌握标准普通话的人群比例还是比较低的,而中国的口音现象则是纷繁复杂,甚至会出现同城市中都有不同口音的情况。因此,当这些带有或轻或重口音的人群在使用语音输入时,如果按通常的方法使用标准普通话数据进行模型的训练,就会产生很严重的适配问题,从而影响语音输入时的识别效果。

  「方言」现在也不再是语音识别的障碍,得益于各类方言丰富的音频数据、特殊词汇、发音现象等专业资源以及充分利用深度神经网络的自学习特色,目前,讯飞输入法已经陆续支持四川话、河南话、东北话、天津话等15 种方言识别,这些方言识别能力同样适用于智能家居环境中。以后,无论你使用普通话还是方言,无论你说话语速快还是慢,普通话标不标  zun,在家里都能自由地使用语音控制智能设备。

  五、语音唤醒:真正解放双手

  由于功耗等方面的限制,智能设备很难 24 小时都保持在激活状态。因此,要想在家里自由地控制智能家居设备,我们还需要能即时「唤醒」功能,也就是给智能设备加入「语音唤醒」技术。

  语音唤醒,是指通过含有特定唤醒词的语音输入来「触发」语音识别系统以实现后续的语音交互。通过该技术,任何人在任何环境、任何时间,无论是近场

  (0.5 米以内)还是远场(2~5 米),面向设备直接说出预设的唤醒词,就能激活产品的识别引擎,从而真正实现全程无触控的语音交互。

  除了说单个唤醒词实现唤醒外,更自然便捷、在技术上更具有挑战性的交互方式是在连续语流中带上唤醒词,以实现唤醒产品并同时实现操控的效果,比如直接在语音助手中说出「打电话给张三」就可以唤醒设备并自动完成人名识别与拨打电话。

  随着语音识别技术在距离、效率、个性化、方言、唤醒等多方面一一突破实用瓶颈,随心所欲「声」控智能家居的时代一触即发,那么这一变革多久会来?也许在明年,也许就在明天。

  德诺迈斯400-600-5336专注于为客户提供完整自助的软硬件产品、云平台服务及智慧生活方式整体解决方案。品牌定位于智能家居(智慧生活)系统集成商及平台提供商,为制造商提供智慧生活方式整体解决方案,也为用户提供智慧生活方式体验和服务。

  在这个“大众创业,万众创新”的时代,你和周围的朋友是不是也在蠢蠢欲动,正在奔向致富的道路上呢?机遇不断地涌现,做好周全准备的同时,一定要综合考虑行业前景,把握住未来最具潜力的行业方向。

  2016年,德诺迈斯扬帆远航的行进道路上,更需要全国志同道合的小伙伴的加盟与代理,共同创造智能家居美好明天。
加拿大电商我的客户需要从非洲免关税国家进口一些商品,所谓的免关税是不是也不用交增值税。 如果要交增值税,增值税的税率是多少? 菜鸟向各位前辈请教了。 评论 关税与增值税是俩个税种 加拿大电商Hallo, bitte schicken Sie uns mehr info uber die QT8-15- Machine MfG Alfredo 评论 晕死 是德语 你去德语区问问吧 评论 要你关于QT8-15- 这个型号机器的信息 评论 跟你要关于QT8-15- 这个型号机器的资料信息
  ·中文新闻 2024 年美国大选结果:特朗普获胜可能会让澳大利亚经济损失
·中文新闻 2024 年美国大选结果:特朗普是新的罗纳德·里根 - 没有美德

加拿大进出口外贸

加拿大电商关于免抵退问题

加拿大贸易当月销项-进项=-6万元,当月FOB总价*退税税率为10万元,那么当月可退税是6万元,免抵4万元 请问:这免抵的4万是不是要留到下期再进行抵扣????? 评论 这个问题问财务了。 评论 ...

加拿大进出口外贸

加拿大电商EN10204-3.1 材质报告

加拿大贸易路过的前辈们有没有知道EN10204-3.1证书的? 我的客户现在要求材质报告上要注明EN10204-3.1字样,但是原厂的材质报告几乎没有这个字样。国内的大厂,基本上通过了各种认证,是不是他们 ...

加拿大进出口外贸

加拿大电商外贸小白趟过的雷

加拿大贸易本人4个月换了3份工作,现在这份工作月底又要换工作了。我就说说我都遇到过哪些坑和哪些坑人的公司。 算算,去年毕业到现在有一年了。大学毕业就跑市场,自己创业,结果被现实 ...

加拿大进出口外贸

加拿大电商订舱订不到怎么办

加拿大贸易刚接触公司的地板产品,前辈却告诉我,目前最大的问题是除非是大公司订购,否则高昂的运费白搭。今天带我的前辈给我算了一下运费,都一万八了都。而且说订舱也订不到。那我来 ...