百度大脑在北京举行语音能力引擎论坛。百度语音首席架构师贾磊正式提出基于复数CNN网络的语音增强和语音识别一体化端到端建模技术,该方法抛弃了数字信号处理学科和语音识别学科的各种先验假设,消除学科间壁垒,直接端到端进行一体化建模。相较于传统基于数字信号处理的麦克阵列算法,错误率降低超过30%。
据悉,这项技术无需任何数字信号处理和语音识别学科的先验假设,复数CNN网络内存占用少于200K,可以内置到百度鸿鹄芯片内部。利用进场数据和纯粹依靠仿真数据,就可以获得足量的远场训练数据,整个过程是icing原始多麦克信号到识别文字的一个端到端训练,整个优化过程只有字错误率两集一个优化准则。
百度从2012年起就开始把深度学习用于中文语音搜索,成为全世界最早把深度学习技术落地工业化产品的企业之一。百度大脑目前已开放了云、端、芯包含语音识别、语音合成等全栈语音引擎能力,并广泛应用于金融、政务、文娱等多种行业和场景。
百度AI技术生态部总经理喻友平表示,百度大脑语音能力引擎的应用规模已达到业界第一,同时一直在积极拓展语音能力引擎生态链的建设。
随着人们生活水平的提高及对家居环境要求的提升,智能家居产品正逐渐从奢侈品转变为日常生活中的...
工业和信息化部、交通运输部、住房和城乡建设部、公安部、自然资源部联合发布了智能网联汽车“车...
AI大模型有哪些?据了解,我国已先后发布4批获得AI大模型及产品备案审批的企业及其模型清单...
陈宗年,中国电子科技集团有限公司中电海康集团有限公司董事长、党委书记。在他的带领下, 海康...
刘庆峰,科大讯飞董事长。他是中国智能语音与人工智能产业化的先行者,带领科大讯飞扭转了中文语...
蔡崇信,阿里巴巴集团董事会主席、菜鸟集团董事长。在他的领导下,阿里巴巴从一个小的电子商务公...