搜狗发布同传3.0版本,加入了视觉和思维能力,搜狗多模态同传系统针对PPT内容的识别准确率提升21.7%,翻译正确率提升40.3%。
搜狗发布同传3.0版本,以“多模态”和“自主学习”为核心,加入了视觉和思维能力。
搜狗AI同传加入了“语境引擎”,使得同传在“能听”的基础上,又解锁了“会看”和“能理解会推理”两项技能,还可以通过“观看”自主学习演讲者的报告内容做到“理解”和“思考”。
“会看”是指基于搜狗OCR(光学字符识别)技术,同传可以实时“观看”演讲者的PPT内容,将PPT的图像内容转化为语言文字。
“能理解会推理”则是指搜狗语境引擎的应用,基于搜狗知识图谱和百科的知识推理能力,将通过OCR技术获取的演讲内容自动生成核心知识,并通过知识图谱-搜狗知立方实时推理拓展,获取充分的背景知识,同时基于百科的中英术语库得到中英双语对照,实时优化同传识别和翻译的效果。
在“听”“看”“思考”三位一体的作用下,搜狗多模态同传系统针对PPT内容的识别准确率提升21.7%,翻译正确率提升40.3%。
随着人们生活水平的提高及对家居环境要求的提升,智能家居产品正逐渐从奢侈品转变为日常生活中的...
工业和信息化部、交通运输部、住房和城乡建设部、公安部、自然资源部联合发布了智能网联汽车“车...
AI大模型有哪些?据了解,我国已先后发布4批获得AI大模型及产品备案审批的企业及其模型清单...
陈宗年,中国电子科技集团有限公司中电海康集团有限公司董事长、党委书记。在他的带领下, 海康...