AI合成主播亮相世界互联网大会 “搜狗分身”技术引关注[组图]

发布时间: 2018-11-08 09:46:31 | 来源: 中国网 | 作者: | 责任编辑: 伦晓璇

全球第一个全仿真智能合成主持人——“AI合成主播”现场演示。中国网记者 董宁 摄

中国网讯 (记者 董宁)11月7日,第五届世界互联网大会在浙江乌镇拉开帷幕,搜狗与新华社合作开发、全球第一个全仿真智能合成主持人——“AI合成主播”正式亮相。而随着“AI合成主播”的发布,搜狗未来人工智能的核心技术“搜狗分身”也终于浮出水面。

在发布会现场的体验中,观众只要输入一句既有的新闻文本,屏幕上就会出现一位合成的新华社新闻主播,他不仅会用和真人一样的声音进行播报,连唇形、面部表情也能完全吻合。

据了解,在合成主播的开发过程中,在“搜狗分身”技术的支持下,通过人脸关键点检测、人脸特征提取、人脸重构、唇语识别、情感迁移等多项前沿技术,并结合语音、图像等多模态信息进行联合建模训练后,“AI合成主播”正式诞生。

随着“AI合成主播”系统的成功上线,支撑其正常运转的核心“搜狗分身”也引起了大家的广泛关注。据搜狗公司智能语音事业部总经理王砚峰介绍,“搜狗分身”技术是搜狗人工智能的核心技术之一,诞生于搜狗“自然交互+知识计算”这一人工智能理念之下。该技术能够利用搜狗的AI能力,从图像表情,声音语言习惯,逻辑思维等层面对AI进行拟人化训练,然后克隆制造人类的AI分身,进而帮助人类提高信息表达和传递的效率。

以“AI合成主播”为例,该产品使用主播的真人形象,配合“搜狗分身”的语音、合成等技术模拟真人播报画面,使大众享受到逼真度极高的图像效果。这种播报形式,突破了以往语音图像合成领域中,只能单纯创造合成形象,并配合语音输出唇部效果的约束,极大地提高了观众信息获取的真实度。同时,利用“搜狗分身”技术,“AI合成主播”还能实时高效地输出音视频合成效果。在“搜狗分身”技术的支持下,使用者通过文字键入、语音输入、机器翻译等多种方式输入文本后,将获得实时的播报视频。这种操作方式将极大减少新闻媒体在后期制作的各项成本,让新闻视频的制作效率有了极大的提高。

“搜狗分身”技术实现了在不同场景下更为自然的人机交互,除了在媒体融合领域的应用外,未来还将在娱乐、医疗健康、教育、法律等多个领域提供个性化的内容。

1   2   >  


声明:中国网图片库(www.cnmediae.com)供本网专稿,任何网站、报刊、电视台未经中国网图片库许可,不得部分或全部转载,违者必究! 咨询电话010-88820273。