AI数字人产品“世优BOTA”发布会|蒋正浩:AIGC重塑技术体系

发布时间:2023-04-24 17:23:03

4月20日,世优(北京)科技有限公司正式发布了新一代AI数字人产品——“世优BOTA”。会上,世优科技技术副总蒋正浩分享了《AIGC重塑技术体系》的主题演讲,结合实践经验,站在世优科技的角度,向大家分享了在AIGC助力下,世优科技的技术体系是如何演进和变化的。

以下是蒋总的演讲内容概要:

AI贯穿全技术体系,加速生产流程

在“AIGC助力下重塑技术体系”的主题分享中,蒋总提到,从去年下半年到今年,以GPT为代表的智能技术产生了日新月异的变化,在创意、传播、个性化服务等方面,充分发挥技术优势,打造新的数字内容生成与交互形态,在深刻影响着各个行业场景的发展方向。

我们也在思考如何将AIGC技术应用在数字人业务中,蒋总表示,以世优科技在3D数字人技术方向比较深厚的积累和AIGC技术的超强能力两项基础,充分应用在今天发布的AI数字人产品”世优BOTA“中,使得AI数字人生成方式、渲染流程、快速部署再到各个场景的应用落地可以更快、更高效的完成,同时可以加速数字资产生产速度,还能渲染出具备交流能力、可控制且具有个性的数字人。

真人驱动数字人

数字人按照当前的制作技术在大概念上可以分为两种:一种是真人驱动的数字人,另一种是AI驱动的数字人。

对于精确的场景,我们通过真人来驱动数字人,主要原理是用单独摄像头来进行动作捕捉,并利用图像处理算法,分析出面部表情、行为体征的变化,将真人的表情呈现在虚拟数字人形象上,同时通过动捕系统,采集真人的身体动作,让数字人全身动起来更加自然。最后将数字人接入世优科技自主研发的“数字人虚拟工厂”实时渲染引擎,实现与用户的交互。

AI驱动数字人

借助AIGC强大技术能力,我们可以看到基于照片、视频,通过Stable Diffusion(AI绘画)、Dreamfusion(AI图像模型,可将文本转换成3D模型)+SAM(AI图像识别)等技术可以生成人体形象、场景、各种数字资产。虽然效果还不精确,但AIGC 正重塑整个数字内容生产,重塑数字人制作技术体系。在AIGC加持下,使得数字人在制造效率、使用场景、多模态交互以及分析决策层面将迎来新的突破窗口。

AI帮助企业渲染出能交流的数字人

虽然“ChatGPT”强大对话与创作能力震惊世人,但是生成式AI缺乏对话背后的实际意图的理解和推理能力,使其回答的问题可能会与期望不符。比如,当你提问世优科技的公司相关信息?如果不提供公司资料,ChatGPT回答一定是不精准的,输出的信息处于不可控状态。在商业应用场景中,无法体现AI的真的价值,所以需要通过提供相关数据来进行训练,并通过控制技术(世优过滤器),控制ChatGPT的回答内容范围,不要越过边界。

通俗点讲,我们可以把ChatGPT理解为一个基础教育,在这之上需要加上家庭教育、大学教育,使它具备更加专业的能力,极大地提高回答的准确程度,精准可控地输出用户想要的内容,避免AI胡说八道。此外,我们希望数字人拥有“独特的灵魂”,充分模拟人与人之间自然真实的交互方式,让用户感受到人格化的交互效果,而不是一个冷冰冰的机器。

灵活的部署方式满足企业多种需求

此外,蒋总还表示:我们的产品可以适应各类场景技术架构,不管在云服务还是在私有化技术上都提供合法安全快速部署的相关能力,在部署过程中,还可以基于业务规模、模式的不同去做裁剪,采用轻量级部署方式,更快速、高效地满足企业的针对性诉求又不会产生高成本。

面向 AIGC 新时代,世优科技投入大量研发精力,围绕AIGC推出了新一代AI数字人产品“世优BOTA”,进一步夯实数字人产品生态体系。灵活的部署方式,可适应各类场景技术架构,能快速帮助企业落地基于业务需求和技术趋势发展相结合的企业解决方案与服务。

Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com)
X