巴比特 | 元宇宙每日必读
数字人——GPT4下的杀手级应用
作者:宋嘉吉 金郁欣
摘要
21年时,我们在《元宇宙(七):虚拟人的“灵魂”是什么?》中讨论了数字人将是一个重要的交互载体,应用场景广泛,而AI驱动的数字人将使其真正拥有“灵魂”。短短两年,AIGC发展超出了我们的想象。伴随着AI生成算法和包括GPT4以内的多模态的进步,数字人的灵魂将被点燃。
AIGC,数字人的点睛之笔。AIGC解决了数字人“只会念稿、不能交互”的尴尬,生成算法提高了内容创作的效率和便捷性,降低了成本和门槛,同时还丰富了内容创作的多样性和个性化,满足了用户的不同需求和喜好。自然语言处理大模型有助于提升数字人交互体验,真正让数字人有了灵魂。而ChatGPT所展现出来的高灵活度让人们对AI有了新的认知,它比普通的AI机器人更加像自然人,对信息、知识的挖掘和梳理更充分,对语句的处理更加贴近人类的日常交流表达习惯。
2D仿真数字人爆发在即。3D建模数字人精美度高,但过高的成本和制作周期导致其在商业化应用上存在一定难度,通常被用作品牌大使等场景。但对于市场空间更大的直播带货、教育、客服等场景来说,难以普及。尤其在AIGC发展迅速的现在,2D仿真数字人的制作门槛、周期和成本远远低于3D建模数字人。并且,在市场空间较大的直播带货、娱乐主播、客服和游戏NPC场景下,2D数字人已经足够满足当下的需求,爆发在即。
GPT4+数字人,构筑元宇宙中的“阿凡达”。数字人未来的用途将远不限于主播、客服等,随着算力的提升以及GPT4的模型升级,数字人将成为个人分身“Avatar”,输出文字、图像、音视频,甚至细微到情绪表达。在未来构建数字内容的过程中,将有更多的场合可以用GPU+电耗替代人工,真正打造元宇宙数字世界,使数字人集社交、创作、分享于一身,有望成为GPT4之后、承载多模态的杀手级应用。
投资策略:涉及的赛道可以分为应用、IP和基础设施两大类,其中基础设施可以细分为自然语言处理模型、数据集、AIGC生成算法和算力。数字人应用、IP:蓝色光标、汤姆猫、中科金财、凡拓数创、昆仑万维;NLP和AIGC算法:微软、谷歌、百度、科大讯飞、拓尔思;算力层包括:天孚通信、太辰光、中兴通讯、锐捷网络、紫光股份、新易盛、中际旭创、三大运营商等。
风险提示:伦理风险:AI驱动的人工智能交互过程中,可能出现伦理风险。技术发展不及预期:AIGC 的技术发展不及预期。以及底层硬件技术,如:超级计算机、算力等。政策法律监管风险:目前数字人和AIGC都处于发展初期,在知识版权等问题上还有许多尚不明确的地方。随着相关法律的逐步完善,或初现法律监管的问题。
1. 虚拟数字人产业发生了什么边际变化?
2021年,我们写了一篇名为《元宇宙(七):虚拟人的“灵魂”是什么?》的文章,讨论到了数字人将是一个重要的交互载体,应用场景广泛,而AI驱动的数字人将使其真正拥有“灵魂”。短短两年过去了,数字人产业发生了许多变化:
1.1 技术进步推动数字人形象和交互能力提升
随着算力提升,新概念的数字人正在打破“皮套人”的固定认知。从外观看,通过超精细渲染,数字人高分辨率的皮肤微结构极大限度地提升了数字人在中、近景出镜的真实程度,拟人表现力显著提高,基本突破“恐怖谷效应”的形格势禁。纵向对比来看,以专业团队创作的服务型数字人为例,2021年的百度AI手语主播和2022年凌迪Style3D的项目“Sarah”相比,拥有超精细皮肤渲染的Sarah在观感和表情细节(甚至包括皱纹)更加接近真人。
从交互看,AIGC强力助攻,数字人对话更加自然,IP型数字人有望摆脱人工内容策划、配音和动补。初代虚拟网红Lil Miquela以真人为模型,将面部进行动补、动画处理,剪辑后发布在YouTube。但作为虚拟网红,其策划团队刻意将出镜内容表现为贴近当下时事,没有考虑人造IP对真实尺度的把控,直接导致Lil失去人气。观众并非需要一个100%贴近现实的虚拟网红,而在AIGC加持下,运营者可以很好地平衡虚拟网红在产出内容时在真实与虚拟之间的界限。