当前位置: 开发笔记 > 开发工具 > 正文

虚拟滑块实验室_不认真er的产品说|第三季：虚拟人，从云端到亲自实践——解密三星虚拟人...

作者：死性不改2502857027 | 来源：互联网 | 2023-09-16 11:11

作者在去年12月制作的唐代诗人bot既有“自然交互”的理想，又有“数字孪生”的梦幻，虚拟人，这是一个在科学和科幻的模糊交界处令人心醉的存在

作者在去年12月制作的唐代诗人bot

既有“自然交互”的理想&＃xff0c;又有“数字孪生”的梦幻&＃xff0c;虚拟人&＃xff0c;这是一个在科学和科幻的模糊交界处令人心醉的存在。

从二维的传统画像&＃xff0c;到立体的数字人类&＃xff0c;多种多样的虚拟人实践是不认真er在2019年里进行的一项十分有趣的工作。

作者在去年9月制作的老年人虚拟人bot

虚拟人承载着用户对拟人化的视觉追求&＃xff0c;以及直觉化的交互追求&＃xff0c;如果说前者是“皮相”和“骨相”&＃xff0c;那么后者则是“心相”和“动相”。

虚拟人总体架构设计

(作者在2018年底的研究)

那么&＃xff0c;目前虚拟人在视觉层面和交互层面上&＃xff0c;有哪些不同方案的制作路线呢&＃xff1f;不认真er结合自己的实践探索进行了一番总结和解密。

视觉层面

CG路线与对抗式神经网络路线

CG路线的虚拟人&＃xff0c;来自DEXTER

对抗式生成网络路线&＃xff1a;由作者利用StyleGAN及面部属性编辑器制作

交互层面

标记-驱动路线与帧序列-播放路线

①标记-驱动路线

采用标记-驱动路线的虚拟人NEON

三星虚拟人家族演示

虽然三星并未公开NEON的技术路线&＃xff0c;但不认真er经过仔细比对2019年CES展上虚拟人NEON的演示画面&＃xff0c;和近些年来自三星的论文&＃xff0c;从中找到了一些蛛丝马迹。

现场演示里红色区域

论文当中的红色区域

不认真er用红笔圈出了技术“暗示”&＃xff0c;演示现场和论文里都出现了这种十分相似的用来标记人脸的线条&＃xff0c;那么论文里作者向我们展示了一件什么工作呢&＃xff1f;

——只需一张人脸照片&＃xff0c;就能创造此角色新的动态头部/人脸表情。

论文解读地址&＃xff1a;

https://blog.csdn.net/qq_34914551/article/details/90680883

除了对人脸表情的学习&＃xff0c;更进一步&＃xff0c;三星在CES现场所演示的人脸表情控制&＃xff0c;则离不开一个参数化的编辑器。

主持人手持平板拖动滑块&＃xff0c;来控制虚拟人表情

那么&＃xff0c;这样的编辑器长什么样呢&＃xff1f;

正如上文那位帅哥的眨眼所用到的编辑器&＃xff0c;不认真er认为三星的虚拟人也应用了类似的人脸编辑器&＃xff0c;从而实现了不同人脸部位的实时参数化驱动。

在一张静态人脸图片上提取对应的关键点&＃xff0c;并把这些关键点连接成标记线&＃xff0c;然后最后由编辑器负责将这些标记线进行实时驱动&＃xff0c;最终逆向映射到人脸的整体运动(或者由编辑器直接大量生成表情帧&＃xff0c;实时合成为视频)&＃xff0c;这或许就是三星虚拟人的基本技术原理。

②帧序列-播放路线

即利用语音控制视频帧序列的播放

在unity中实现的苏东坡画像bot&＃xff0c;其交互路线和文章开始的诗人bot类似

以上大概就是虚拟人的”一般制作手册“啦。(部分虚拟人项目和技术由于保密等原因不公开&＃xff0c;敬请谅解)

正如三星虚拟人的设计者、Star labs战略负责人Bob Lian所说&＃xff1a;“我们希望创造一个有自己的表情、行为、情感、甚至感觉和记忆的新生命。“虚拟人的理想几近梦幻&＃xff0c;令人迷醉。

凯文·凯利曾经预测道&＃xff1a;“不久的将来&＃xff0c;现实世界中的每一个地方和事物 —— 每一条街道、每一个灯柱、每一栋建筑物和每一个房间 —— 都会在镜像世界中拥有它的全尺寸“数字孪生兄弟。”

虚拟人&＃xff0c;可以是助理/秘书/伴侣&＃xff0c;也可以是你在虚拟世界里的孪生复制品&＃xff0c;那么&＃xff0c;朋友们&＃xff0c;大家认为自己的虚拟人应该是什么样子&＃xff0c;有哪些功能呢&＃xff1f;

对虚拟人感兴趣的同学&＃xff0c;欢迎私信我聊天&＃xff0c;maybe我们可以尝试建立一个关于下一代虚拟人的研究实践型社群。

我是不认真er&＃xff0c;来我这&＃xff0c;看到新鲜。

鸣谢&＃xff1a;感谢自己在清华大学未来实验室实习期间的mentor、人工智能专家高峰博士&＃xff0c;感谢他给予我探索虚拟人的动力。

推荐阅读

git
中国学者实现 CNN 全程可视化，详尽展示每次卷积、ReLU 和池化过程

中国学者实现 CNN 全程可视化，详尽展示每次卷积、ReLU 和池化过程 ... [详细]

蜡笔小新 2024-11-03 13:52:28
git
能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察

本周科技前沿报道了多项重要进展，包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果，以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是，一款能够感知用户情绪状态的智能机器人即将问世，为未来的人机交互带来了全新的可能性。 ... [详细]

蜡笔小新 2024-11-05 20:45:31
git
独家解析：深度学习泛化理论的破解之道与应用前景

本文深入探讨了深度学习泛化理论的关键问题，通过分析现有研究和实践经验，揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素，并提出了改进模型泛化性能的有效策略。此外，还展望了这些理论在实际应用中的广阔前景，为未来的研究和开发提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-09 19:29:56
visual
利用CIFAR10数据集快速掌握Mixup数据增强技术，显著提高图像分类精度

通过使用CIFAR-10数据集，本文详细介绍了如何快速掌握Mixup数据增强技术，并展示了该方法在图像分类任务中的显著效果。实验结果表明，Mixup能够有效提高模型的泛化能力和分类精度，为图像识别领域的研究提供了有价值的参考。 ... [详细]

蜡笔小新 2024-11-05 14:24:36
visual
深入浅出解读奇异值分解，助你轻松掌握核心概念

深入浅出解读奇异值分解，助你轻松掌握核心概念 ... [详细]

蜡笔小新 2024-11-03 15:12:45
diff
从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展

从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展 ... [详细]

蜡笔小新 2024-11-03 10:42:12
git
语义、实例与全景分割的对比分析（Comparative Analysis of Semantic, Instance, and Panoptic Segmentation）

图像分割技术在人工智能领域中扮演着关键角色，其中语义分割、实例分割和全景分割是三种主要的方法。本文对这三种分割技术进行了详细的对比分析，探讨了它们在不同应用场景中的优缺点和适用范围，为研究人员和从业者提供了有价值的参考。 ... [详细]

蜡笔小新 2024-10-29 18:51:14
ide
2019年斯坦福大学CS224n课程笔记：深度学习在自然语言处理中的应用——Word2Vec与GloVe模型解析

本文详细解析了2019年斯坦福大学CS224n课程中关于深度学习在自然语言处理（NLP）领域的应用，重点探讨了Word2Vec和GloVe两种词嵌入模型的原理与实现方法。通过具体案例分析，深入阐述了这两种模型在提升NLP任务性能方面的优势与应用场景。 ... [详细]

蜡笔小新 2024-10-29 10:37:07
windows
兆芯X86 CPU架构的演进与现状（国产CPU系列）

本文详细介绍了兆芯X86 CPU架构的发展历程，从公司成立背景到关键技术授权，再到具体芯片架构的演进，全面解析了兆芯在国产CPU领域的贡献与挑战。 ... [详细]

蜡笔小新 2024-11-14 15:04:34
ide
三角测量计算三维坐标的代码_双目三维重建——层次化重建思考

双目三维重建——层次化重建思考FesianXu2020.7.22atANTFINANCIALintern前言本文是笔者阅读[1]第10章内容的笔记，本文从宏观的角度阐 ... [详细]

蜡笔小新 2024-11-13 19:31:37
pycharm
window下的python安装插件

window下的python安装插件,Go语言社区,Golang程序员人脉社 ... [详细]

蜡笔小新 2024-11-12 15:14:05
ide
javascript分页类支持页码格式

前端时间因为项目需要，要对一个产品下所有的附属图片进行分页显示，没考虑ajax一张张请求，所以干脆一次性全部把图片out，然 ... [详细]

蜡笔小新 2024-11-12 14:58:57
ide
视觉图像的生成机制与英文术语解析

近期，Google Brain、牛津大学和清华大学等多家研究机构相继发布了关于多层感知机（MLP）在视觉图像分类中的应用成果。这些研究深入探讨了MLP在视觉任务中的工作机制，并解析了相关技术术语，为理解视觉图像生成提供了新的视角和方法。 ... [详细]

蜡笔小新 2024-10-30 09:47:50
ide
深度森林算法解析：特征选择与确定能力分析

本文深入探讨了深度森林算法在特征选择与确定方面的能力。提出了一种名为EncoderForest（简称eForest）的创新方法，作为首个基于决策树的编码器模型，它在处理高维数据时展现出卓越的性能，为特征选择提供了新的视角和工具。 ... [详细]

蜡笔小新 2024-10-29 18:09:45
ide
AI TIME联合2021世界人工智能大会，共探图神经网络与认知智能前沿话题

AI TIME携手2021世界人工智能大会，共同探讨图神经网络与认知智能的最新进展。自2018年在上海首次举办以来，WAIC已成为全球AI领域的年度盛会，吸引了众多专家学者和行业领袖参与。本次大会将聚焦图神经网络在复杂系统建模、知识图谱构建及认知智能应用等方面的技术突破和未来趋势。 ... [详细]

蜡笔小新 2024-10-29 11:34:09

死性不改2502857027

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章