热门标签 | HotTags
当前位置:  开发笔记 > 开发工具 > 正文

虚拟滑块实验室_不认真er的产品说|第三季:虚拟人,从云端到亲自实践——解密三星虚拟人...

作者在去年12月制作的唐代诗人bot既有“自然交互”的理想,又有“数字孪生”的梦幻,虚拟人,这是一个在科学和科幻的模糊交界处令人心醉的存在

作者在去年12月制作的唐代诗人bot

既有“自然交互”的理想,又有“数字孪生”的梦幻,虚拟人,这是一个在科学和科幻的模糊交界处令人心醉的存在。

从二维的传统画像,到立体的数字人类,多种多样的虚拟人实践是不认真er在2019年里进行的一项十分有趣的工作。

a0a41976209fc7cee4dc70a81b00ffa1.png

作者在去年9月制作的老年人虚拟人bot

虚拟人承载着用户对拟人化的视觉追求,以及直觉化的交互追求,如果说前者是“皮相”和“骨相”,那么后者则是“心相”和“动相”。

75382759a8497652684fd140cd9612c7.png虚拟人总体架构设计

(作者在2018年底的研究)

那么,目前虚拟人在视觉层面交互层面上,有哪些不同方案的制作路线呢?不认真er结合自己的实践探索进行了一番总结和解密。

视觉层面

CG路线与对抗式神经网络路线

CG路线的虚拟人,来自DEXTER

对抗式生成网络路线:由作者利用StyleGAN及面部属性编辑器制作

交互层面

标记-驱动路线与帧序列-播放路线

①标记-驱动路线

1c8ed3baf30706e08788eb733a50da13.png

采用标记-驱动路线的虚拟人NEON

5d0aee9862727162337aa317d7e47b6b.png

三星虚拟人家族演示

虽然三星并未公开NEON的技术路线,但不认真er经过仔细比对2019年CES展上虚拟人NEON的演示画面,和近些年来自三星的论文,从中找到了一些蛛丝马迹。

cc6dd6e3f4def736c5286a365c2abafe.png

现场演示里红色区域

0337fc406df93458b65a45d347880cfa.png

论文当中的红色区域

不认真er用红笔圈出了技术“暗示”,演示现场和论文里都出现了这种十分相似的用来标记人脸的线条,那么论文里作者向我们展示了一件什么工作呢?

——只需一张人脸照片,就能创造此角色新的动态头部/人脸表情。

dd0a3d512e55c67d2cb6b390fe0531ab.png

论文解读地址:

 https://blog.csdn.net/qq_34914551/article/details/90680883 

除了对人脸表情的学习,更进一步,三星在CES现场所演示的人脸表情控制,则离不开一个参数化的编辑器。

aee8874ec3bd8878d3da740c4f49626d.png

主持人手持平板拖动滑块,来控制虚拟人表情

那么,这样的编辑器长什么样呢?

正如上文那位帅哥的眨眼所用到的编辑器,不认真er认为三星的虚拟人也应用了类似的人脸编辑器,从而实现了不同人脸部位的实时参数化驱动。

a915abbcd4d7f6063a0fb22a09a638d1.png

在一张静态人脸图片上提取对应的关键点,并把这些关键点连接成标记线,然后最后由编辑器负责将这些标记线进行实时驱动,最终逆向映射到人脸的整体运动(或者由编辑器直接大量生成表情帧,实时合成为视频),这或许就是三星虚拟人的基本技术原理。

②帧序列-播放路线

即利用语音控制视频帧序列的播放

f2c6b2cf96fc0ef4984b135e4730878c.png

在unity中实现的苏东坡画像bot,其交互路线和文章开始的诗人bot类似

以上大概就是虚拟人的”一般制作手册“啦。(部分虚拟人项目和技术由于保密等原因不公开,敬请谅解)

正如三星虚拟人的设计者、Star labs战略负责人Bob Lian所说:“我们希望创造一个有自己的表情、行为、情感、甚至感觉和记忆的新生命。“虚拟人的理想几近梦幻,令人迷醉。

凯文·凯利曾经预测道:“不久的将来,现实世界中的每一个地方和事物 —— 每一条街道、每一个灯柱、每一栋建筑物和每一个房间 —— 都会在镜像世界中拥有它的全尺寸“数字孪生兄弟。”

虚拟人,可以是助理/秘书/伴侣,也可以是你在虚拟世界里的孪生复制品,那么,朋友们,大家认为自己的虚拟人应该是什么样子,有哪些功能呢?

对虚拟人感兴趣的同学,欢迎私信我聊天,maybe我们可以尝试建立一个关于下一代虚拟人的研究实践型社群。

我是不认真er,来我这,看到新鲜。

鸣谢:感谢自己在清华大学未来实验室实习期间的mentor、人工智能专家高峰博士,感谢他给予我探索虚拟人的动力。




推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 本文详细解析了JavaScript中相称性推断的知识点,包括严厉相称和宽松相称的区别,以及范例转换的规则。针对不同类型的范例值,如差别范例值、统一类的原始范例值和统一类的复合范例值,都给出了具体的比较方法。对于宽松相称的情况,也解释了原始范例值和对象之间的比较规则。通过本文的学习,读者可以更好地理解JavaScript中相称性推断的概念和应用。 ... [详细]
  • YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程
    本文介绍了关于人工智能、神经网络和深度学习的知识点,并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说,YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容,以及选择模型的优化思路。 ... [详细]
  • 电销机器人作为一种人工智能技术载体,可以帮助企业提升电销效率并节省人工成本。然而,电销机器人市场缺乏统一的市场准入标准,产品品质良莠不齐。创业者在代理或购买电销机器人时应注意谨防用录音冒充真人语音通话以及宣传技术与实际效果不符的情况。选择电销机器人时需要考察公司资质和产品品质,尤其要关注语音识别率。 ... [详细]
  • 家装日记六:家具采购和瓷砖选择
    本文记录了作者进行家装的过程,包括家具采购和瓷砖选择。作者介绍了自己家的装修风格以及选择烤漆家具和红白系列的原因。作者还提到了装修风格以简约为主,不可以太花哨的要求。最后,作者提到了价格较贵的问题。 ... [详细]
  • 微软发布OneNote for WordPress插件,支持一键从OneNote获取内容发布
    微软今日发布了OneNoteforWordPress插件,该插件支持从OneNote一键获取 ... [详细]
  • 不同优化算法的比较分析及实验验证
    本文介绍了神经网络优化中常用的优化方法,包括学习率调整和梯度估计修正,并通过实验验证了不同优化算法的效果。实验结果表明,Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]
  • 【MicroServices】【Arduino】装修甲醛检测,ArduinoDart甲醛、PM2.5、温湿度、光照传感器等,数据记录于SD卡,Python数据显示,UI5前台,微服务后台……
    这篇文章介绍了一个基于Arduino的装修甲醛检测项目,使用了ArduinoDart甲醛、PM2.5、温湿度、光照传感器等硬件,并将数据记录于SD卡,使用Python进行数据显示,使用UI5进行前台设计,使用微服务进行后台开发。该项目还在不断更新中,有兴趣的可以关注作者的博客和GitHub。 ... [详细]
  • 也就是|小窗_卷积的特征提取与参数计算
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了卷积的特征提取与参数计算相关的知识,希望对你有一定的参考价值。Dense和Conv2D根本区别在于,Den ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法,以及参数和返回值的说明,并提供了一个示例代码。 ... [详细]
  • 统一知识图谱学习和建议:更好地理解用户偏好
    本文介绍了一种将知识图谱纳入推荐系统的方法,以提高推荐的准确性和可解释性。与现有方法不同的是,本方法考虑了知识图谱的不完整性,并在知识图谱中传输关系信息,以更好地理解用户的偏好。通过大量实验,验证了本方法在推荐任务和知识图谱完成任务上的优势。 ... [详细]
  • Learning to Paint with Model-based Deep Reinforcement Learning
    本文介绍了一种基于模型的深度强化学习方法,通过结合神经渲染器,教机器像人类画家一样进行绘画。该方法能够生成笔画的坐标点、半径、透明度、颜色值等,以生成类似于给定目标图像的绘画。文章还讨论了该方法面临的挑战,包括绘制纹理丰富的图像等。通过对比实验的结果,作者证明了基于模型的深度强化学习方法相对于基于模型的DDPG和模型无关的DDPG方法的优势。该研究对于深度强化学习在绘画领域的应用具有重要意义。 ... [详细]
  • 本文介绍了一个免费的asp.net控件,该控件具备数据显示、录入、更新、删除等功能。它比datagrid更易用、更实用,同时具备多种功能,例如属性设置、数据排序、字段类型格式化显示、密码字段支持、图像字段上传和生成缩略图等。此外,它还提供了数据验证、日期选择器、数字选择器等功能,以及防止注入攻击、非本页提交和自动分页技术等安全性和性能优化功能。最后,该控件还支持字段值合计和数据导出功能。总之,该控件功能强大且免费,适用于asp.net开发。 ... [详细]
  • OC渲染器和阿诺德渲染器的特点及适用范围
    本文介绍了C4D软件自带的渲染器效果较差的问题,并推荐了四款C4D渲染器,其中包括OC渲染器和阿诺德渲染器。OC渲染器渲染速度快,简单易用,特别适合小团队和个人使用,而阿诺德渲染器具有超快的预览功能和真实的渲染效果,适合在体积光处理方面使用。两款渲染器都支持多个C4D版本和不同操作系统。 ... [详细]
author-avatar
死性不改2502857027
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有