AI 轻松实现动漫角色转换真人，《飞屋环游记》中的小罗竟酷似他……

数据派THU | 2020-10-27 12:57:32 阅读：921

发布文章

来源：机器之心

电影《超人总动员》中的巴小飞和《飞屋环游记》中的小罗都是大家熟悉且喜欢的角色。但你有没有想过，这些动漫角色的「真人」版会是什么样子……这项研究将告诉你答案。

将人脸卡通化的应用我们已经见过一些了，比如此前介绍过的 Toonify Yourself !，那么能不能反过来，将卡通形象变成「真人版」呢？

最近 GS&P 广告公司技术总监 Nathan Shipley 利用AI创建了皮克斯角色的「真人」版，看起来效果还不错。（PS：他曾经制作了「复活」艺术家达利的deepfake实例。）

《超人总动员》里的「飞毛腿」巴小飞也太可爱了吧，真人版与原版非常相似。

《飞屋环游记》里的小罗原来「真人版」长这样，有点吓人。虽然五官相似，但头发有点非主流，看样子是把原图中的帽子转换成了头发……

二代蜘蛛侠Miles及其经过转换后的真人版。

不光如此，他还把画作里的人物变「回」现实。比如蒙娜丽莎：

墨西哥女画家弗里达·卡罗的自画像：

上：弗里达·卡罗的自画像（左）与转换后的「真人版」；下：弗里达·卡罗的照片。

这是怎么做到的呢？

Nathan表示他使用了一个叫做pixel2style2pixel的框架，在与源图像形状匹配的StyleGAN FFHQ潜在空间中快速找出「真人版」人脸图像，而且pixel2style2pixel的速度很快！

论文地址：

https://arxiv.org/pdf/2008.00951.pdf

GitHub地址：

https://github.com/eladrich/pixel2style2pixel

pixel2style2pixel 框架

今年8月，来自Penta-AI 和以色列特拉维夫大学的Elad Richardson、Yuval Alaluf等人发表论文，提出了一个图像到图像转换的通用架构——Pixel2Style2Pixel (pSp)。该架构基于一种新型编码器网络构建，可以直接生成一系列风格向量，然后输入到预训练好的StyleGAN生成器，形成可扩展的W+ 潜在空间。

该研究首先展示了编码器可以直接将真实图像嵌入到W+ 潜在空间，且不需要额外的优化。然后介绍了身份损失（identity loss），它可以在输入图像重建中实现更高的性能。

pSp是一个简单的架构，通过利用训练好的固定生成器网络，可以很容易地应用于广泛的图像转换任务。通过风格表示解决图像转换任务，这种方法带来了不依赖局部像素到像素对应的全局方法，且该方法通过风格重采样支持多模态合成。

值得注意的是，pSp架构可以在没有任何标注数据的情况下，将人脸图像与正面姿态对齐，为模糊任务生成多模态结果，如基于分割图的条件人脸生成、基于低分辨率图像构建高分辨率图像。

pSp可应用于基于分割图的人脸生成、超分辨率任务、图像修复等任务。

pSp架构

pSp 架构基于预训练 StyleGAN 生成器、W+ 潜在空间构建而成。在 StyleGAN 中，该研究展示了不同风格输入对应于不同层次的细节，这些细节大致分为三组：粗、中、细。于是，研究人员使用特征金字塔 [27] 扩展编码器主干网络，生成三种层次的特征图，它们使用简单的中间网络map2style来提取风格，如下图 2 所示。