AI视觉字谜爆火！梦露转180°秒变爱因斯坦，英伟达高级AI科学家：近期最酷的扩散模型

2023.12.03

来源：量子位

AI画的玛丽莲·梦露，倒转180°后，竟然变成了爱因斯坦？！

这是最近在社交媒体上爆火的扩散模型视错觉画，随便给AI两组不同的提示词，它都能给你画出来！

哪怕是截然不同的对象也可以，例如一位男子，经过反色处理，就神奇地转变成一名女子：

就连单词也能被翻转出新效果，happy和holiday只在一旋转间：

原来，这是来自密歇根大学的一项“视觉字谜”新研究，论文一发出就在Hacker News上爆火，热度飙至近800。

英伟达高级AI科学家Jim Fan赞叹称：

这是我近期见到最酷的扩散模型！

还有网友感叹称：

这让我想到了从事分形压缩工作的那段经历。我一直认为它是纯粹的艺术。

要知道，创作一幅经过旋转、反色或变形后呈现出新主题的绘画作品，怎么也需要画家对色彩、形状、空间具备一定的理解能力。

如今连AI也能画出这样的效果，究竟是如何实现的？实际效果是否有这么好？

我们上手试玩了一番，也探究了一下背后的原理。

Colab就能直接试玩

我们用这个模型绘制了一组Lowpoly风格的画，让它正着看是一座山，反过来则是城市的天际线。

同时，我们让ChatGPT（DALL·E-3）也试着画了一下，结果除了清晰度高一些之外似乎就没什么优势了。

而作者自己展示的效果则更加丰富，也更为精彩。

一座雪后的山峰，旋转90度就变成了一匹马；一张餐桌换个角度就成了瀑布……

最精彩的还要属下面这张图——从上下左右四个角度看，每个方向的内容都不一样。

（这里先考验一下各位读者，你能看出这四种动物分别是什么吗？）

以兔子为初始状态，每逆时针旋转90度，看到的依次是鸟、长颈鹿和泰迪熊。

而下面这两张图虽然没做到四个方向每个都有“新内容”，但还是做出了三个不同的方向。

除了旋转，它还可以把图像切割成拼图，然后重组成新的内容，甚至是直接分解到像素级。

风格也是千变万化，水彩、油画、水墨、线稿……应有尽有。

那么这个模型去哪里能玩呢？

为了能让更多网友体验到这个新玩具，作者准备了一份Colab笔记。

相关推荐