Starknet生态Dapp已超过170个
AI视觉字谜爆火!梦露转180°秒变爱因斯坦,英伟达高级AI科学家:近期最酷的扩散模型
来源:量子位
AI画的玛丽莲·梦露,倒转180°后,竟然变成了爱因斯坦?!
这是最近在社交媒体上爆火的扩散模型视错觉画,随便给AI两组不同的提示词,它都能给你画出来!
哪怕是截然不同的对象也可以,例如一位男子,经过反色处理,就神奇地转变成一名女子:
就连单词也能被翻转出新效果,happy和holiday只在一旋转间:
原来,这是来自密歇根大学的一项“视觉字谜”新研究,论文一发出就在Hacker News上爆火,热度飙至近800。
英伟达高级AI科学家Jim Fan赞叹称:
这是我近期见到最酷的扩散模型!
还有网友感叹称:
这让我想到了从事分形压缩工作的那段经历。我一直认为它是纯粹的艺术。
要知道,创作一幅经过旋转、反色或变形后呈现出新主题的绘画作品,怎么也需要画家对色彩、形状、空间具备一定的理解能力。
如今连AI也能画出这样的效果,究竟是如何实现的?实际效果是否有这么好?
我们上手试玩了一番,也探究了一下背后的原理。
Colab就能直接试玩
我们用这个模型绘制了一组Lowpoly风格的画,让它正着看是一座山,反过来则是城市的天际线。
同时,我们让ChatGPT(DALL·E-3)也试着画了一下,结果除了清晰度高一些之外似乎就没什么优势了。
而作者自己展示的效果则更加丰富,也更为精彩。
一座雪后的山峰,旋转90度就变成了一匹马;一张餐桌换个角度就成了瀑布……
最精彩的还要属下面这张图——从上下左右四个角度看,每个方向的内容都不一样。
(这里先考验一下各位读者,你能看出这四种动物分别是什么吗?)
以兔子为初始状态,每逆时针旋转90度,看到的依次是鸟、长颈鹿和泰迪熊。
而下面这两张图虽然没做到四个方向每个都有“新内容”,但还是做出了三个不同的方向。
除了旋转,它还可以把图像切割成拼图,然后重组成新的内容,甚至是直接分解到像素级。
风格也是千变万化,水彩、油画、水墨、线稿……应有尽有。
那么这个模型去哪里能玩呢?
为了能让更多网友体验到这个新玩具,作者准备了一份Colab笔记。