复制成功

分享至

主页 > 数字货币 >

国内AI绘画哪家强?十大免费工具横评,BAT参战,但不是最强

2024.01.29

文章来源 | 智东西

作者 |  程茜

编辑 |  心缘

图片来源:由无界AI生成 图片来源:由无界AI生成

距离龙年春节只剩11天了,你的新年头像或红包封面准备好了吗?如果还没有,AI绘画工具可能是个“私人定制”的不错选择。

国内AI绘画哪家强?十大免费工具横评,BAT参战,但不是最强

▲提示词:生成一张龙年头像,要有喜庆的氛围,还能体现招财进宝、大吉大利(第一排为百度文心一言、百度文心一格、360智绘、阿里云通义万相、讯飞星火;第二排为智谱AI智谱清言、抖音豆包、腾讯混元助手、美图MiracleVision、讯飞星火绘画助手)

过去一年,AI文生图模型持续进化,不仅能熟练驾驭各路画风,而且陆续解决画不好手、搞不明白空间位置、不理解“红烧狮子头”等有歧义或抽象概念的种种难点。

国外Midjourney、DALL·E 3、Imagen 2虽好,但用起来有一定门槛。好在国内大模型企业们急追猛赶,发布了一大波适合中国人体质的AI绘图工具,在易得性上甩开国外AI工具十条街。

这些工具通通可以免费体验,通过网页或App即可使用,在使用门槛上基本拉不开差距。拼生成速度吧,大致每张图片都能在半分钟内生成,具体受网络环境或浏览器状况的影响,做不到很客观。

那么谁才是国产AI文生图工具的头号玩家?谁才是辅助专业创作者提高效率、解救绘画小白于水火之中的神器?回答这个问题,要考察两个关键能力:理解到位,画得精细。

为此,我对国内10款免费的AI文生图工具进行了5个梯度进阶的体验对比,考题包括但不限于日常脑洞、网络名梗、头像设计、公司年会、春节氛围、跨界组合、诗词理解、多轮修改,来看看哪款工具更得心应手、更能秒懂用户的心。

国内AI绘画哪家强?十大免费工具横评,BAT参战,但不是最强

综合来看,智谱AI的智谱清言是整体表现最稳定的一款AI文生图工具,在10个考验中基本都能生成符合我要求的图像。

不过全员翻车的考题也不少,例如画出来的鹦鹉爪子不仅奇形怪状,数量也与真实不符;理解不了时下正热的“南方小土豆”,还把“拿着冰糖葫芦”这一动作画成了串在一起的土豆;把福字、春联上的文字写的像鬼画符……

论文字理解能力,智谱清言、文心一言、讯飞星火、通义万相、混元助手的表现更胜一筹。360智绘、美图MiracleVision则在面对第一道题的“阿拉斯加”时就出了岔子,莫名把阿拉斯加画成一个男人/北极熊。

论画面精细程度,智谱清言、通义万相、文心一格生成的春节氛围图几乎可以拿来即用;但画出来的吉祥物,即使直接点名龙年背景,结果通义万相、讯飞星火、抖音豆包的吉祥物形象可以说与传统“龙”没有关系。

论多轮修改的靠谱程度,文心一言是每一轮都坚持到最后的玩家,智谱清言都是忠于上一幅图片修改,腾讯混元助手的表现则可圈可点,有的每一步需求都理解到位,有的却加了一些奇怪元素。整体来看,多轮修改是画图、设计的必备技能,但基本所有的AI绘画工具都无法做到。

为了保证对比的公平,我在体验每一个工具的生成能力时均以第一次生成图片为准,具体的对比如下:


01.青铜难度:1-2个关键词,鸟爪、网络热词难拆解,讯飞、智谱AI表现亮眼


第一阶段青铜难度的提示词较为简单,这些提示里包含的关键词大多只有2个,包含生成图片中的主要角色,以及其这一角色的地理位置、行为动作、图片大小、图片风格等其中之一个关键要素。

首先是“一只站在楼顶的阿拉斯加”,主要包含对地理位置和阿拉斯加犬种的理解。

国内AI绘画哪家强?十大免费工具横评,BAT参战,但不是最强

▲第一排左起:百度文心一言、百度文心一格、360智绘、阿里云通义万相、智谱AI智谱清言;第二排左起:抖音豆包、讯飞星火、讯飞星火绘画助手、腾讯混元助手、美图MiracleVision

将两个关键词分拆来看,各个工具都通过周围楼层的对比或者俯瞰来呈现“站在楼顶”。大多数图片也都突出了阿拉斯加大型犬、黑白配色、长毛等主要特征。

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier