微信公众号:跳海大院/meerjump

每当人工智能科技取得突破性进步,AI替代人类的论调都会卷土重来。


(资料图)

短短几年时间里,AI已经练废了柯洁、玩坏了大把电竞选手,并正在蓄谋抢走人类插画师的饭碗。其引发的种种争议也正在不断发酵当中。

AI画作《空间歌剧院》

但人类的赞歌总在哀叹声中被无畏的英雄奏响,当AI作画再度引发智械危机讨论,我们都知道是时候再次寄希望于人类中的整活精英。

不知何时开始,一场用老祖宗手艺对抗尖端科技的绝望反攻被无畏者发起。我们貌似见证了一次绝处逢生——至少证明人类在短时间内还不可能被冰冷的数据代替。

是的,无数实操结果似乎已经证明:AI绘图工具根本不知道怎么使用筷子!

当人们向AI传递“吃拉面”的指令时,获得的几乎都是“美少女空手吃面”的奇景。

樋口円香,二次元知名美少女

因“不会用筷子吃拉面”AI组图出圈

如过去每次互联网传闻一边倒的走向,当粗暴的结论偏向人类一方的绝对立场,AI绘图工具便成为了被普遍讥讽的对象。

如今人们不仅把“樋口円香吃拉面”拱成了名梗,还开始模仿AI作画,给AI吃拉面贴上了愚蠢的标签。

AI能画出获奖作品,却画不好美少女吃拉面。非常值得嘲笑,却也非常值得怀疑。

事实是否真如网友所传,不可一世的AI又为何会败给区区两根小木棒?

我和院办星星决定用实操还原真相。

一场事关人类或AI尊严的挑战

爱因斯坦曾说过这么一句话:倘若人类文明爆发第四次世界大战,那人类所使用的武器一定都是石头与棍棒。

他没有想到的是,在被用于第四次世界大战之前,棍棒已经被人类用来挑战AI。

我们了解到“吃面”相关图片所使用的AI绘图工具,都是同一个——Novel AI

在成为人见人欺的AI之耻前,它被开发出的最广泛用途,其实是生成二次元涩图。

在所有AI绘图工具里,Novel AI可以说是最懂二次元的一个。为了表达最初的敬意,我们用它目前最熟悉的方式,完成了这次短暂的历史性会晤。

简单来说,这款AI绘图工具的核心功能,就是根据数个关键词进行联想,生成一张完整的图片。

而对于“AI不会用筷子”这一传言,我们目前最大的疑问就在于:究竟是AI本身就不会“用筷子”,还是人类的自负与粗心造就了AI不会用筷子的结局。

目前网络上流传最多的,都是以“美少女吃拉面”为主题的AI作品,于是在最初的交流中,我们也以此为关键词与AI进行了沟通与试探。

如你所见,仿佛恰如网友们所说,在AI的想象中,吃的主体与被吃的东西只有最简单的联系,吃拉面是用手与口便能完成的基础动作。

对于Novel AI而言,拉面与面馆之间的关系,可能甚至强于拉面与筷子之间的关系——我们以“吃拉面”为关键词生成的每一张图片,吃面的主体都被置于类似日式拉面馆的环境之中。

为了证明这个观点,我们把关键词“Ramen(拉面)”换成了“Noodles(面条)”,背景果然丰富了起来。问题是,AI仍未觉得吃面有必要用筷子。

我试图从AI的角度俯瞰这一系列结果:女孩,可以是印度女孩,面,当然就可以手抓。显然,这个逻辑并无漏洞。

那么错的就不是AI,而是将“吃面要用筷子”当成愚蠢常识的我!

那么如果我将关键词限定到“中国女孩用筷子吃面”呢?我们立马进行了尝试,结果如下:

我们不仅被AI对中国女孩的刻板印象狠狠嘲弄,也似乎进一步证明了AI确实不会用筷子。

中国女孩吃面没毛病,筷子也有,但也仅限于有。

筷子有时能跟手指产生联系,但不知道为什么吃个面要抓这么一大把筷子。

更多情况下,手指、筷子、面、头发基本处于水乳交融的状态。当条状物彼此接近,AI似乎认为它们就应该互相融合。

为了排除刻板印象的影响,我们又进一步将用筷子吃面的对象限定到特定的古代人物——孙悟空和孔夫子——试着用“老祖宗操持老祖宗手艺”的理念强化AI认知。

星星还在关键词里加上了一长串“黑魔法咒文”,希望生成更精致的持筷吃面图。

AI美猴王(Monkey King)

AI孔夫子(Confucius)

从上面的这些图里,我们得到的结论是:AI画的猴哥真好看,AI根本不认识孔子,AI真不会用筷子。

我又将“面”替换成了“饺子(dumpling)”,发现AI甚至连饺子都不敢画,频频用大碗挡住视线,不愿露出它认知里的饺子(或面团)原貌。

到此时,已有百余张AI生成的图片被保存到了我的电脑里。看着满屏的妖魔鬼怪,我觉得我对Novel AI大概已经有了初步认识:

首先,它对人类生活常识的了解并不多,其次,它的数据库中关于中国传统文化的数据一定少得可怜,最后,它真的不是很会画手。

这三者已经足以构成“AI不会用筷子”的原因,这次挑战也大可以“AI输了”的简单结论告终。

但你以为这就结束了吗?

柯南推理BGM起

想想吧,如果我试图用“在我的调教下AI学不会使用筷子”这样的结论,来证明AI是垃圾,那么当失败的结局摆在大家眼前,输的究竟是学不会的AI,还是坐在屏幕前颐指气使的我?

说到底,是AI辜负了我,还是我教坏了AI?

你绝不能小看一个新媒体作者想搞个大新闻的决心,也绝不能忽略AI的学习能力。

这回,老子非要教会它。

AI的反攻,是试图把我教坏

为什么“使用筷子”的图里,一定要有人和拉面呢?人和拉面都是非必要的,手才是“使用筷子”的主角!这又是我基于现有经验犯下的低级失误!

想到这里,我开始想象如何为AI减轻运算压力,将画面聚焦于手。

很快,“a hand holding chopsticks(一只拿着筷子的手)”被我加入到了关键词当中。

我惊讶地发现,诡计多端的AI竟然在主动逃避“使用筷子”的完整动作。拿着筷筒也算拿着筷子,拿一整把筷子也是个拿,总之什么拿法它说了算,不按我的想象拿就是它最后的倔强。

还好我技高一筹,又机智地把“holding(拿)”改成了“using(使用)”。

测试的结果令人暖心。

AI真的很努力地在回应我的指令,努力到扭曲,努力到超出我的理解能力。

当越来越多扭曲的“筷子使用手法”对我的眼球与精神发起冲击,我甚至开始怀疑究竟哪种用法才是对的。

此时,又一个大胆的想法出现在了我的脑海中:

为什么不让AI教我使用筷子的方法呢?

我的意思是,如果AI能生成“筷子使用教程”,是不是就可以反向证明AI其实会用筷子,而在此之前,它一直都在演我?我们马上进行了尝试,这是AI给出的部分答卷:

可惜,AI并没有马上get到我的意图。在我为时一整天的颐指气使过后,它似乎已经觉得所谓的“筷子使用教学”,就是拿着几根筷子对着美少女指指点点。

我用同样的关键词又重复生成了几轮图片,终于出现了几张接近我想象中的教程该有的样子。

AI是真的想要教会我,而我是真的学不会。

在这轮你来我往的较量中,我想到的最后的办法是:AI进行手把手教学。

具体操作也很简单:我拍摄自己使用筷子的照片,然后把照片交给AI,让它直接照着学。

经过这最后一轮的尝试,我逐渐理解了一切:不会就是不会,照着画也不会。

Novel AI完败了,它背后的数据库不足以支撑它画好人类身上最复杂的部位之一,以它目前的理解能力,学会用筷子这门老祖宗的手艺更是为时过早。

但你以为这就结束了吗?

柯南推理BGM再起

AI输了,但并没有完全输

醒醒吧朋友们,别忘了自己在看公众号,这里有的是春秋笔法和断章取义。我完全可以在几百张图里挑几十张,就为了佐证我想突出的观点。

你绝不能小看一个新媒体作者想搞个大新闻的决心,也绝不能忽略一个人类的好胜心。

事实也正是如此,在最早期的几轮尝试里,我们其实早就已经用AI生成了几张比较像样的图片。甚至只要手动微调,就能拿来反证AI会用筷子。

“如果关键词里只有‘吃面’,AI就不会用筷子”——这同样是个谎言。在我们第一轮的尝试里,已经有部分图片出现了筷子,只是我并没有把这些图片放出来罢了。

一些操作中偶然出现的正向结果,也让我们有理由相信,只要输出的图片够多,总会有几张能看起来像样的。

我最初选择不把它们放出来的理由,与“樋口円香吃拉面”造梗者的理由很可能差不多:

一方面,手抓面AI图真的很好笑;另一方面,AI还不成熟的证据也足以满足看客身为人类的自尊心,从而引起一轮分享转发。

只有AI和樋口円香受伤的世界达成了

关于Novel AI,有一个事实也常常被忽略:

Novel AI所依赖的系统 Diffusion Model 其实才刚被开发出来不久,数据库不够完善、学习的深度和广度也远远未够,跟Dall·E、MidJourney、Disco等更早起步的AI绘图工具相比,只能说是菜鸟级别。

只是因为它使用门槛低、懂二次元,其出品才被最广泛地传播开来。

Midjourney生成的图片,图源微博@Simon_阿文

虽然已经有人拿AI生成的图片拿了奖,但要真跟AI论个输赢,现在大概还远未是时候。

因为到目前为止,AI的认知还只能基于人类的认知,AI的学习能力取决于人类的技术水平,所以在AI“做不到”的范畴里,唯一的输家也只会是现阶段的人类。

不过单就“吃拉面”的舆论导向而言,AI还是输了,它大概输给了人类复杂的主观能动性和深不可测的情感与谋划。在可能会发生的人类拿起棍棒对抗AI的未来大战中,AI也有可能会输在这些方面。

比如 Novel AI 好像就还不知道谎言是什么,当我们以“lie”为关键词考验它时,它给出的30多张图都只取“躺”之意描绘各种涩图。

AI最后总会输——这是我基于自己看过的科幻电影和小说产生的幼稚判断,并不重要。

现在唯一重要的是,AI绘图真的很好玩!我用跳海大院法英结合的洋文名字“meerjump”生成了一些图片,发现它好像确实理解了精髓。

挑选跳海大院元宇宙形象

慢着,总觉得AI很好玩——人类未来有可能会因此输得很惨。

推荐内容