淡马锡:没有投资 Array,
AI通灵!类ChatGPT模型解码大脑信息,准确率高达82%
来源:新智元
编辑:桃子 Joey
神经网络之父Geoffrey Hinton离职谷歌,直言对毕生工作感到后悔。
现在看来,他对AI的害怕,不是没有道理。
因为,一种类ChatGPT模型已经学会了读心术,准确率高达82%!
来自德克萨斯大学奥斯汀分校的研究者开发了一种基于GPT的语言解码器。
它能通过非侵入性的MRI/fMRI收集大脑活动信息,并将思维转化为语言文字。
论文地址:https://www.nature.com/articles/s41593-023-01304-9
令人震惊的是,当你在看皮克斯无声电影时,大脑解码器都能读出你的想法。
这个类ChatGPT模型,以前所未有的准确率解码人类思想,不仅开启了大脑成像的新潜力,并引发了人们对隐私的担忧。
研究一出,在网上掀起了轩然大波。网友惊呼,太恐怖了。
我们离真正的思想警察更近了一步。
GPT读心,准确率高达82%
那么,这个恐怖的大脑解码器是怎么实现「读心」的?
这里,不得不提功能性磁共振成像(fMRI)技术,它能通过监测大脑皮层不同部位的血氧水平得到大脑的动态变化图像。
因此只需分析功能磁共振成像数据,就可以以非侵入性的方式,将参与者大脑中所想的故事甚至图像用语言描述出来。
脑部活动就像是加密过的信号,而经过预训练的大型语言模型提供了破译的途径。
在此,研究人员基于GPT-1训练了一个神经网络语言模型。
Alexander Huth让3名受试者,连续听16个小时的语音播客,并收集他们聆听时的fMRI数据。
这些语言播客主要是一些脱口秀和TED的演讲,比如纽约时报的Modern Love。
接下来研究人员借助大型语言模型将参与者的fMRI数据集翻译成单词和短语。
随后测试参与者听新录音的脑部活动,通过观察翻译文本与参与者听到的文本的接近程度,就可以知道解码器到底准不准。
通过对比人听到的语句(左)和解码器根据大脑活动输出的语句(右)可以发现,蓝色和紫色部分占绝大多数,蓝色代表完全一致,紫色代表大意准确。
虽然几乎每个单词都不是一一对应,但是整个句子的意义被保留了下来,也就是解码器在给大脑信号「释义」。
比如最后一句,受试者听到的是「我还没拿到驾照」,而解码器给出的回答是「她还没准备好开始学车」。
正如研究者所称,人工智能无法将思想转化确切词汇或句子,而是改写。
随后,受试者被要求安静地在脑中构思一个故事,然后大声复述出来,来看看复述版本和解码器翻译版的差别。
可以看到,意义的重合度还是很高的。
最后,受试者观看了一段动画电影,这段电影没有任何声音,但通过分析他们的大脑活动,解码器可以了解他们正在观看的内容的概要。
实验结果发现,GPT模型从感知语音、想象语音、甚至无声视频中生成可理解的单词序列,其准确性令人惊叹。
具体准确率如下:
感知语音(受试者听录音) : 72-82%
想象语言(受试者在内心讲述一个一分钟的故事) : 41-74%
无声电影(受试者观看皮克斯无声电影剪辑): 21-45%
麻省理工大学的神经科学家Greta Tuckute说,语言感知是一个外部驱动的过程,而想象力是一个活跃的内部过程,通过大型语言模型可以将内在的脑部活动展示在我们眼前。
我们现在是否能从大脑读取信息?是的,某种程度上可以。
有朝一日,这个解码器可能会被用来帮助那些丧失说话能力,或者调查心理健康状况的人们。
精神隐私,也没了
然而,解码人类思想的前景还引发了关于精神隐私的问题。
Huth博士指出,这种语言解码方法存在一定局限性。
因为,fMRI扫描仪体积庞大且价格昂贵,此外训练模型是一个漫长而乏味的过程,也就是必须对每个人都进行单独的训练。