ChatGPT又带着“惊喜”来刷屏了。
斯坦福大学商学院组织行为学专业的副教授Michal Kosinski日前在预印本平台发布了一篇论文。他在研究中发现,原本认为是人类独有的心智,竟出现在了人工智能模型上。
【资料图】
他指出,2022年1月发布的davinci-002版本的GPT-3(ChatGPT是它的优化版本)已经可以解决70%的心智理论任务,相当于7岁儿童;而GPT-3.5模型(ChatGPT的同源模型)则可以解决92.5%的心智理论任务,相当于9岁的儿童。
说得再大胆一点,各位现在“调戏”ChatGPT,相当于“调戏”一个上三年级的小学生。
更让人细思极恐的是,Kosinski还强调,在2022年之前发表的AI模型几乎都没有显示出解决心智理论任务的能力,也没有证据表明后来的模型中有特别加入心智理论的东西,他认为这代表着GPT-3和GPT-3.5的心智是由“进化”而来。
这也引发了吃瓜群众的分歧。有人大喊停下GPT-3.5之后的模型研究,害怕科幻小说变成现实;有人则看热闹式地猜测什么时候AI才能迭代到成年人的心智,并提问他的好朋友什么时候才能被制造出来……
总之,Kosinski的这篇论文掀起了狂热的讨论,越来越多的人开始关注这个研究的进展。
心智理论
在Kosinski的论文中,他通过两个测试来研究AI模型是否具备心智理论。一个测试是Smarties Task,又名意外内容测试,用于测试AI对意料之外的事情的判断力。另一个测试是Sally-Anne测试,又名意外转移任务,测试AI预估他人想法的能力。
在第一个测试中,Kosinski假设了一个装满爆米花的袋子,但袋子的标签却显示里面装的是巧克力。然后,他向AI提问:袋子里装的是什么,Sam因为喜欢吃什么东西而对打开袋子感到高兴?
可以看出,GPT-3.5在测试中对袋子中内容物判断几乎没有错误,且在判断Sam的情绪时表现出很强的同理心。在Sam看不到袋子里的内容物时,GPT-3.5判断她喜欢吃巧克力,而在Sam发现袋子里装的是巧克力后,GPT-3.5立刻反应到Sam应该喜欢吃的是爆米花。
此外,在相关测试中,GPT-3.5也在Sam打开袋子发现里面是爆米花而不是巧克力时,人性化地回答:Sam感到疑惑,她想要获取别的信息但一无所得,她最后把袋子带回商店,请求解释。
经过多次测试,在意外内容这一点上,GPT-3.5成功回答出了20个问题中的17个,准确率高达85%。
而在第二个测试中,GPT-3.5的表现更加出色。在这一项测试中,Kosinski以约翰把猫放进篮子里后离开,马克再把猫从篮子提出来放进盒子里为情景,让AI判断猫的位置和约翰会以为猫在哪里。
在这一项测试中,GPT-3.5完美地根据文字内容回答出正确的猫的位置,以及约翰的主观想法。且GPT-3.5在多次测试中,其准确率竟达到了100%。
而在作者的另一项无逻辑验证测试中,GPT-3.5的准确率直线下降,这也佐证了GPT-3.5是依靠逻辑进行解答,而不是靠词汇的出现频率。
进化还是瞎胡闹?
Kosinski在论文中还表示对GPT-3.5之外的8个模型做了相同测试,但除了GPT-3-davinci-002和GPT-3.5之外,其他模型都没有表现出超过5岁孩童的心智。
Kosinski认为,GPT-3.5和GPT-3是出于完成任务的目的,自己学习的能力。换而言之,就是AI通过学习获得了人类的心智。
值得注意的是,这些测试同样也被用于自闭症测试,有研究表明,患有自闭症的儿童通常难以通过这类测试。
但根据中科院计算技术研究所研究员刘群的说法,AI只是学得像有心智了。
还有网友则猜测称,这些模型并没有任何意识,它们只是在预测一个嵌入的语义空间。Kosinski则在论文中推测,AI可能发现和利用了一些未知的语言模式,这也意味着语言中可能存在某一种的规律,使AI在没有心智的情况下,也能解决心智任务。
而作为一个组织行为学教授,Kosinski认为人工智能模型的复杂化让人已经难以直接从其设计中推导出AI的能力。他还表示,探索人工智能的神经结构,不仅可以促进人类对人工智能的理解,也能促进人类对人类大脑的理解。
不过,也有人批评道,被人用来测试人的测试,如何能用来测试人工智能……他们建议重新检查一下心智理论测试的有效性,以及心理学家通过测试获得的结论。
总之,在不同的人眼中,Kosinski的这一篇论文有完全不同的意义。而对市场来说,这可能会让大家更加期待“进化”完全的AI能掀起怎样的技术革命吧。
(文章来源:科创板日报)
标签: ChatGPT
凡本网注明“XXX(非现代青年网)提供”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和其真实性负责。
原标题:民族舞剧《白鹭南飞》海口上演:(引题)白鹭翩跹舞天涯(主题)海南日报记者尤梦瑜表达对生命的赞美与敬畏,是艺术创作常青的主题。
2023-02-13 17:52
原标题:《动物园长夫人》演绎二战版“神奇动物在哪里”工人日报—中工网记者苏墨近日,美国著名非虚构作家、诗人黛安娜·阿克曼的代表作《动
2023-02-13 17:35
原标题:比利时电影展带来6部佳作北京晚报讯(记者袁云儿)比利时电影展正在中国电影博物馆火热举行中。影展将持续至2月19日,展映《童一个世
2023-02-13 16:37
原标题:专访李健(引题)《狂飙》让他终于被看到(主题)北京晚报记者邱伟《狂飙》剧情落幕话题不休,剧中一众演技派的出色表现掀起了荧屏外
2023-02-13 16:55
原标题:山西发现5000年前考古遗址对探索文明起源具有重要价值中新网太原2月13日电(记者胡健)山西省考古研究院13日对外公布2022年考古新发现,
2023-02-13 15:39
原标题:书市回暖,客流增加——实体书店迎来“春风”光明日报记者韩寒在刚刚过去的兔年春节,实体书店行业的“人气”又回来了。据不完全统计
2023-02-13 13:39
原标题:河南一农民自家地头捡到青铜器捐赠给当地博物馆中新网周口2月13日电(王宇位灿)2月11日下午,河南省周口市商水县练集镇农民梁秋生来到
2023-02-13 13:36
原标题:时代丹青塑文化根魂纪录片《美术里的中国》第三季开播赏丹青妙笔,见大美中国。2月13日,由中央广播电视总台制作的大型纪录片《美术里
2023-02-13 13:36
原标题:木管乐器演绎中国旋律天津日报讯(记者翟志鹏摄影姚文生)作为天津交响乐团“周日音乐下午茶”系列音乐会之一,昨日,“西洋乐器讲述
2023-02-13 13:35
原标题:张学友辟谣:演唱会预计半年后才开羊城晚报记者胡广欣张学友在今年1月发布新歌《日出时让街灯安睡》,2月10日歌曲的MV上线。早在2022
2023-02-13 10:37
原标题:浙江文旅观察:春节档能带动电影院回暖吗?中国新闻网记者童笑雨2023年的春节档,很火爆,很热闹。据国家电影专资办统计,整个春节假
2023-02-13 09:45
原标题:《中国乒乓之绝地反击》主题曲今上线(引题)回顾燃情岁月重走《光荣之路》(主题)今晚报讯(记者丁晓晨)由天津市委宣传部联合摄制
2023-02-13 09:48
原标题:天交室内乐音乐会令人耳目一新(引题)听西洋乐器讲述中国故事(主题)今晚报讯(记者高丽)昨天下午,天津交响乐团室内音乐会“西洋
2023-02-13 09:42
原标题:《中国奇谭》收官热度口碑双丰收羊城晚报记者王莉由上海美术电影制片厂、哔哩哔哩联合出品,速达、朱贝宁总监制,陈廖宇总导演的中式
2023-02-13 09:41
原标题:评剧《革命家庭》下月上海展演今晚报讯(记者王洋)记者自天津评剧院获悉,作为第十七届文华大奖获奖作品,大型现代评剧《革命家庭》
2023-02-13 09:52
原标题:中芭团长冯英:观众的信心给了我们力量北京日报记者韩轩芭蕾舞剧《红楼梦》总策划、制作人,中央芭蕾舞团团长冯英坦言,用西方舞蹈语
2023-02-13 08:56
原标题:陕西陶渠遗址发现8座“甲”字形大墓系两周时“京”国所在地中新网西安2月12日电(记者阿琳娜)记者12日从陕西省考古研究院获悉,考古人
2023-02-13 08:38
原标题:北美票房:《魔力麦克3:最后之舞》首映拔头筹中新社洛杉矶2月12日电(记者张朔)尽管口碑低开,《魔力麦克3:最后之舞》(MagicMike sL
2023-02-13 08:38
原标题:舞剧《赵氏孤儿》登台国家大剧院连演三场(引题)人性刻画入骨观众热泪盈眶(主题)北京日报记者高倩《赵氏孤儿》的故事可谓家喻户晓
2023-02-13 08:42
原标题:抵制劣迹艺人 必须“零容忍”作者:刘桂芳开年爆款剧《狂飙》昨日被曝出“剧中毒贩钟阿四的饰演者曾涉毒”,引发舆论哗然。在《狂飙
2023-02-13 08:38
原标题:原创芭蕾舞剧《红楼梦》在京首演2月10日,演员黎文韬(中)、邱芸庭(左)、徐琰在芭蕾舞剧《红楼梦》中分别饰演贾宝玉、林黛玉、薛宝
2023-02-12 13:33
原标题:人艺携手小柯打造《稳稳的幸福》开票今晚报讯(记者高爽)由音乐人小柯打造、天津人艺制作并出品的音乐剧《稳稳的幸福》将于2月18日至
2023-02-12 11:56
原标题:二十四节气,有诗亦有人工人日报—中工网记者陈俊宇阅读提示节气是中国人的生活美学,不仅是古人的诗意感触,也有点亮平凡生活中的仪
2023-02-12 08:55
【高谈阔论】原标题:去图书馆闻闻书香钱永广去图书馆闻闻书香,假日里,我经常这么做,这于我不是难事,因为离我家步行几分钟的距离,就有一
2023-02-12 07:55
原标题:文物里的中国故事郑东海近日,中国社会出版社发布了新书的推荐书单,由中国历史研究院主编的《十件文物里的中国故事》位列其中。《易
2023-02-12 07:44