首页 > 活动线报 > 每日福利 > 谷歌:GPT-4高阶心智理论彻底击败人类!第6阶推理讽刺暗示全懂了

谷歌:GPT-4高阶心智理论彻底击败人类!第6阶推理讽刺暗示全懂了

发布时间:2024-06-02 22:12:46来源: 15210273549

刚刚,谷歌DeepMind、JHU、牛津等发布研究,证实GPT-4的心智理论已经完全达到成年人类水平,在更复杂的第6阶推理上,更是大幅超越人类!此前已经证实,GPT-4比人类更能理解语言中的讽刺和暗示。在心智理论上,人类是彻底被LLM甩在后面了。

 

GPT-4的高阶心智理论(ToM),已经正式超越人类!

就在刚刚,谷歌DeepMind、约翰斯·霍普金斯大学和牛津大学等机构的学者发布的研究证实,GPT-4在心智理论任务上的表现,已经完全达到了成年人类的水平。

而且,它在第6阶推理上的表现,更是大幅超过了人类!


论文地址:https://arxiv.org/pdf/2405.18870

无独有偶,此前Nature子刊《自然·人类行为》的一项研究也证实了,GPT-4在心智理论上的表现已经位于人类水平之上,能够比人类更好地察觉出言语中的讽刺和暗示。如果你不这么觉得,那它大概率只是在隐藏实力而已。

总之,这前后脚的两项研究清晰地表明,如今表现最好的大语言模型,已经发展出广义的心智理论能力,而GPT-4,已经是其中的佼佼者。


所以,距离各位LLM用心智和权术把我们人类玩弄于股掌之间的那一天,还有多远?


高阶心智理论

 

这次的研究,探讨了LLM究竟能在多大程度上发展高阶心智理论(higher-order ToM)。

所谓高阶心智理论,就是人类以递归方式,推理他人的多种心理和情感状态的能力。

比如,「我认为你相信她知道」这句话中,就包含了非常复杂的多层推理,属于一个三阶陈述。

在以前,大部分相关研究,都集中在二阶ToM上。


用什么样的方法,能衡量出LLM对如此复杂问题的把握能力?

团队特意引入了一套手写测试套件——多阶心智理论问答测试。

而参与PK的选手,有5个LLM和一大群成年人。

 

每日福利更多>>

realme GT7 Pro 5G手机限时特惠2864元 小米米家智能晾衣机 2 Pro 今起开启众筹,建议零售价 1799 元 / 国补价 1401.65 元 跟踪指数高配小米、阿里巴巴、腾讯合计超30%!港股通科技ETF(159262)正在发售中 搭载“史上最昂贵相机模组”!华为新品又为手机影像加了什么“猛料”? AYANEO推出FLIP 1S DS双屏掌上电脑:OLED屏+IPS双屏配置 红魔电竞平板3 Pro堆料成本大增!产品经理:售价不会涨的太离谱 苹果 WWDC 2025 发布 Metal 4,游戏输入延迟咋解决? 从国游到国漫:王者的英雄宇宙,正在翻开“荣耀之章” 方大集团中兴商业举办“仲夏·粽享趣时光”主题营销活动 小米体脂秤S400限时特惠,99元抢购! Apple iPhone 16 Plus 5G手机256GB白色限时4595元 索尼整的这波大活,让我觉得游戏圈也要搞文艺复兴了 从飞机到手机!西安“打印”产业新图景 小米YU7售价不低于23.59万,三个版本电池厂商确定! 三星990 EVO Plus固态硬盘限时特惠499元 核电商机爆发:Meta与Constellation达成20年购电协议 揭示AI电力定价新逻辑 神牛V350s索尼版热靴闪光灯天猫优惠价579元 剑河红米“挥剑”出山——特色农业品牌化的县域实践样本 苹果中国开卖官方翻新版M2 iPad Air:3699元起 立省1100元 华为WATCH Ultimate非凡探索:守护青年登山家张京首次珠峰登滑壮举 杭州滨江房产集团提名贾生华为第七届董事会独立董事候选人 BONAIER柏奈儿OPPO全覆盖防蓝光钢化膜三片装加碳纤维后膜套装热卖中 索尼ZV-E10L微单相机限时特惠,直降千元补贴后仅3824元 小米Q1大爆发 营收破千亿、利润破百亿 iQOO 15 Ultra首曝:首款骁龙8 Elite 2 Ultra旗舰 直真科技荣获华为“2024年度鲲鹏优秀实践奖” 岚图Free+静态体验:岚图+华为让旅途更自由 苹果挂绳专利获批:创新滑动扣设计,多样化携带 iPhone / iPad 等 Canalys 报告2025Q1欧洲手机出货量:三星持平、苹果同比增 10% 红米Note 12 Turbo手机支持的频段详解:全球网络兼容性全面解析