作者: 小小一道人 时间: 2023-12-07
时至今日,被誉为"最强大"的聊天机器人ChatGPT不仅能创造出图像和写代码,还可以应付各种复杂任务,没有人工智能能够与之匹敌。但是,在最近的一项测试中,ChatGPT却输给了拥有近60年历史的聊天机器人ELIZA。
GPT-4没通过图灵测试
长期以来,"图灵测试"一直是衡量计算机智能的关键问题。
在上个世纪60年代,麻省理工学院的科学家们研发出了基于规则的聊天机器人ELIZA,然而,在那次测试中失败了。
时至今日,被誉为"最强大"的聊天机器人ChatGPT不仅能创造出图像和写代码,还可以应付各种复杂任务,没有人工智能能够与之匹敌。
但是,在最近的一项测试中,ChatGPT却输给了拥有近60年历史的聊天机器人ELIZA。
来自加州大学圣迭戈分校的两名研究人员在一篇名为"能否通过图灵测试的GPT-4"的研究中,证明了这个发现。
研究人员将GPT-4、GPT-3.5、ELIZA和人类参与者作为研究对象,看哪个最能成功地让人类参与者误认为它是人类。
值得惊讶的是,ELIZA在本次研究中表现不错,成功率为27%。
而根据不同提示,GPT-3.5的最高成功率仅为14%,低于ELIZA。GPT-4获得了41%的成功率,仅次于人类得分(63%)。
马库斯(Kai Markus)对此透露,通过图灵测试的愿望破灭了。 作者经过认真研究,发现测试者认为ELIZA是人类的主要原因是:当我问它问题时,它总是不愿回答,并且显得既不热情也不唠叨,我从未遇过这样糟糕的人工智能,所以它一定是一个不耐烦的人类!
这再次证明了一个结论:图灵测试并不是评估人工智能智能程度的标准。不能仅仅因为ELIZA表现更好,就认为这个基于规则的人工智能系统的智能水平高于ChatGPT。
0