多项测试超越90%的人类,GPT-4会引发新一轮风暴吗

2023-03-16 00:22:28 北京商报网 

3月15日,美东时间3月14日,OpenAI宣布推出大型语言模型的最新版本——GPT-4,该版本比以前的版本“更大”,称它可以接收图像和文本输入,输出文本,“比以往任何更具创造性和协作性”,并且“由于它有更广泛的常识和解决问题的能力,可以更准确地解决难题”。在内部评估中,它产生正确回应的可能性比GPT-3.5高40%。它将用于付费版ChatGPT Plus。

ChatGPT是最近科技界最火爆的话题,GPT-3是世界上最大的大语言模型之一,其惊人的表现也让外界猜测下一代的GPT-4到底有多强大。

OpenAI官方发布的宣传片中GPT的最新一代版本ChatGPT-4,相比上一代,其AI能力再度提升,同时支持输入的内容不再仅限于文字,还支持图像内容的输入,成为一个能够理解照片的人工智能。虽然ChatGPT-4未能实现音频解析,但新功能让人兴奋不已。

同时根据OpenAI介绍,GPT-4是一个多模态大型语言模型,即支持图像和文本输入,以文本形式输出;扩写能力增强,能处理超过25000个单词的文本。

OpenAI表示,新模型将产生更少的错误答案,更少地偏离谈话轨道,更少地谈论禁忌话题,甚至在许多标准化测试中比人类表现得更好。例如,GPT-4模拟律师考试的成绩在考生中排名前10%左右,在SAT阅读考试中排名前7%左右,在SAT数学考试中排名前11%左右。

虽然GPT-4更具创造力,并且能够处理更细微的指令,但官方也警告说,这些系统保留了许多与早期语言模型相同的问题,包括编造信息的倾向以及生成暴力和有害文本的能力,尽管如此,用户们还是为之振奋。

北京商报记者向GPT-4和GPT-3.5中输入“帮我出一个北京一日游的攻略”的问题。

由输入结果可知,在北京一日游的攻略中GPT-4明显时间安排与提醒更加细致贴心,内容上更丰富清晰,而同时GPT-3.5出现了序号错误。

再向二者输入第二个问题“解释一下幂函数”。

从答案可以看出,在幂函数的介绍上,GPT-4与GPT-3.5相比清晰地将定义、举例、应用表达出来,更具有逻辑性。

接着再同时输入“哈利波特是怎样的魔法师”。

在对哈利波特的介绍中,将“父母在他很小时被黑巫师伏地魔杀害”的内容表述成“年幼失去双亲”,显然GPT-4在语言上更加精炼。

GPT-4在不断学习之下,ChatGPT也变得更为聪明、准确。GPT-4相较于GPT-3.5更加具备规范和精确的语言能力,同时也具备更精确的知识。

据报道,GPT-4多项测试超越90%的人类,这不免成为人们关注的焦点。

北京光大银行(601818)一位计算机程序员向北京商报记者表示,目前对于银行这种要求严谨精确的系统来讲,短期内程序员是不会被机器替代的,机器还是存在更多的不确定性。在银行一直使用的是较为“老”而稳定的程序。

GPT-4的更新让大众受益,同样ChatGPT的开发者OpenAI在GPT-4的研发上已经取得了不少进展,各种猜测纷纭,有说其训练参数高达100万亿的,有说微软已经把GPT-4纳入最新版本的必应中。

本周,AI行业或将迎来“疯狂星期四”。百度此前宣布,将于3月16日(周四)发布旗下首款类ChatGPT产品“文心一言”。微软也透露,本周内将推出拥有更高性能的GPT-4。虽然目前尚未透露具体发布时间,不过考虑到3月16日也是微软的AI活动日,活动主题为“用人工智能重塑生产力”,而公司CEO将上台演讲,外界普遍认为当天这款产品将正式亮相。

北京商报记者 陶凤 实习记者 李想

(责任编辑:王治强 HF013)
看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    和讯特稿

      推荐阅读

        【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。