OpenAI为节约成本偷工减料?史上最强大模型GPT-4“变笨”引发全网讨论,输出质量被质疑明显下降-每日关注 - 行业资讯 -

当前位置:首页  >  行业资讯  > 正文

OpenAI为节约成本偷工减料?史上最强大模型GPT-4“变笨”引发全网讨论,输出质量被质疑明显下降-每日关注

OpenAI为节约成本偷工减料?史上最强大模型GPT-4“变笨”引发全网讨论,输出质量被质疑明显下降-每日关注
2023-06-03 11:36:24 来源:每日经济新闻

如今距离OpenAI于3月中旬推出其最新版本的大型语言模型GPT-4已经有近3个月的时间。这段时间内,尽管全球资本市场对人工智能、大模型和算力的炒作此起彼伏,也有人称赞GPT-4这个版本强大的能力,但却很少有人质疑GPT-4是否真的比此前更早期的版本强大。

近期,网上对GPT-4是否出现退化的质疑声开始涌现出来,越来越多的网友开始表示,GPT-4对复杂程度相似的问题处理结果甚至还不如它的前身GPT-3或GPT-3.5。面对网友的大量质疑,OpenAI官方开发者推广大使回应称,GPT-4处于静止状态,且自3月 14日发布以来没有做过改动。

可能突破万亿参数的GPT-4,被OpenAI“狂吹”

根据OpenAI自己的说法,GPT-3拥有1750亿个参数,但GPT-4的规模可能会达到数千亿个参数,甚至可能会突破万亿级别。这一规模的提升将有助于提高模型的表现力和泛化能力,使其更能适应各种语言任务,同时也意味着GPT-4接受了更多的数据训练,模型文件中有更多的权重(参数),这也使得它的运行成本更高。


(相关资料图)

此外,GPT-4可以更准确地解决人们的难题,多模态的GPT-4还可以生成、编辑具有创意性或技术性的文章,在高级推理方面的表现超过其前身。当然,正如大家所猜测的那样,微软New Bing的聊天功能确实基于GPT-4。OpenAI称,该模型“比以往任何时候都更具创造性和协作性”,“可以更准确地解决难题”。它可以解析文本和图像输入,尽管它只能通过文本进行响应。

官方表示,GPT-4错误答案更少,而且也会减少偏离话题的可能,也尽可能不会再谈论禁忌话题,甚至在许多标准化测试中比人类表现得都要更好一些。

例如,GPT-4在模拟律师考试的成绩在考生中排名前10%左右,在SAT阅读考试中排名前7%左右,在SAT数学考试中排名前11%左右。相比之下,GPT-3.5在律师考试中的得分一般都是倒数10%左右。当然,它们考个研究生还是没问题的。

图片来源:OpenAI

不少业内人士也对GPT-4的未来应用前景表示看好,称GPT-4的出现将进一步推动AI语言模型领域的发展。作为下一代AI语言模型,GPT-4将会在各方面都得到进一步的改善,包括语言理解、生成、多语种支持等等。同时,GPT-4也将会在各个应用场景中得到广泛应用,为各个行业带来更加高效和智能的解决方案。

有网友4月份就对GPT-4是否退化发出质疑

那么,GTP-4真的如OpenAI自己所称的那样更强大吗?

就在美东时间本周早些时候,Ycombinator上已有网友提出质疑,称“(GPT-4)确实比以前快很多,但它的输出质量更像是GPT-3.5++。GPT-4产生了更多的bug代码,答案也缺乏深度和分析,总体感觉上比以前要糟糕很多。

图片来源:Ycombinator

在上述网友的帖子下方,另一名网友回复称,“是的。在更新之前,GPT(的上一个版本)能毫不费力地解决相当复杂的编程问题,并对非编程问题给出非常微妙且像是经过深思熟虑的答案。如今,GPT-4只能修改一个10行CSS模块中的两行,并再次给出这修改后的10行模块,不仅感到非常吃力,而且给出的答案中有些内容毫无关系……”

还有网友表示,“OpenAI的(最新)模型给我的感觉是100%被削弱了。几个月前我用它(的早期版本)解决了非常复杂的问题(例如编写一个最小的PDF解析器示例),但今天你会因为问了这么复杂的任务被GPT-4‘责备’。”这名网友最后还称,他已经决定取消订阅他的OpenAI会员资格。

图片来源:Ycombinator

在推特上,有网友称把GPT-4的3小时25条对话额度一口气用完了,都没能解决自己的代码问题,最后无奈切换回了GPT-3.5。

图片来源:推特

《每日经济新闻》记者还注意到,网上关于GPT-4是否退化的讨论,其实在1个月前就已经有了。当时有网友在美国版天涯+贴吧平台Reddit上,对GPT-4是否“变笨”发出质疑。这名当时网友称,“在过去几天里,我经历了GPT-4性能的明显下降。它的推理能力已经退化到GPT-3的水平,而且它正在努力完成上个月刚刚为我完成的任务。今晚的性能还是最糟糕的。这是怎么回事?”

图片来源:Reddit

在OpenAI的官方开发者论坛,有网友在4月30日就发帖称,“一周前,我用GPT4为MS飞行模拟器创建了一个非常简单的C#应用程序。这太神奇了,我只(手动)更正了一次。今天我用了同样的提示词,但经过多次修改后GPT-4还是不能正常使用。

图片来源:OpenAI

一时间,关于“GPT-4退化了”、“OpenAI为了节省成本开始偷工减料”等质疑声开始在Ycombinator、Reddit和推特等平台快速蔓延开来。速度如此之快,就连OpenAI官方的开发者推广大使Logan Kilpatrick都出面来公开回应网友的质疑:“API不会在没有我们通知您的情况下更改。

图片来源:推特

在上述推文下方,Logan还回复了网友一些问题,他称,GPT-4自从3月14日发布以来未发生改动。他还表示,GPT-4对于一些提示词给出的回答内容不一致,是由于大模型本身不稳定。不过,针对网页版GPT-4是否被降级过的追问,均未得到其本人的正面回答。

图片来源:推特

另据监管机构NewsGuard的专家分析,OpenAI最新版本的GPT-4大型语言模型在输出信息方面,确实比它的前身GPT-3.5还要糟糕。在今年3月份发布的报告中,NewsGuard就指出,GPT-4不仅在其研究人员的提示下回答了完全虚假的新闻叙述,而且甚至比GPT-3.5回答的内容更差。

标签:

(责任编辑:news01)
精选!第三届全国戏曲(南方片)会演闭幕演出侧记:演绎三国风云 绽放汉剧神韵

精选!第三届全国戏曲(南方片)会演闭幕演出侧记:演绎三国风云 绽放汉剧神韵

第三届全国戏曲(南方片)会演闭幕演出侧记:演绎三国风云绽放汉剧神韵---孙尚香的扮演者、汉剧名家王荔透
06-01 08:00:58
世界微速讯:去超市买肉可以让切片吗?

世界微速讯:去超市买肉可以让切片吗?

可以的。超市买肉,工作人员可以按照客人要求做简单的处理。最普遍的是剁骨头,绞肉糜,如果你需要切片,绞
06-01 07:03:32
财信发展(000838):5月31日北向资金减持400股

财信发展(000838):5月31日北向资金减持400股

5月31日北向资金减持400 0股财信发展。近5个交易日中,获北向资金减持的有4天,累计净减持78 61万股。近20
06-01 05:27:27
近义词在线转换器(不要的近义词是什么)

近义词在线转换器(不要的近义词是什么)

想必现在有很多小伙伴对于不要的近义词是什么方面的知识都比较想要了解,那么今天小好小编就为大家收集了一
06-01 03:23:48
直击泰安天贶不服输拼到底,点球留憾仍获球迷认可,刘金东有话说 热闻

直击泰安天贶不服输拼到底,点球留憾仍获球迷认可,刘金东有话说 热闻

3次落后,3次追平,泰安天贶全队没有放弃。残酷的点球大战,泰安天贶在领先的情况下错失好局,没能笑到最后
06-01 01:44:25
全球资讯:孕育中国高尔夫英才22年 业巡赛携新老伙伴升级“球员至上”服务平台

全球资讯:孕育中国高尔夫英才22年 业巡赛携新老伙伴升级“球员至上”服务平台

在业巡赛官方视频账号推出的系列短片中,有一段50秒钟的回顾视频,标题是“拥有22年历史的业巡赛重新起...
06-01 00:40:39
【独家焦点】抄送文件怎么写_抄送文件格式模板

【独家焦点】抄送文件怎么写_抄送文件格式模板

1、正式文件抄送格式如下图所示:排版规格:题目要求二号宋体字;正文要求三号仿宋体;一般每页排22行,每
05-31 23:26:40
2023年5月30日乙酸钠碳源价格最新行情预测 焦点滚动

2023年5月30日乙酸钠碳源价格最新行情预测 焦点滚动

中国报告大厅2023年5月30日乙酸钠碳源价格最新走势监测显示:河南帆诺净水材料有限公司报价机构,今日乙酸
05-31 22:40:00
“祖冲之号”量子计算云平台发布 接入176比特量子计算机

“祖冲之号”量子计算云平台发布 接入176比特量子计算机

其中,量子创新研究院提供了“祖冲之号”同款量子计算芯片,国盾量子提供了测控设备等硬件设施,承担了...
05-31 21:59:04
惠州综合游乐园“六一”开业

惠州综合游乐园“六一”开业

爱玩是孩子的天性,现在不少孩子沉迷玩手机刷短视频,既伤眼睛又损害专注力,已经成了不少父母的一大烦恼。
05-31 20:57:24
海看股份披露招股书拟于近期在深市发行新股并上市-全球观察

海看股份披露招股书拟于近期在深市发行新股并上市-全球观察

2023年5月31日,海看网络科技(山东)股份有限公司(简称:海看股份)披露招股书,拟于近期在深市发行新股
05-31 20:14:12
家里潮湿怎么办_有什么办法

家里潮湿怎么办_有什么办法

欢迎观看本篇文章,小升来为大家解答以上问题。家里潮湿怎么办,有什么办法很多人还不知道,现在让我们一起
05-31 19:36:56
播报:百年建筑解读:雨天、大考影响程度不一,各地混凝土发运量增减两现

播报:百年建筑解读:雨天、大考影响程度不一,各地混凝土发运量增减两现

一、混凝土产能利用率环比降低0 38个百分点截至本轮调研周期,全国混凝土产能利用率为12 92%,环比上期降低
05-31 18:48:10
qq黄钻的作用是什么_盘点qq黄钻的作用

qq黄钻的作用是什么_盘点qq黄钻的作用

1、它在200元有巨大的专辑空间。2、在您的QQ上显示闪亮的黄色钻石贵族标志。3、使用免费Qzone装饰空间内所
05-31 15:28:21
鲁大师20款手机久用流畅测试,OPPO夺得第一

鲁大师20款手机久用流畅测试,OPPO夺得第一

2023-05-3111:06:01作者:宋均益37、42、39%,这是鲁大师与用户深度访谈后得到的数字。37个月是当下用户平
05-31 15:05:09
水发燃气:部分工厂保持高负荷生产 多板块协同效应逐渐增强

水发燃气:部分工厂保持高负荷生产 多板块协同效应逐渐增强

继2022年全年业绩指标创下历史最佳、2023年一季度营收同比增长超七成后,5月30日,水发燃气(603318 SH)在
05-31 13:55:24
1158万人!今年高校毕业生数量再创历史新高!找工作更难了... 焦点关注

1158万人!今年高校毕业生数量再创历史新高!找工作更难了... 焦点关注

点击下方卡片,关注“CVer”公众号AI CV重磅干货,第一时间送达今天Amusi看到这么一则新闻: 今年高校毕业
05-31 13:47:00
怎么看存款利率调整?

怎么看存款利率调整?

银行3年期、5年期存款利率普遍降至3%以下——怎么看存款利率调整?银行又降息,是继续储蓄还是选择新的...
05-31 13:03:59
中国过年的风俗习惯_过年的风俗有哪些

中国过年的风俗习惯_过年的风俗有哪些

欢迎观看本篇文章,小柴来为大家解答以上问题。中国过年的风俗习惯,过年的风俗有哪些很多人还不知道,现在
05-31 12:59:31
焦点播报:苹果MR发布在即!混合实现概念拉升 虹软科技等大涨

焦点播报:苹果MR发布在即!混合实现概念拉升 虹软科技等大涨

消息面上,市场预计苹果首款MR设备将于2023年6月6日发布。详情
05-31 12:27:30
每日报道:悠闲的样子真可爱!红外相机记录到野生大熊猫活动影像

每日报道:悠闲的样子真可爱!红外相机记录到野生大熊猫活动影像

悠闲的样子真可爱!红外相机记录到野生大熊猫活动影像
05-31 12:22:45
全球即时看!c6诺基亚(c7诺基亚)

全球即时看!c6诺基亚(c7诺基亚)

来为大家解答以上问题,c6诺基亚,c7诺基亚很多人还不知道,现在让我们一起来看看吧!1、也有很多手机品牌
05-31 11:34:17
重量级获奖名单公布!桂林44项成果上榜,创十年新高

重量级获奖名单公布!桂林44项成果上榜,创十年新高

5月30日上午,2023年广西科学技术奖励大会电视在南宁召开,揭晓161项获奖成果。桂林共有44项成果获得2022年
05-31 11:14:00
【世界时快讯】杭州银行:5月30日融券卖出2.79万股,融资融券余额7.64亿元

【世界时快讯】杭州银行:5月30日融券卖出2.79万股,融资融券余额7.64亿元

5月30日,杭州银行(600926)融资买入1173 41万元,融资偿还4624 92万元,融资净卖出3451 51万元,融资余额
05-31 10:49:23
男人50岁后,可以补充雄性激素吗?补多了,真的会变“油腻大叔”

男人50岁后,可以补充雄性激素吗?补多了,真的会变“油腻大叔”

大多数男性在50岁后有明显衰老变化,通过外观可以察觉皮肤松松垮垮,变得粗糙,白头发也越来越多,甚至有明
05-31 10:42:36
拼多多正在赶上阿里?“公域流量”成本差异或是一把钥匙

拼多多正在赶上阿里?“公域流量”成本差异或是一把钥匙

近日,国内几家头部电商企业一季报悉数发布,拼多多一季度收入增速再超阿里、京东。拼多多发布2023年一季度
05-31 10:03:02
立方风控鸟·早报(5月31日)

立方风控鸟·早报(5月31日)

①因借款合同纠纷一案,金科服务起诉金科股份,要求金科股份返还15亿元借款及利息;②新潮能源股东金志昌顺
05-31 09:17:03
天天信息:垂体瘤晚期有得救吗_垂体瘤后期死亡怎么回事

天天信息:垂体瘤晚期有得救吗_垂体瘤后期死亡怎么回事

1、病情分析:垂体瘤晚期死亡往往是因为垂体瘤复发。2、颅内压增高的患者可能出现血压升高、头痛、恶心、呕
05-31 08:48:31
百亿光伏项目落户四川德阳 计划年产大尺寸硅片25亿片 环球报资讯

百亿光伏项目落户四川德阳 计划年产大尺寸硅片25亿片 环球报资讯

原标题:百亿光伏项目落户德阳计划年产大尺寸硅片25亿片四川日报讯(四川日报全媒体记者曹凘源)5月30日,
05-31 08:26:28
《山海经》和神话中的神鸟,是否真实存在?它们都长什么样子?

《山海经》和神话中的神鸟,是否真实存在?它们都长什么样子?

神鸟,是对神话中的鸟类的统称。传说,我国上古时期有十二神鸟,分别是:元凤、王雀、鲲鹏、九凤、朱雀、蛊
05-31 08:12:49

为您推荐

精彩推送