GPT-4为8x2200亿混合模型_世界消息

日期：2023-06-24 04:38:20 来源：机器之心

(资料图片仅供参考)

机器之心报道

编辑：吴昕

George Hotz：除了苹果之外，大部分公司保密的原因都不是在隐藏什么黑科技，而是在隐藏一些 ‍「不那么酷」的东西。

「GPT-4 的参数量高达 100 万亿。」相信很多人还记得这个年初刷屏的「重磅」消息和一张被病毒式传播的图表。

不过很快，OpenAI 的 CEO Sam Altman 就出来辟谣，证实这是一条假消息，并表示，「关于 GPT-4 的谣言都很荒谬。我甚至不知道这从何而起。」

实际上，许多人相信并传播这样的谣言是因为近年来 AI 社区不断在增加 AI 模型的参数规模。谷歌在 2021 年 1 月发布的 Switch Transformer 就把 AI 大模型参数量拉高到了万亿。在此之后，很多机构也陆续推出了自己的万亿参数大模型。据此，人们有充分的理由相信，GPT-4 将是一个万亿参数的巨量模型，100 万亿参数也不是不可能。

虽然 Sam Altman 的辟谣帮我们去掉了一个错误答案，但他背后的 OpenAI 团队一直对 GPT-4 的真实参数量守口如瓶，就连 GPT-4 的官方技术报告也没透露任何信息。

直到最近，这个谜团疑似被「天才黑客」乔治・霍兹（George Hotz）捅破了。

乔治・霍兹因 17 岁破解 iPhone、21 岁攻陷索尼 PS3 而闻名，目前是一家研发自动驾驶辅助系统的公司（）的老板。

最近，他接受了一家名为 Latent Space 的 AI 技术播客的采访。在采访中，他谈到了 GPT-4，称 GPT-4 其实是一个混合模型。具体来说，它采用了由 8 个专家模型组成的集成系统，每个专家模型都有 2200 亿个参数（比 GPT-3 的 1750 亿参数量略多一些），并且这些模型经过了针对不同数据和任务分布的训练。

在这段播客播出之后，PyTorch 创建者 Soumith Chintala 表示自己似乎听过同样的「传闻」，很多人可能也听过，但只有 George Hotz 在公开场合将其说了出来。

「混合模型是你在无计可施的时候才会考虑的选项，」George Hotz 调侃说，「混合模型的出现是因为无法让模型的参数规模超过 2200 亿。他们希望模型变得更好，但如果仅仅是训练时间更长，效果已经递减。因此，他们采用了八个专家模型来提高性能。」至于这个混合模型是以什么形式工作的，George Hotz 并没有详细说明。

为什么 OpenAI 对此讳莫如深呢？George Hotz 认为，除了苹果之外，大部分公司保密的原因都不是在隐藏什么黑科技，而是在隐藏一些「不那么酷」的东西，不想让别人知道「只要花 8 倍的钱你也能得到这个模型」。

对于未来的趋势，他认为，人们会训练规模较小的模型，并通过长时间的微调和发现各种技巧来提升性能。他提到，与过去相比，训练效果已经明显提升，尽管计算资源没有变化，这表明训练方法的改进起到了很大作用。

目前，George Hotz 关于 GPT-4 的「爆料」已经在推特上得到了广泛传播。

有人从中得到了灵感，声称要训练一个 LLaMA 集合来对抗 GPT-4。

还有人说，如果真的像 George Hotz 说的那样，GPT-4 是一个由 8 个 2200 亿参数的专家模型组合的混合模型，那很难想象背后的推理成本有多高。

需要指出的是，由于 George Hotz 并未提及消息来源，我们目前无法判断以上论断是否正确。有更多线索的读者欢迎在评论区留言。

George Hotz 采访内容。GPT-4 相关内容在 49:00 前后。视频来源：/watch?v=K5iDUZPx60E&t=3030s

参考链接：/soumithchintala/status/1671267150101721090

©THE END

转载请联系本公众号获得授权

投稿或寻求报道：content@

标签：

上一篇：世界速讯：2023郑州福华北街社区卫生服务中心（郑州市福华北街卫生服务中心）

下一篇：最后一页

投资

精彩推送

GPT-4为8x2200亿混合模型_世界消息

国际奥委会审议通过米兰冬奥会新竞赛小项名称和赛制_世界观点

一跨境赌博团伙被昆明警方“团灭”，4家“问题”大众舞厅被查

房贷“降息”：央行下调5年期以上LPR至4.2%

朋友圈怎么设置分组 微信怎么批量分组好友管理

热评丨“端午+”，让传统佳节推陈出新_每日看点

【天天新要闻】智通ADR统计 | 3月25日

夏至丨流光半夏 美好日长

全球快播：红米k60怎么分屏一半一半

入职体检_员工入职体检项目-天天聚看点

环球热点评！2023全球数字经济大会将于7月在京举行

热消息：中船收购德企燃气轮机业务

以“荔”为媒！东莞人保财险助“荔”乡村振兴|世界观点

株洲市渌口区：局长带队开展培训机构专项治理工作检查 环球视点

全球观察：大板车务段为端午“保驾护航”

【天天新要闻】智通ADR统计 | 3月25日

在家门口看明星演唱会，这场帐篷音乐节引爆端午假期|天天观焦点

吃霸王餐_网红姜涛在韩国饭店被扣 竟因饭菜太贵不愿付钱

全球滚动:打工人的愤怒！推特员工发起集体诉讼，要求兑现数千万美元奖金

鸿海董事长刘扬伟：正全力发展量子电脑，目标在2025年推出 全球热讯

中国银行董事长葛海蛟会见法国欧安诺集团首席执行官菲利普·克诺赫

男生卖粽子玩诗词接龙：答对一句诗词减0.5元，全对赢得免费粽

天天快看点丨脚突然变得很臭跟身体有什么关系_脚突然变臭是体虚吗

3民警先后下水5分钟救回落水父女|天天热点评

荨麻疹忌口食物有哪些_荨麻疹忌口 全球独家

【环球播资讯】四川省2023年普通高等学校艺术体育类招生专业统一考试成绩录取控制分数线确定

elies 腭裂手术需要住院几天）_全球快报

战舰猎手视频解说 战舰猎手攻略

中方代表在人权理事会敦促日本就核污染水问题正视国际社会关切

北京市十一学校石景山实验中学一期工程竣工，已具备开学条件_当前关注

四川成都大学有哪些大学_四川大学锦江学院怎么样 世界热点

股市退市如火如荼，“劣质”基金也须加速出清 最新快讯

拉萨市数字经济产业招商会在京举办

天天观天下！可以褥羊毛的app_褥羊毛最好的app是哪个

生活是一面镜子唯美句子_生活是一面镜子

2023年光器件概念上市公司名单一览（6月21日） 当前关注

环球看点！公主岭市积极构建现代化交通运输体系

每日星座运势查询每天看2023-6-23 微头条

【我们的节日·端午节】新香坊街道长江路社区开展“邻里守望情暖端午 文明节俭从我做起”主题宣传活动 全球短讯

手机支付宝怎么用建行龙卡支付功能

于晓光发文为秋瓷炫打call：你的努力大家都感受得到

国网敦化市供电公司工会：用心用情为职工群众解忧-环球快消息

1039报关方式（1039报关是什么意思）-全球看热讯

全球今头条！小米65w充电器支持pd协议吗

赵岩：借力城市流量，电商扬帆出海_环球聚看点

记者：曼联预计今天5000万镑外加500万镑浮动报价芒特 天天通讯

国乒收好消息！孙颖莎获单打资格，林高远得到重用，身兼3项冲3冠_天天看热讯

陕西首台无人驾驶农机投入夏播作业

华脉科技拟借道定增易主，市场豪赌AI资产注入，实控人“如意算盘”能否如愿？|要闻

互太纺织(01382.HK)公布年度业绩：营收超50亿港元，纯利跌53.1%至2.69亿港元|当前焦点

焦点速递！林依轮儿子变形记三个男生_林依轮儿子

保利水管和天力水管哪个好（天力水管好不好） 热点

世界实时：北京卫视《梦中的那片海》音乐女孩救死扶伤

世界视点！辽宁大连:领导包案惩治微腐败

妇女“两病筛查”进行中！西渡街道为女性健康保驾护航！

自治区扫黑除恶斗争领导小组召开2023年第一次会议 不断夺取常态化扫黑除恶斗争新胜利

贵州可以买驾驶证吗 贵州的驾驶证 全球热点

朋友圈怎么设置分组微信怎么批量分组好友管理

夏至丨流光半夏美好日长

株洲市渌口区：局长带队开展培训机构专项治理工作检查环球视点

吃霸王餐_网红姜涛在韩国饭店被扣竟因饭菜太贵不愿付钱

鸿海董事长刘扬伟：正全力发展量子电脑，目标在2025年推出全球热讯

荨麻疹忌口食物有哪些_荨麻疹忌口全球独家

战舰猎手视频解说战舰猎手攻略

四川成都大学有哪些大学_四川大学锦江学院怎么样世界热点

股市退市如火如荼，“劣质”基金也须加速出清最新快讯

2023年光器件概念上市公司名单一览（6月21日）当前关注

【我们的节日·端午节】新香坊街道长江路社区开展“邻里守望情暖端午文明节俭从我做起”主题宣传活动全球短讯

记者：曼联预计今天5000万镑外加500万镑浮动报价芒特天天通讯

保利水管和天力水管哪个好（天力水管好不好）热点

自治区扫黑除恶斗争领导小组召开2023年第一次会议不断夺取常态化扫黑除恶斗争新胜利

贵州可以买驾驶证吗贵州的驾驶证全球热点