热消息:大语言模型中的涌现现象是不是伪科学?
Datawhale干货
作者:平凡@知乎,诺桑比亚大学,在读博士
(相关资料图)
今天晚上,花了一点儿时间看了两篇文章:
《Emergent Abilities of Large Language Models》[1]
《PROGRESS MEASURES FOR GROKKING VIA MECHANISTIC INTERPRETABILITY》[2]
这两篇讲的都是emergent behavior,即涌现现象。
大规模神经网络下的涌现现象在机器学习中使用大规模神经网络时,由于增加了参数数量、训练数据或训练步骤等因素,出现了定性上的新能力和性质,这些能力和性质在小规模神经网络中往往是不存在的。
第一篇文章举了这个例子,每个图都可以理解为一个任务,横轴是神经网络的规模,而纵轴是准确率,可以理解为模型的性能。
我们拿图一来看,在10的22次方前,这些模型基本上的性能基本上都很稳定在0附近,而在10的22以后,突然在10的24次方上获得了很大的性能提升,在其他的几个任务上都表现出类似的特征。
意想不到的效果第二篇文章更是有趣,我直接把推特一位博主的评论引用在这里:
作者发现,当我们训练用网络计算同余加法 a+b = ? (mod c) 时,网络在某个时间突然获得了 100% 准确率。分析发现,神经网络实际上“顿悟”了使用傅立叶变换来计算同余加法!这个算法可以证明是正确的, 反人类直觉的。
从这俩例子里面我的感受是,只要数据量足够且真实,且模型没有硬错误的前提下,不断的训练说不定真的能够产生一些意想不到的效果。
还有就是我觉得人类现在积累的知识并不少,但是系统的少,零星的多,如果类似ChatGPT这样的大模型可以拿所有的人类已有知识进行不断学习的话,我觉得有很大概率会让它涌现出意想不到的能力。
甚至可能把人类的生产力解放提前很多。
参考
1.https://arxiv.org/pdf/2206.07682.pdf
2.https://arxiv.org/pdf/2301.05217.pdf
标签:
精彩推送
全球信息:丑陋!瑞典名将摔拍又耍赖,林诗栋不受影响,横扫对手晋级16强
丑陋!瑞典名将摔拍又耍赖,林诗栋不受影响,横扫对手晋级16强,马龙,林诗栋,林昀儒,林高远,黄镇廷,法尔...
昆明警方打掉一涉嫌组织运送偷越国(边)境团伙 抓获15人_全球快消息
昆明警方打掉一涉嫌组织运送偷越国(边)境团伙抓获15人---图为警方抓获犯罪嫌疑人。昆明警方供图。中新...
观点:西红柿放保鲜袋再放冰箱可以吗(西红柿不可以用保鲜袋套好进冰箱保鲜)
1、西红柿不可以用保鲜袋套好进冰箱保鲜,西红柿虽然人们普遍将它们存放在冰箱,但仍建议存放在干燥低温...
新闻快讯
X 关闭
X 关闭
新闻快讯
- 热消息:大语言模型中的涌现现象是不是伪科学?
- 宝鸡市公安局经文保部门开展助力"三个年"送奖到一线活动 每日速读
- 全球聚焦:英媒:美国一直密切监听联合国秘书长
- 商业健康险创新渐入佳境-环球播报
- 澳新留学逐步回暖,英澳联申或成新趋势 环球热点评
- 美国泄露机密文件嫌疑人特谢拉首次出庭受审 每日消息
- 2023qq幸福网名昵称精选网名56个(迎来2022年幸福微信网名)_当前观察
- 电脑怎么打字切换中文没反应_电脑怎么打字切换中文 资讯推荐
- 快讯:中电电机: 中电电机2022年年度利润分配方案公告
- 万桥飞架,沿着高速看贵州交通高质量发展
- 【视频】网约车司机疲劳驾驶出车祸致后排乘客死亡 法院:乘客“未系安全带”,平台赔偿责任减轻10%
- 天天滚动:漫话丨广州大事件:从1到133,用时67年!
- 紫砂壶可以泡不同的茶吗_紫砂壶适合泡不同种类的茶吗-天天观天下
- 青木股份跌8% 上市即巅峰超募3亿兴业证券赚8000万_当前热闻
- 游戏主播「超级小桀」收到了任天堂官方送出的礼物|天天微资讯
- 加强少先队组织教育魏城驿学区开展德育实践交流
- 环球视点!今日六大机构货币黄金原油观点分析(2023年4月14日)
- 当前讯息:特斯拉再度降价 Model 3便宜约4.3万 Model Y便宜约4.6万
- 世界新消息丨“农村中小学防溺水安全教育研究”研究报告
- 每日视讯:中基健康产业股份有限公司股票今日停牌,4月17日开市起复牌
- 观焦点:机构:玉米短期区间反弹看待
- 翟欣欣第五次公开征婚?世纪佳缘辟谣|每日热议
- 全球播报:美国印第安纳州一回收厂发生火灾,逾2000名居民被疏散
- 风险因素消除 多家ST公司“摘星脱帽”
- 泰舒达与美多巴合用治疗帕金森病疗效好_泰舒达 天天亮点
- 清蒸南瓜的做法大全_蒸南瓜的做法大全|视焦点讯
- 全球热议:dota2需要加速器吗_dota2加速器哪个好
- 水晶亚克力字_亚克力字价格表|世界简讯
- 每日头条!汲取奋进力量 共话美好未来
- 【绿色中国】绿电供暖成冬奥之城张家口新“靓点”
- 世界速讯:康斯特:公司自产的部分压力传感器正逐步在检测产品中应用
- 港股内房股齐挫 时代中国控股跌超6%、碧桂园、融信中国跌近5%
- 观点:中金公司:“18中金C1”将于4月20日本息兑付及摘牌
- 音悦台关联公司涉多个诉讼纠纷 音悦台关联公司仍有多条老赖信息|环球即时看
- 最资讯丨州城街道开展编织培训活动
- 最新消息:2023年4月13日江苏省氰乙酸价格最新行情预测
- 真空玉米怎么有股馊味_世界看点
- 小米13 Ultra官宣:一英寸可变光圈 天天即时
- 资金缺口是正缺口还是负缺口?资金缺口是什么意思? 全球视讯
- 天天日报丨上海:优化工程建设领域营商环境
- 中国互联网2022年报盘点 全球快看点
- 环球短讯!注意防护!青岛今天受到沙尘回流输送影响,仍有浮尘天气
- 肤色不均怎么调理_肤色不均匀的主要原因:
- 锂电原料暴涨暴跌倒逼产业调整 动力电池退役潮促回收生意大热
- 【播资讯】aigc概念是什么意思 GraphicalAbstract是什么意思
- 【天天播资讯】怎样把记忆力提高 怎么样才能提高记忆力
- 全球今亮点!中巴会否就金砖合作的未来发展进行讨论?外交部回应
- 年增长率近30% 我国算力总规模全球第二
- 2023云南楚雄武定罗婺星球音乐节(时间+地点+门票+阵容)
- 环球资讯:岭南股份最新公告:第三季度净亏损2.49亿元