浪潮信息Owen ZHU:大模型百花齐放,算力效率决定速度

2023-09-01 10:21:37 来源:电子创新网


(资料图片仅供参考)

与狭义的人工智能相比,通用人工智能通过跨领域、跨学科、跨任务和跨模态的大模型,能够满足更广泛的场景需求、实现更高程度的逻辑理解能力与使用工具能力。2023年,随着 LLM 大规模语言模型技术的不断突破,大模型为探索更高阶的通用人工智能带来了新的曙光。通用人工智能进入了快速发展期,在中国,大模型已经呈现出百花齐放的态势,各种大模型层出不穷。

要想在"百模争秀"的时代占得先机,AI开发团队需要着力化解算力、算法、数据层面的巨大挑战,而开发效率和训练速度是保障大模型市场竞争力的核心关键因素,也是未来的核心发力点。近日,浪潮信息人工智能与高性能应用软件部 AI 架构师Owen ZHU参与首届由CSDN、《新程序员》联合主办的NPCon大会,发表重要技术演讲,分享面向新一轮AIGC产业革命,AI大模型的算力系统解决之道,并强调算力、算法、数据和系统架构等多个方面的综合优化对大模型训练到了至关重要的作用。

以下为Owen ZHU在NPCon大会的演讲实录整理:

"百模争秀"时代的算力瓶颈

大模型研发的核心技术是由预训练与Alignment组成的,第一部分就是预训练,需要用大量的数据使模型收敛速度更快、性能更好。第二部分则是Alignment,Alignment不完全等于强化学习,其通过使用多种方式/策略优化模型输出,让AI在和人的交流反馈中学会如何沟通表达,这两部分是提升大模型质量的核心要素。

目前来看,模型基础能力取决于数据、模型参数量和算力。模型参数量越大、投入的训练数据越大,模型泛化能力越强。由于资源限制,在两者不可兼得的时候,应该如何进行取舍呢?OpenAI的研究结论认为,与增加数据量相比,先增大模型参数量受益则会更好,用一千亿的模型训练两千亿的Token和两千亿模型训练一千亿的Token,后者的模型性能会更高。

由此可见,参数量是衡量模型能力的一个重要指标,当模型参数量增长超过一定阈值时,模型能力表现出跃迁式的提升,表现出来语言理解能力、生成能力、逻辑推理能力等能力的显著提升,这也就是我们所说的模型的涌现能力。

模型规模多大能产生涌现能力呢?现在来看,百亿参数是模型具备涌现能力的门槛,千亿参数的模型具备较好的涌现能力。但这并不意味着模型规模就要上升到万亿规模级别的竞争,因为现有大模型并没有得到充分训练,如GPT-3的每个参数基本上只训练了1-2个Token,DeepMind的研究表明,如果把一个大模型训练充分,需要把每个参数量训练20个Token。所以,当前的很多千亿规模的大模型还需要用多10倍的数据进行训练,模型性能才能达到比较好的水平。

无论是提高模型参数量还是提升数据规模,算力依旧是大模型能力提升的核心驱动力:需要用"足够大"的算力,去支撑起"足够精准"模型泛化能力。当前大模型训练的算力当量还在进一步增大,从GPT-3到GPT-4算力当量增长了68倍。算力当量越大,交叉熵越小,模型能力越强。随着训练的token数、模型参数、计算量的增加,语言模型的loss在平滑下降,这就意味着大语言模型的精度可以随着计算量、参数规模、token数扩展进一步提升。

标签:

浪潮信息Owen ZHU:大模型百花齐放,算力效率决定速度

2023-09-01

逃出缅甸“妙瓦底”

2023-09-01

煤电“三改联动”完成“十四五”目标八成以上

2023-09-01

一地开展18天“病媒生物”大消杀!官方:别怕

2023-09-01

欧联32强+分档全部出炉!红军罗马一档 海鸥三档,今晚19点抽签

2023-09-01

光大银行自2023年9月1日起调整零售及公司人民币存款挂牌利率调整后的挂牌利率如下

2023-09-01

朝花夕拾读后感100字藤野先生(朝花夕拾读后感100字)

2023-08-31

kissmethruthephone 歌词_kiss me thru the phone

2023-08-31

郑州市金水河分洪工程顶管全线贯通

2023-08-31

东兴证券给予中国交建强烈推荐评级 2022年年报点评:资产优化进行中 海外发展可期

2023-08-31

支持国产!深圳一公司发公告:员工买华为Mate 60系列补贴1000元

2023-08-31

江西省财政厅下达2023年省对设区市本级均衡性转移支付资金15亿元

2023-08-31

275个车位!闵行这个公园地下停车库对外开放

2023-08-31

【美网】朱琳大爆发,拿下澳网冠军将战本西奇

2023-08-31

金塔县:“走南闯北”诚意满满 招商引资“硕果盈枝”

2023-08-31

中国8月制造业PMI为49.7%,比上月上升0.4个百分点

2023-08-31

现代评剧《沙海情》在沈阳上演

2023-08-31

3小时内可达!贵阳至南宁高速铁路今日全线贯通运营

2023-08-31

比亚迪“史上最大”并购!半年净利润增两倍

2023-08-31

莫杜·迪亚涅(关于莫杜·迪亚涅简述)

2023-08-31

加大市场推广力度 华致酒行持续提升酒水流通领域国内市场领先地位

2023-08-30

平安中报点评:暖意明显,核心数据连跌三年后现拐点式增长!

2023-08-30

河北师范大学专业代码(河北师范大学专业)

2023-08-30

香港渣打马拉松参赛名额将恢复至疫前规模

2023-08-30

崧盛股份:户外照明业务快速增长 展现LED照明行业的韧性和潜力

2023-08-30

英国学签爆发!一年下发50万张,比疫情前大涨108%!盘点中国留学生最多的英国大学TOP10

2023-08-30

LPGA再获季军殷若宁自信出战本周波特兰精英赛 林希妤调整推杆期待佳绩

2023-08-30

深圳南山宝能城花园260套公寓打包拍卖 起拍价25.98亿元

2023-08-30

盱眙 盱眙怎么读

2023-08-30

歌尔股份半年营收451亿 精密零组件毛利率下降

2023-08-30

Copyright ©  2015-2022 西方频道网版权所有  备案号:沪ICP备2020036824号-7   联系邮箱:5 626 629 @qq.com