微软推出微型AI自动编码模型phi-1,击败 GPT-3.5-每日时讯
编程客栈()6月26日 消息:微软的人工智能研究人员发布了一种新的、轻量级的代码生成模型 phi-1,并且其性能优于 ChatGPT 背后的大型语言模型 GPT-3.5。
据了解, 这个基于 Transformer 的模型仅拥有13亿个参数,相比之下,Codex拥有120亿个参数。
【资料图】
微软的研究人员仅用了四天时间就使用 Nvidia 的8个 A100芯片来训练 phi-1。该模型使用来自网络的60亿个token以及使用 GPT-3.5生成的另外10亿个token进行训练。
在性能方面,phi-1在HumanEval基准测试中获得了50.6% 的 pass@1准确率。尽管模型小得多,但微软模型击败了 Hugging Face 和 ServiceNow 的 StarCoder (33.6%)、OpenAI 的 GPT-3.5(47%) 和谷歌的 PaLM2-S 编程客栈(37.6% ) 。
在MBPP pass@1测试中,phi-1表现更好,取得了55.5% 的分数。上述许多模型尚未发布该基准测试的结果,但 WizardLM 的WizardCoder在本月早些时候进行的测试中得分为51.5%。WizardCoder 是一个150亿个参数模型,而 phi-1的参数模型为13亿个。
高质量数据带来差异
微软的研究人员认为,正是“高质量数据的力量”让 phi-1表现如此出色。为了说明这一点,研究人员将他们模型的论文js命名为“教科书就是你所需要的”。
他们写道:“正如一本全面、精心制作的教科书可以为学生提供掌握新学科所需的知识一样,我们的工作展示了高质量数据在磨练语言模型在代码生成任务中的熟练程度方面的显着影响。” 。
“通过制作‘教科书质量’数据,我们能够训练出一个模型,尽管模型大php小缩小了10倍,数据集大小缩小了100倍,但在编码基准(例如 HumanEval 和 MBPP)上,该模型超越了几乎所有开源模型。”
与其他可用的编码模型相比,Phi-1仅限于 python 编javascript码。他们表示,该模型的局限性还在于它缺乏大型模型的特定领域知识,例如使用特定 API 进行编程。
为了扩展他们的工作,微软的研究人员建议使用 GPT-4而不是 GPT-3.5来生成用于模型训练的合成数据。
研究人员还将寻求提高数据集的多样性和非重复性,尽管该团队表示,他们必须找到方法“在数据生成过程中注入随机性和创造力,同时仍然保持示例的质量和连贯性。”
关键词:
您可能也感兴趣:
为您推荐
环球关注:新疆和静:巴音布鲁克不夜城开园 释放“夜”态新活力
西藏矿业(000762.SZ)与倍杰特(300774.SZ)子公司等签订项目投资协议书 环球热推荐
考幼师资格证需要什么条件 初中学历考幼师资格证需要什么条件 今日热文
排行
最近更新
- 微软推出微型AI自动编码模型phi-1,击败 GPT-3.5-每日时讯
- 缉毒民警讲述生死时刻: “会怕但绝不退缩!”
- 视频丨株洲市学前教育行业协会托育服务分会成立 环球滚动
- 呵护求学就业梦想 以“兴才”助力“成才”
- 保力新(300116.SZ):目前开发的新产品主要为铝壳全极耳大圆柱...
- 华米Amazfit Pop 3R智能手表正式发布!6月29日开售_视点
- 工商银行好运锦鲤金条50克价格今天多少一克(2023年06月26日...
- 西门子风机质量问题“带崩”A股风电概念 振江股份:对公司没...
- 环球讯息:中国银行兔年生肖金条价格今天多少一克(2023年06...
- 石家庄藁城:和美乡村托起群众幸福生活|环球今日报
- 港股26日跌0.51% 收报18794.13点 天天速讯
- 通讯!第19届杭州亚运会5克和30克银质纪念币多少钱(2023年06...
- 【独家】电报解读|白浙特高压全容量投产 特高压进入新时代
- 全球热点评!人民银行:5月银行间货币市场成交共计170.7万亿元
- 端午上海市对外交通累计发送旅客186.82 万人次_热消息
- E事厅 | 直降4万 全新皓影e:PHEV就值得买了吗?_全球热资讯
- 当前信息:中央某部委干部受贿400余万元 庭审成为北京二中院...
- 自游家NV换壳复活,李一男的造车梦竟然还有续集?
- 2023中国家庭帆船赛三亚站7月1日开赛 全球热文
- 每日消息!塞尔达传说荒野之息玩法小技巧汇总(塞尔达传说荒野...
- 严守耕地红线,端牢中国饭碗
- 粤港澳大湾区车展新能源车盘点,腾势N7、小鹏G6等
- 【世界播资讯】高合需要撕掉“土豪”标签
- 朗坤环境(301305):收到中标通知书 焦点热文
- 贴好瓷砖了还能装推拉门吗图片(贴好瓷砖了还能装推拉门吗)-...
- 世界快讯:一博科技业绩承压:核心盈利指标连年下滑,英伟达概...
- 提升服务贸易还有大空间(人民时评)-最新快讯
- 人民银行:5月商业汇票承兑发生额2.3万亿元
- 押对日股的基金经理警告:下半年涨势或降温 当前通讯
- 北大荒集团与生态环境部签署合作共建框架协议