微軟推出微型AI自動(dòng)編碼模型phi-1，擊敗 GPT-3.5|環(huán)球關(guān)注

2023-06-26 13:29:43　　來源：站長之家

編程客棧（）6月26日消息:微軟的人工智能研究人員發(fā)布了一種新的、輕量級的代碼生成模型 phi-1，并且其性能優(yōu)于 ChatGPT 背后的大型語言模型 GPT-3.5。

(資料圖片)

據(jù)了解，這個(gè)基于 Transformer 的模型僅擁有13億個(gè)參數(shù)，相比之下，Codex擁有120億個(gè)參數(shù)。

微軟的研究人員僅用了四天時(shí)間就使用 Nvidia 的8個(gè) A100芯片來訓(xùn)練 phi-1。該模型使用來自網(wǎng)絡(luò)的60億個(gè)token以及使用 GPT-3.5生成的另外10億個(gè)token進(jìn)行訓(xùn)練。

在性能方面，phi-1在HumanEval基準(zhǔn)測試中獲得了50.6% 的 pass@1準(zhǔn)確率。盡管模型小得多，但微軟模型擊敗了 Hugging Face 和 ServiceNow 的 StarCoder （33.6%）、OpenAI 的 GPT-3.5(47%) 和谷歌的 PaLM2-S 編程客棧(37.6% ) 。

在MBPP pass@1測試中，phi-1表現(xiàn)更好，取得了55.5% 的分?jǐn)?shù)。上述許多模型尚未發(fā)布該基準(zhǔn)測試的結(jié)果，但 WizardLM 的WizardCoder在本月早些時(shí)候進(jìn)行的測試中得分為51.5%。WizardCoder 是一個(gè)150億個(gè)參數(shù)模型，而 phi-1的參數(shù)模型為13億個(gè)。

高質(zhì)量數(shù)據(jù)帶來差異

微軟的研究人員認(rèn)為，正是“高質(zhì)量數(shù)據(jù)的力量”讓 phi-1表現(xiàn)如此出色。為了說明這一點(diǎn)，研究人員將他們模型的論文js命名為“教科書就是你所需要的”。

他們寫道:“正如一本全面、精心制作的教科書可以為學(xué)生提供掌握新學(xué)科所需的知識一樣，我們的工作展示了高質(zhì)量數(shù)據(jù)在磨練語言模型在代碼生成任務(wù)中的熟練程度方面的顯著影響?！?。

“通過制作‘教科書質(zhì)量’數(shù)據(jù)，我們能夠訓(xùn)練出一個(gè)模型，盡管模型大php小縮小了10倍，數(shù)據(jù)集大小縮小了100倍，但在編碼基準(zhǔn)（例如 HumanEval 和 MBPP）上，該模型超越了幾乎所有開源模型?！?/p>

與其他可用的編碼模型相比，Phi-1僅限于 python 編javascript碼。他們表示，該模型的局限性還在于它缺乏大型模型的特定領(lǐng)域知識，例如使用特定 API 進(jìn)行編程。

為了擴(kuò)展他們的工作，微軟的研究人員建議使用 GPT-4而不是 GPT-3.5來生成用于模型訓(xùn)練的合成數(shù)據(jù)。

研究人員還將尋求提高數(shù)據(jù)集的多樣性和非重復(fù)性，盡管該團(tuán)隊(duì)表示，他們必須找到方法“在數(shù)據(jù)生成過程中注入隨機(jī)性和創(chuàng)造力，同時(shí)仍然保持示例的質(zhì)量和連貫性。”

關(guān)鍵詞：

相關(guān)新聞

微軟推出微型AI自動(dòng)編碼模型phi-1，擊敗 GPT-3.5|環(huán)球關(guān)注(2023-06-26 13:29:43)
當(dāng)前快報(bào):感應(yīng)開關(guān)市場現(xiàn)狀感應(yīng)開關(guān)行業(yè)未來前景趨勢分析(2023-06-26 13:46:00)
中國大唐集團(tuán)有限公司2023年享受政府特殊津貼人員推薦人選公示_環(huán)球快消息(2023-06-26 13:25:27)
北京市東城區(qū)培新小學(xué)積極探索綜合實(shí)踐活動(dòng)課程|快資訊(2023-06-26 13:28:19)
今日pd950鈀金回收價(jià)格查詢（2023年06月26日）_環(huán)球最資訊(2023-06-26 13:27:10)
今日看點(diǎn)：原神vicineko八重神子強(qiáng)行打撲克又疼又叫福利本子404觀看地址(2023-06-26 13:36:44)
焦點(diǎn)訊息：按揭保費(fèi)有望調(diào)低　香港市民首置換樓負(fù)擔(dān)減少(2023-06-26 13:27:38)
焦點(diǎn)要聞：多點(diǎn)二次遞表港交所：業(yè)務(wù)重心從電商服務(wù)逐漸轉(zhuǎn)向零售云，過半收入來自物美(2023-06-26 13:29:45)
銷量屢創(chuàng)新高，埃安高端化承壓，或許破局只是時(shí)間問題？(2023-06-26 13:22:41)
全球熱門:拳頭公司發(fā)布《無畏契約》中新增特工“Deadlock”玩法演示預(yù)告(2023-06-26 13:30:57)
廣州考古發(fā)現(xiàn)商時(shí)期文化遺存體現(xiàn)中原夏商禮制南漸微頭條(2023-06-26 13:38:50)
中國擬立糧食安全保障法提高防范和抵御糧食安全風(fēng)險(xiǎn)能力(2023-06-26 13:41:14)
95歲李嘉誠抄底被斥趁火打劫龍光合景泰富“拼命”抵抗(2023-06-26 13:41:42)
海博思創(chuàng)沖刺科創(chuàng)板：儲能系統(tǒng)收入復(fù)合年增長超219%，啟明創(chuàng)投、IDG為股東_環(huán)球熱門(2023-06-26 13:45:37)
lol的yy開黑頻道_lol英雄聯(lián)盟YY開黑頻道 572586 熱資訊(2023-06-26 13:41:35)
信息：什么素食能代替肉的營養(yǎng)(2023-06-26 13:22:09)
天天簡訊:?普京亂局落幕后首露面有“玄機(jī)”？西方專家指瓦格納將落此下場(2023-06-26 13:40:53)
今日看點(diǎn)：心之全蝕_全蝕狂愛MKV_720P 高清下載(2023-06-26 13:27:29)
朝鮮外務(wù)省副相會(huì)見俄羅斯大使，討論了這些問題(2023-06-26 13:24:44)
? “你好，鄰居！共享幸福時(shí)光”——城西社區(qū)搞起鄰里節(jié)(2023-06-26 13:40:14)
【全球獨(dú)家】《魔獸世界》靈魂獸位置全部坐標(biāo)(2023-06-26 13:26:48)
“日子好了，吼秦腔的氣力更足了”(2023-06-26 13:24:53)
天天快消息！外觀和動(dòng)力均有升級新款吉利星瑞申報(bào)圖(2023-06-26 13:31:07)
抖音外賣“熄火”：放下1000億GMV目標(biāo)(2023-06-26 13:18:41)
2023斯諾克冠軍聯(lián)賽（排名賽）賽事停播及用戶權(quán)益調(diào)整公告(2023-06-26 13:20:22)
武漢拍地：江夏城投底價(jià)5.84億競得紙坊P(2023)023號涉宅地(2023-06-26 13:26:01)
李嘉誠家族抄底內(nèi)地房企項(xiàng)目，項(xiàng)目開發(fā)商之一已成被執(zhí)行人(2023-06-26 13:40:57)
今日熱搜：深圳通報(bào)百富興大廈異響振動(dòng)事件后續(xù)：房屋基礎(chǔ)薄弱，將全面加固(2023-06-26 13:20:47)
【世界速看料】無錫靈活就業(yè)人員社保繳費(fèi)基數(shù)2023標(biāo)準(zhǔn)，公布如下(2023-06-26 13:34:56)
狗仔曝蔡徐坤一夜情女主正臉照手持打胎檔案疑實(shí)錘焦點(diǎn)速讀(2023-06-26 13:31:17)

圖閱

微軟推出微型AI自動(dòng)編碼模型ph

當(dāng)前快報(bào):感應(yīng)開關(guān)市場現(xiàn)狀

中國大唐集團(tuán)有限公司2023年享

北京市東城區(qū)培新小學(xué)積極探索

今日pd950鈀金回收價(jià)格查詢（2

今日看點(diǎn)：原神vicineko八重神
焦點(diǎn)訊息：按揭保費(fèi)有望調(diào)低　

焦點(diǎn)要聞：多點(diǎn)二次遞表港交所

銷量屢創(chuàng)新高，埃安高端化承壓

全球熱門:拳頭公司發(fā)布《無畏

廣州考古發(fā)現(xiàn)商時(shí)期文化遺存

中國擬立糧食安全保障法提高

每日推薦

95歲李嘉誠抄底被斥趁火打劫龍光合景

中鋼網(wǎng)其他新聞資訊頻道提供鋼材行業(yè)其他新聞資訊，中鋼網(wǎng)-免保證金、
海博思創(chuàng)沖刺科創(chuàng)板：儲能系統(tǒng)收入復(fù)合年增

2022年?duì)I收超26億元、凈利潤超1 82億元。
lol的yy開黑頻道_lol英雄聯(lián)盟YY開黑頻道 5

1、LOL小黑房開黑各種激情,各種不坑爹神一般的隊(duì)友!DOTA小黑房開黑請
信息：什么素食能代替肉的營養(yǎng)

關(guān)于什么素食能代替肉的營養(yǎng)的內(nèi)容,包含素食主義者用什么代替肉的營養(yǎng)
天天簡訊:?普京亂局落幕后首露面有“玄機(jī)

由瓦格納集團(tuán)發(fā)動(dòng)的“內(nèi)戰(zhàn)”戲劇性地在短短廿四小時(shí)間戛然落幕，其后俄
今日看點(diǎn)：心之全蝕_全蝕狂愛MKV_720P 高

我下有心之全蝕的電影，是用迅雷下載的，一個(gè)小時(shí)五十多分鐘吧。你可以
朝鮮外務(wù)省副相會(huì)見俄羅斯大使，討論了這些

報(bào)道稱，雙方就朝俄關(guān)系問題和共同關(guān)心的地區(qū)及國際形勢問題交換了意見
? “你好，鄰居！共享幸福時(shí)光”——城西

本報(bào)訊（YMG全媒體記者姜曉通訊員王德源劉曉龍柳喜鵲?攝影報(bào)道）清洋
【全球獨(dú)家】《魔獸世界》靈魂獸位置全部坐

魔獸世界靈魂獸是游戲中的怪物之一，這個(gè)怪物是比較好抓到的，這是非常
“日子好了，吼秦腔的氣力更足了”

秦腔讓移民群眾精神文化生活豐富多彩。夏日傍晚，羅山腳下的吳忠市紅寺