国产6699视频在线观看_女人爽到喷水的视频大全_亚洲欧美日韩国产视频亚洲欧美综合日韩久久_中文字幕无码久久东京热_av电影中文一区

 
首頁 > 熱點 >
 
 

直指AI發(fā)展兩大瓶頸 北京這份文件給出答案:實施算力伙伴計劃、建設(shè)預(yù)訓(xùn)練語料庫

2023-05-16 12:57:43  來源:科創(chuàng)板日報

《科創(chuàng)板日報》5月16日訊繼表態(tài)“支持頭部企業(yè)打造對標(biāo)ChatGPT的大模型”后,北京市近日公開待定的新措施,直指AIGC發(fā)展中算力、數(shù)據(jù)不足兩大痛點。


(資料圖片僅供參考)

據(jù)北京市政府網(wǎng)站消息,為搶抓大模型發(fā)展機(jī)遇,重視通用人工智能發(fā)展,北京市科委、中關(guān)村管委會制定了《北京市促進(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施(2023-2025年)(征求意見稿)》,公開征集意見時間為2023年5月12日至5月19日。

除了算力、數(shù)據(jù)要素,這些措施還涵蓋了AI發(fā)展的多個關(guān)鍵環(huán)節(jié),包括大模型技術(shù)、AI應(yīng)用、審慎監(jiān)管。

▌實施算力伙伴計劃 新增算力建設(shè)項目

針對算力不足的問題,北京市提出了三項待定舉措:發(fā)展商業(yè)算力、新增算力基建、建設(shè)多云算力調(diào)度平臺。

具體為組織商業(yè)算力定向滿足本市緊迫需求,加強(qiáng)與頭部公有云廠商等市場主體合作,實施算力伙伴計劃,并將新增算力建設(shè)項目納入算力伙伴計劃,加快推動海淀區(qū)“北京人工智能公共算力平臺”,朝陽區(qū)“北京數(shù)字經(jīng)濟(jì)算力中心”等項目建設(shè),建設(shè)統(tǒng)一的多云算力調(diào)度平臺,實現(xiàn)異構(gòu)算力環(huán)境統(tǒng)一管理、統(tǒng)一運營。

其建設(shè)算力基礎(chǔ)設(shè)施的目標(biāo)是支撐千億級參數(shù)量的大型語言模型、多模態(tài)大模型、大規(guī)模精細(xì)神經(jīng)網(wǎng)絡(luò)模擬仿真模型、腦啟發(fā)神經(jīng)網(wǎng)絡(luò)等研發(fā)。

建設(shè)多云算力調(diào)度平臺是為了方便企業(yè)在不同云環(huán)境上無縫、經(jīng)濟(jì)、高效地運行各類AI計算任務(wù)。

值得注意的是,該措施提出要為此建設(shè)北京與河北、天津、山西、內(nèi)蒙古等?。ㄊ校┧懔旱闹边B基礎(chǔ)光傳輸網(wǎng)絡(luò),進(jìn)一步提升平臺對四地算力資源感知能力,探索開展算力交易。

▌中文語料太少怎么辦?將建設(shè)合規(guī)語料庫

目前,國內(nèi)各公司發(fā)展大模型缺乏用于AI訓(xùn)練的大規(guī)模中文語料集,無論高質(zhì)量的還是低質(zhì)量的中文語料集都極端缺乏。

對此,北京市提出,針對目前大模型訓(xùn)練高質(zhì)量中文語料占比過少,不利于中文語境表達(dá)及產(chǎn)業(yè)應(yīng)用的問題,整合現(xiàn)有開源中文預(yù)訓(xùn)練數(shù)據(jù)集和高質(zhì)量互聯(lián)網(wǎng)中文數(shù)據(jù)并進(jìn)行合規(guī)清洗。同時持續(xù)擴(kuò)展高質(zhì)量多模態(tài)數(shù)據(jù)來源,建設(shè)合規(guī)安全的中文、圖文對、音頻、視頻等大模型預(yù)訓(xùn)練語料庫,通過北京國際大數(shù)據(jù)交易所社會數(shù)據(jù)專區(qū)進(jìn)行定向有條件開放。

解決了棘手的數(shù)據(jù)來源問題,數(shù)據(jù)的收集和處理同樣是個昂貴且緩慢的過程,北京市提出要打造“國家數(shù)據(jù)基礎(chǔ)制度先行先試示范區(qū)”,謀劃國家級數(shù)據(jù)訓(xùn)練基地、搭建數(shù)據(jù)集精細(xì)化標(biāo)注眾包服務(wù)平臺,研發(fā)數(shù)據(jù)采集、清洗、標(biāo)注、脫敏、存儲等功能在內(nèi)的數(shù)據(jù)處理工具。

另外,對于數(shù)據(jù)應(yīng)用、數(shù)據(jù)監(jiān)管,北京市均有相關(guān)具體措施,包括加大對政務(wù)、醫(yī)療、科研、自動駕駛等領(lǐng)域數(shù)據(jù)的挖掘利用;確保訓(xùn)練數(shù)據(jù)集的規(guī)范性、加強(qiáng)個人數(shù)據(jù)保護(hù)等。

▌“算力即權(quán)力” 數(shù)據(jù)將成“勝負(fù)手”

當(dāng)下,人工智能已成為新一輪科技熱潮的核心發(fā)力方向。

5月5日中央財經(jīng)委二十屆第一次會議和國常會相繼召開,會議強(qiáng)調(diào),要把握人工智能等新科技革命浪潮。國家發(fā)改委近日表示,要加快發(fā)展數(shù)字經(jīng)濟(jì),重視通用人工智能發(fā)展。

以ChatGPT為代表的AIGC工具開啟了以大為美的人工智能新時代,隨著人工智能生產(chǎn)力被充分激發(fā)、多模態(tài)的興起,以及各種開源、小模型頻頻亮相,巨大的算力消耗能力、海量的數(shù)據(jù)需求已然成為技術(shù)迭代路上的攔路石。

誰能最先突破瓶頸,誰就能成為這輪科技革命的佼佼者。

國盛證券表示,“算力即權(quán)力”,算力是人工智能從玩具向工具的使能者。未來的算力將會呈現(xiàn)出從云端到邊緣梯度分布的格局,云端算力負(fù)責(zé)復(fù)雜科學(xué)計算,大模型運算推理等任務(wù),邊緣側(cè)則憑借隱私、時延與成本三大優(yōu)勢,成為小模型與AI應(yīng)用觸及萬千用戶與場景的通道。

該機(jī)構(gòu)分析師宋嘉吉稱,隨著邊緣算力需求持續(xù)增加,模組作為邊緣算力的最佳載體,將成為AI的毛細(xì)血管,邊緣IDC也將為城域級算力建設(shè)打開全新空間,他列出了下列關(guān)注方向:

1)光通信:新易盛、天孚通信、中際旭創(chuàng)、太辰光、德科立、華工科技;

2)云算力:光環(huán)新網(wǎng)、奧飛數(shù)據(jù)、數(shù)據(jù)港、潤澤科技;

3)邊緣算力:美格智能、廣和通、龍宇股份;

4)服務(wù)器&交換機(jī):中興通訊、紫光股份、銳捷網(wǎng)絡(luò);

5)核心網(wǎng):震有科技。

東吳證券則指出,對于我國而言,算法和算力都可以通過挖掘優(yōu)質(zhì)人才、引進(jìn)優(yōu)秀工程實踐,或者直接購買海外優(yōu)質(zhì)資產(chǎn)追趕。而培養(yǎng)中文環(huán)境的優(yōu)質(zhì)數(shù)據(jù)集、語料庫卻必須長期自我積累沉淀,未來數(shù)據(jù)將成為AI發(fā)展的勝負(fù)手,并有望為中國訓(xùn)練自己的大模型,走出差異化道路提供重要基礎(chǔ)。

該機(jī)構(gòu)分析師王紫敬看好以下三個環(huán)節(jié):

1)數(shù)據(jù)運營:預(yù)計醫(yī)保數(shù)據(jù)將有望成為公共數(shù)據(jù)放開的第一站,重點推薦久遠(yuǎn)銀海,建議關(guān)注山大地緯、中科江南等;

2)數(shù)據(jù)基礎(chǔ)設(shè)施:有望成為最先放量兌現(xiàn)的環(huán)節(jié)。重點推薦深桑達(dá)A,易華錄,云賽智聯(lián),建議關(guān)注中國電信;

3)數(shù)據(jù)安全:看好具備央國企背景和數(shù)據(jù)安全業(yè)務(wù)積累的相關(guān)廠商。推薦啟明星辰、奇安信、安恒信息、電科網(wǎng)安等。

關(guān)鍵詞:

  
相關(guān)新聞
每日推薦
  • 滾動
  • 綜合
  • 房產(chǎn)