生成式人工智能淺論
(資料圖片僅供參考)
生成式人工智能由來已久。一些資料顯示,它早在 20 世紀 50 年代就已出現(xiàn)。其他資料則指出,最早的初級聊天機器人出現(xiàn)在 20 世紀 60 年代。無論真正的起源點是什么,我們都認為,與過去一年中出現(xiàn)的大量研究論文、應用、新聞報道、博客文章和對話相比,這些都只是歷史時間軸上的小石子,尤其是隨著生成式人工智能在計算機視覺模型(圖像和視頻的深度學習,包括穩(wěn)定擴散、Midjourney 和 DALL-E)和大型語言模型(文本和語言的深度學習,包括 GPT-3、GPT-4 和本文標題中提到的杰出范例)的出現(xiàn)。
生成式人工智能(Generative AI)是人工智能(AI)的一個領域,其重點是訓練和部署能夠生成新的原創(chuàng)內(nèi)容的系統(tǒng),例如從某類內(nèi)容的歷史訓練實例中創(chuàng)建新穎的文本、圖像、音樂或視頻。雖然這可以應用于結(jié)構(gòu)化數(shù)據(jù)(如數(shù)據(jù)表、時間序列和數(shù)據(jù)庫),但當它應用于非結(jié)構(gòu)化數(shù)據(jù)(圖像和文本)時,更具有開創(chuàng)性和全球新聞價值。與依賴于預定義規(guī)則和模式的傳統(tǒng)人工智能模型不同,生成式人工智能模型能夠通過學習大量先前的數(shù)據(jù)產(chǎn)生新穎的輸出結(jié)果。生成式人工智能的核心是機器學習(ML)和統(tǒng)計學的概念。(當然,統(tǒng)計學習和機器學習已經(jīng)密切相關)。
關于生成式人工智能中出現(xiàn)的 ML 的具體方面,ML 的一個子集被稱為無監(jiān)督學習,用于學習給定數(shù)據(jù)集中重復出現(xiàn)的模式和結(jié)構(gòu)。然后,這些模式就會成為 "具有統(tǒng)計超能力的積木"(請原諒我的夸張),然后可以將其組合成邏輯上有意義、統(tǒng)計上可行的分組,生成與訓練數(shù)據(jù)(文本或圖像)非常相似的新內(nèi)容(通常是令人印象深刻的新內(nèi)容)。這一過程屬于無監(jiān)督學習,因為它的目的不是對已知模式進行分類、標記或復制(監(jiān)督學習),而是在非結(jié)構(gòu)化數(shù)據(jù)中發(fā)現(xiàn)復雜模式(有點像獨立分量分析 ICA 的一般形式,與主分量分析 PCA 相似,但并不相同)。ICA 用于信號處理(如盲源分離或 "雞尾酒會問題"),它是一種計算方法,用于識別復雜信號并將其分離為一組獨立的加法子分量。
關于在生成式人工智能中出現(xiàn)的統(tǒng)計學方面,我們會遇到許多作為馬爾可夫模型和貝葉斯學習基礎的關鍵統(tǒng)計學概念(因此,生成式人工智能起源于 20 世紀 50 年代)。為這些方法提供支持的條件概率的歷史可以追溯到更久遠的年代,其中最著名的當然是托馬斯-貝葉斯(Thomas Bayes)牧師(貝葉斯定理發(fā)表于 1763 年)。生成式人工智能利用條件概率對極其復雜和龐大的多元數(shù)據(jù)進行處理,計算出這些構(gòu)件(無監(jiān)督 ML 學習到的模式和結(jié)構(gòu))最有可能的組合,以響應用戶的查詢(即用戶提示)。
因此,生成式人工智能構(gòu)建新穎輸出能力的 "秘訣 "由三個基本結(jié)構(gòu)組成:(1) 儲存所有可能成分的倉庫(即訓練數(shù)據(jù)中的 ML 學習模式和結(jié)構(gòu));(2) 用戶的意圖(即用戶查詢中提供的大量個性化請求的菜單選項,用戶查詢是指明用戶需要的提示類別);(3) 配方(即計算成分組合和順序的統(tǒng)計模型,將生成在統(tǒng)計上最有可能滿足用戶查詢的輸出)。
為了在這里增加一點色彩,查詢的“上下文”從根本上說也很重要,但我希望生成式人工智能的“個性化”部分已經(jīng)體現(xiàn)在指明用戶意圖的提示中了。要獲得最佳(信息量最大、最令人滿意、最個性化)的響應,很大程度上取決于在良好的提示工程中提供良好的上下文,而這正在成為“未來工作”的一項新工作技能。
在寫這篇文章時,我決定用 ChatGPT 來實例化我的食物隱喻。于是,我向 ChatGPT 提出了一個問題:“給我一個使用夏威夷當?shù)厮拖懔系呐傻氖匙V”。下面是回復:“Kirk Borne 向 ChatGPT 詢問夏威夷派的食譜”(具體食譜此文略)。我要結(jié)束這篇博客,現(xiàn)在就去做一個派。
雖然這一切如此誘人,令人興奮、令人振奮,而且具有爆炸性的變革意義,但我們也必須接受教育。更準確的說,在企業(yè)高管和其他領導者因為害怕落后于競爭對手和其他市場而出現(xiàn)“FOMO”現(xiàn)象,說 “馬上給我一些生成式人工智能”之前,需要為任何此類部署在企業(yè)內(nèi)取得成功和富有成效奠定基礎。配方中有哪些關鍵成分?這里有三個:
數(shù)據(jù)素養(yǎng):人們需要了解數(shù)據(jù)以及數(shù)據(jù)如何提供業(yè)務洞察力和價值;企業(yè)中存在哪些類型的數(shù)據(jù);這些數(shù)據(jù)存放在哪里;誰在使用這些數(shù)據(jù);數(shù)據(jù)用于哪些業(yè)務目的;訪問和使用這些數(shù)據(jù)有哪些道德(管理或法律)要求;以及這些數(shù)據(jù)最終是否足以用于訓練生成式人工智能(大型語言或視覺模型)?數(shù)據(jù)質(zhì)量:還用說嗎?好吧,我來說:GIGO “垃圾進,垃圾出!”在黑盒子 ML 模型中,尤其是那些消耗大量數(shù)據(jù)的模型(如深度學習、人工智能和生成式人工智能),臟數(shù)據(jù)的危害更大。如果數(shù)據(jù)不干凈,模型的可解釋性就毫無意義,模型的可信度也會喪失。數(shù)據(jù)/ML 工程基礎架構(gòu):在數(shù)據(jù)科學家的筆記本電腦上運行的探索性 ML 模型與在整個業(yè)務中運行的已部署、已驗證、已管理和全企業(yè)范圍的模型之間存在著巨大的差異,企業(yè)對后者下了很大的賭注并產(chǎn)生了極大的依賴。基礎設施必須為人工智能做好準備,其中包括網(wǎng)絡、存儲和計算基礎設施。如果沒有這種彈性基礎,在董事會上運行首席執(zhí)行官筆記本電腦上的 ML 模型可能比在最糟糕的時候出現(xiàn)的生成式人工智能“演示惡魔”更好。原文標題:I bet you think this article is about ChatGPT
原文作者:Kirk Borne
關鍵詞:
- 生成式人工智能淺論(2023-08-04 09:52:58)
- 最美新時代革命軍人丨陳剛果:轉(zhuǎn)換戰(zhàn)位再沖鋒(2023-08-04 09:48:27)
- 商品日報(8月3日):市場情緒轉(zhuǎn)弱商品大面積下跌 雙焦大幅回落跌幅居首(2023-08-04 09:59:19)
- 注意!昆明西山凌虛閣暫停觀日旅游活動(2023-08-04 09:48:44)
- xgmn網(wǎng)站(xgmn)(2023-08-04 09:51:12)
- 上半年超寧德時代 LG化學預計2025年營收翻番(2023-08-04 09:53:56)
- 漂在洪水里的圖書,困在暴雨中的出版人(2023-08-04 09:53:14)
- 億勝生物科技:潛心創(chuàng)新推動產(chǎn)品迭代升級 打造全球領先bFGF產(chǎn)品(2023-08-04 09:56:08)
- 舞臺燈光中應用的馬達驅(qū)動型號推薦(2023-08-04 09:49:04)
- 2023 年全球智能手表行業(yè)市場競爭格局分析:蘋果出貨量大 立訊精密在 ODMOEM 廠商中拔得頭籌(2023-08-04 09:59:08)
- 摔傷起訴(摔傷)(2023-08-04 09:49:24)
- 北京門頭溝失聯(lián)村全部復聯(lián)(2023-08-04 09:54:14)
- 現(xiàn)代因油泵問題在美召回超5萬輛汽車(2023-08-04 09:49:37)
- AI 企業(yè)級應用服務商弘璣完成約4000萬美元C+輪融資(2023-08-04 09:47:39)
- 【中華武數(shù)·科創(chuàng)之星】劉一寧:為城市數(shù)字化轉(zhuǎn)型“繪制”地理信息(2023-08-04 09:50:37)
- 微軟公布科隆游戲展Gamescom 2023計劃(2023-08-04 09:56:39)
- 用股票基金賺錢消費?胡錫進聽了都想笑(2023-08-04 09:57:40)
- 桂林公積金繳費基數(shù)2023最新標準是多少?附月繳存額、繳存比例(2023-08-04 09:44:38)
- 崇川區(qū)公安分局任港派出所與南通市鹽城商會舉行“結(jié)對共建 共同提高”互訪交流活動(2023-08-04 09:57:04)
- 深化典型電網(wǎng)工程投資成效監(jiān)管的初步思考(2023-08-04 09:47:43)
- 工信部:2023年上半年我國鋰電池產(chǎn)量同比增長超四成(2023-08-04 09:47:08)
- 北京新一批京彩綠色消費券8月5日10時發(fā)放 每人可領1600元(2023-08-04 09:47:57)
- 動漫壁紙(4)(2023-08-04 09:50:04)
- 2023《財富》世界500強榜單發(fā)布 比亞迪排名躍升至第212名 在邕5個項目推進順利(2023-08-04 09:43:49)
- 自治區(qū)農(nóng)業(yè)農(nóng)村廳到桂林市開展農(nóng)村宅基地審批及其相關工作調(diào)研(2023-08-04 09:49:48)
- 關注河北淶水汛情救援:野三坡景區(qū)遭重創(chuàng)(2023-08-04 09:45:57)
- 有狐臭做手術(shù)能一次治好嗎 有狐臭怎么辦(2023-08-04 09:45:38)
- 《銀河境界線》星海巡游怎么玩星海巡游玩法思路(2023-08-04 09:43:26)
- 小鵬已成“大鵬”,“小弟”難成“兄弟”(2023-08-04 09:51:39)
- 位卑未敢忘憂國的意思是 位卑未敢忘憂國的意思(2023-08-04 09:52:29)
-
現(xiàn)代因油泵問題在美召回超5萬輛汽車
App8月3日消息,據(jù)美國國家公路交通安全管理局3日更新的召回信息,由于
-
AI 企業(yè)級應用服務商弘璣完成約4000萬美元
AI企業(yè)級應用服務商弘璣完成約4000萬美元C+輪融資
-
【中華武數(shù)·科創(chuàng)之星】劉一寧:為城市數(shù)字
編前語武寧創(chuàng)新共同體,是普陀區(qū)“中華武數(shù)”科創(chuàng)布局的“武”字要義。
-
微軟公布科隆游戲展Gamescom 2023計劃
微軟宣布了其在科隆游戲展Gamescom2023展會上的計劃,包括在Xbox展臺上
-
用股票基金賺錢消費?胡錫進聽了都想笑
來源|大貓研究所&大貓真探社現(xiàn)在,市場的主旋律就是促銷費。但是吧,
-
桂林公積金繳費基數(shù)2023最新標準是多少?附
一般來說,住房公積金以上一年的7月1日至當年的6月30日為一個年度單位
-
崇川區(qū)公安分局任港派出所與南通市鹽城商會
2023年7月28日,崇川區(qū)公安分局任港派出所與南通市鹽城商會舉行“結(jié)對
-
深化典型電網(wǎng)工程投資成效監(jiān)管的初步思考
深化典型電網(wǎng)工程投資成效監(jiān)管的初步思考,經(jīng)過幾十年的艱辛探索和不懈
-
工信部:2023年上半年我國鋰電池產(chǎn)量同比增
根據(jù)行業(yè)規(guī)范公告企業(yè)信息和行業(yè)協(xié)會測算,上半年全國鋰電池產(chǎn)量超過40
-
北京新一批京彩綠色消費券8月5日10時發(fā)放
北京新一批京彩綠色消費券8月5日10時發(fā)放每人可領1600元
- 滾動
- 綜合
- 房產(chǎn)