生成式人工智能淺論

2023-08-04 09:52:58　　來源：51CTO.COM

(資料圖片僅供參考)

生成式人工智能由來已久。一些資料顯示，它早在 20 世紀 50 年代就已出現(xiàn)。其他資料則指出，最早的初級聊天機器人出現(xiàn)在 20 世紀 60 年代。無論真正的起源點是什么，我們都認為，與過去一年中出現(xiàn)的大量研究論文、應用、新聞報道、博客文章和對話相比，這些都只是歷史時間軸上的小石子，尤其是隨著生成式人工智能在計算機視覺模型（圖像和視頻的深度學習，包括穩(wěn)定擴散、Midjourney 和 DALL-E）和大型語言模型（文本和語言的深度學習，包括 GPT-3、GPT-4 和本文標題中提到的杰出范例）的出現(xiàn)。

生成式人工智能（Generative AI）是人工智能（AI）的一個領域，其重點是訓練和部署能夠生成新的原創(chuàng)內(nèi)容的系統(tǒng)，例如從某類內(nèi)容的歷史訓練實例中創(chuàng)建新穎的文本、圖像、音樂或視頻。雖然這可以應用于結(jié)構(gòu)化數(shù)據(jù)（如數(shù)據(jù)表、時間序列和數(shù)據(jù)庫），但當它應用于非結(jié)構(gòu)化數(shù)據(jù)（圖像和文本）時，更具有開創(chuàng)性和全球新聞價值。與依賴于預定義規(guī)則和模式的傳統(tǒng)人工智能模型不同，生成式人工智能模型能夠通過學習大量先前的數(shù)據(jù)產(chǎn)生新穎的輸出結(jié)果。生成式人工智能的核心是機器學習（ML）和統(tǒng)計學的概念。(當然，統(tǒng)計學習和機器學習已經(jīng)密切相關）。

關于生成式人工智能中出現(xiàn)的 ML 的具體方面，ML 的一個子集被稱為無監(jiān)督學習，用于學習給定數(shù)據(jù)集中重復出現(xiàn)的模式和結(jié)構(gòu)。然后，這些模式就會成為 "具有統(tǒng)計超能力的積木"（請原諒我的夸張），然后可以將其組合成邏輯上有意義、統(tǒng)計上可行的分組，生成與訓練數(shù)據(jù)（文本或圖像）非常相似的新內(nèi)容（通常是令人印象深刻的新內(nèi)容）。這一過程屬于無監(jiān)督學習，因為它的目的不是對已知模式進行分類、標記或復制（監(jiān)督學習），而是在非結(jié)構(gòu)化數(shù)據(jù)中發(fā)現(xiàn)復雜模式（有點像獨立分量分析 ICA 的一般形式，與主分量分析 PCA 相似，但并不相同）。ICA 用于信號處理（如盲源分離或 "雞尾酒會問題"），它是一種計算方法，用于識別復雜信號并將其分離為一組獨立的加法子分量。

關于在生成式人工智能中出現(xiàn)的統(tǒng)計學方面，我們會遇到許多作為馬爾可夫模型和貝葉斯學習基礎的關鍵統(tǒng)計學概念（因此，生成式人工智能起源于 20 世紀 50 年代）。為這些方法提供支持的條件概率的歷史可以追溯到更久遠的年代，其中最著名的當然是托馬斯-貝葉斯（Thomas Bayes）牧師（貝葉斯定理發(fā)表于 1763 年）。生成式人工智能利用條件概率對極其復雜和龐大的多元數(shù)據(jù)進行處理，計算出這些構(gòu)件（無監(jiān)督 ML 學習到的模式和結(jié)構(gòu)）最有可能的組合，以響應用戶的查詢（即用戶提示）。

因此，生成式人工智能構(gòu)建新穎輸出能力的 "秘訣 "由三個基本結(jié)構(gòu)組成：(1) 儲存所有可能成分的倉庫（即訓練數(shù)據(jù)中的 ML 學習模式和結(jié)構(gòu)）；(2) 用戶的意圖（即用戶查詢中提供的大量個性化請求的菜單選項，用戶查詢是指明用戶需要的提示類別）；(3) 配方（即計算成分組合和順序的統(tǒng)計模型，將生成在統(tǒng)計上最有可能滿足用戶查詢的輸出）。

為了在這里增加一點色彩，查詢的“上下文”從根本上說也很重要，但我希望生成式人工智能的“個性化”部分已經(jīng)體現(xiàn)在指明用戶意圖的提示中了。要獲得最佳（信息量最大、最令人滿意、最個性化）的響應，很大程度上取決于在良好的提示工程中提供良好的上下文，而這正在成為“未來工作”的一項新工作技能。

在寫這篇文章時，我決定用 ChatGPT 來實例化我的食物隱喻。于是，我向 ChatGPT 提出了一個問題：“給我一個使用夏威夷當?shù)厮拖懔系呐傻氖匙V”。下面是回復：“Kirk Borne 向 ChatGPT 詢問夏威夷派的食譜”（具體食譜此文略）。我要結(jié)束這篇博客，現(xiàn)在就去做一個派。

雖然這一切如此誘人，令人興奮、令人振奮，而且具有爆炸性的變革意義，但我們也必須接受教育。更準確的說，在企業(yè)高管和其他領導者因為害怕落后于競爭對手和其他市場而出現(xiàn)“FOMO”現(xiàn)象，說 “馬上給我一些生成式人工智能”之前，需要為任何此類部署在企業(yè)內(nèi)取得成功和富有成效奠定基礎。配方中有哪些關鍵成分？這里有三個：

數(shù)據(jù)素養(yǎng)：人們需要了解數(shù)據(jù)以及數(shù)據(jù)如何提供業(yè)務洞察力和價值；企業(yè)中存在哪些類型的數(shù)據(jù)；這些數(shù)據(jù)存放在哪里；誰在使用這些數(shù)據(jù)；數(shù)據(jù)用于哪些業(yè)務目的；訪問和使用這些數(shù)據(jù)有哪些道德（管理或法律）要求；以及這些數(shù)據(jù)最終是否足以用于訓練生成式人工智能（大型語言或視覺模型）？數(shù)據(jù)質(zhì)量：還用說嗎？好吧，我來說：GIGO “垃圾進，垃圾出！”在黑盒子 ML 模型中，尤其是那些消耗大量數(shù)據(jù)的模型（如深度學習、人工智能和生成式人工智能），臟數(shù)據(jù)的危害更大。如果數(shù)據(jù)不干凈，模型的可解釋性就毫無意義，模型的可信度也會喪失。數(shù)據(jù)/ML 工程基礎架構(gòu)：在數(shù)據(jù)科學家的筆記本電腦上運行的探索性 ML 模型與在整個業(yè)務中運行的已部署、已驗證、已管理和全企業(yè)范圍的模型之間存在著巨大的差異，企業(yè)對后者下了很大的賭注并產(chǎn)生了極大的依賴。基礎設施必須為人工智能做好準備，其中包括網(wǎng)絡、存儲和計算基礎設施。如果沒有這種彈性基礎，在董事會上運行首席執(zhí)行官筆記本電腦上的 ML 模型可能比在最糟糕的時候出現(xiàn)的生成式人工智能“演示惡魔”更好。

原文標題：I bet you think this article is about ChatGPT

原文作者：Kirk Borne

關鍵詞：

相關新聞

生成式人工智能淺論(2023-08-04 09:52:58)
最美新時代革命軍人丨陳剛果：轉(zhuǎn)換戰(zhàn)位再沖鋒(2023-08-04 09:48:27)
商品日報（8月3日）：市場情緒轉(zhuǎn)弱商品大面積下跌雙焦大幅回落跌幅居首(2023-08-04 09:59:19)
注意！昆明西山凌虛閣暫停觀日旅游活動(2023-08-04 09:48:44)
xgmn網(wǎng)站（xgmn）(2023-08-04 09:51:12)
上半年超寧德時代 LG化學預計2025年營收翻番(2023-08-04 09:53:56)
漂在洪水里的圖書，困在暴雨中的出版人(2023-08-04 09:53:14)
億勝生物科技：潛心創(chuàng)新推動產(chǎn)品迭代升級打造全球領先bFGF產(chǎn)品(2023-08-04 09:56:08)
舞臺燈光中應用的馬達驅(qū)動型號推薦(2023-08-04 09:49:04)
2023 年全球智能手表行業(yè)市場競爭格局分析：蘋果出貨量大立訊精密在 ODMOEM 廠商中拔得頭籌(2023-08-04 09:59:08)
摔傷起訴（摔傷）(2023-08-04 09:49:24)
北京門頭溝失聯(lián)村全部復聯(lián)(2023-08-04 09:54:14)
現(xiàn)代因油泵問題在美召回超5萬輛汽車(2023-08-04 09:49:37)
AI 企業(yè)級應用服務商弘璣完成約4000萬美元C+輪融資(2023-08-04 09:47:39)
【中華武數(shù)·科創(chuàng)之星】劉一寧：為城市數(shù)字化轉(zhuǎn)型“繪制”地理信息(2023-08-04 09:50:37)
微軟公布科隆游戲展Gamescom 2023計劃(2023-08-04 09:56:39)
用股票基金賺錢消費？胡錫進聽了都想笑(2023-08-04 09:57:40)
桂林公積金繳費基數(shù)2023最新標準是多少?附月繳存額、繳存比例(2023-08-04 09:44:38)
崇川區(qū)公安分局任港派出所與南通市鹽城商會舉行“結(jié)對共建共同提高”互訪交流活動(2023-08-04 09:57:04)
深化典型電網(wǎng)工程投資成效監(jiān)管的初步思考(2023-08-04 09:47:43)
工信部：2023年上半年我國鋰電池產(chǎn)量同比增長超四成(2023-08-04 09:47:08)
北京新一批京彩綠色消費券8月5日10時發(fā)放每人可領1600元(2023-08-04 09:47:57)
動漫壁紙(4)(2023-08-04 09:50:04)
2023《財富》世界500強榜單發(fā)布比亞迪排名躍升至第212名在邕5個項目推進順利(2023-08-04 09:43:49)
自治區(qū)農(nóng)業(yè)農(nóng)村廳到桂林市開展農(nóng)村宅基地審批及其相關工作調(diào)研(2023-08-04 09:49:48)
關注河北淶水汛情救援：野三坡景區(qū)遭重創(chuàng)(2023-08-04 09:45:57)
有狐臭做手術(shù)能一次治好嗎有狐臭怎么辦(2023-08-04 09:45:38)
《銀河境界線》星海巡游怎么玩星海巡游玩法思路(2023-08-04 09:43:26)
小鵬已成“大鵬”，“小弟”難成“兄弟”(2023-08-04 09:51:39)
位卑未敢忘憂國的意思是位卑未敢忘憂國的意思(2023-08-04 09:52:29)

圖閱

生成式人工智能淺論

最美新時代革命軍人丨陳剛果：

商品日報（8月3日）：市場情緒

注意！昆明西山凌虛閣暫停觀日

xgmn網(wǎng)站（xgmn）

上半年超寧德時代 LG化學預計
漂在洪水里的圖書，困在暴雨中

億勝生物科技：潛心創(chuàng)新推動產(chǎn)

舞臺燈光中應用的馬達驅(qū)動型號

2023 年全球智能手表行業(yè)市場

摔傷起訴（摔傷）

北京門頭溝失聯(lián)村全部復聯(lián)

每日推薦

現(xiàn)代因油泵問題在美召回超5萬輛汽車

App8月3日消息，據(jù)美國國家公路交通安全管理局3日更新的召回信息，由于
AI 企業(yè)級應用服務商弘璣完成約4000萬美元

AI企業(yè)級應用服務商弘璣完成約4000萬美元C+輪融資
【中華武數(shù)·科創(chuàng)之星】劉一寧：為城市數(shù)字

編前語武寧創(chuàng)新共同體，是普陀區(qū)“中華武數(shù)”科創(chuàng)布局的“武”字要義。
微軟公布科隆游戲展Gamescom 2023計劃

微軟宣布了其在科隆游戲展Gamescom2023展會上的計劃，包括在Xbox展臺上
用股票基金賺錢消費？胡錫進聽了都想笑

來源｜大貓研究所&大貓真探社現(xiàn)在，市場的主旋律就是促銷費。但是吧，
桂林公積金繳費基數(shù)2023最新標準是多少?附

一般來說，住房公積金以上一年的7月1日至當年的6月30日為一個年度單位
崇川區(qū)公安分局任港派出所與南通市鹽城商會

2023年7月28日，崇川區(qū)公安分局任港派出所與南通市鹽城商會舉行“結(jié)對
深化典型電網(wǎng)工程投資成效監(jiān)管的初步思考

深化典型電網(wǎng)工程投資成效監(jiān)管的初步思考,經(jīng)過幾十年的艱辛探索和不懈
工信部：2023年上半年我國鋰電池產(chǎn)量同比增

根據(jù)行業(yè)規(guī)范公告企業(yè)信息和行業(yè)協(xié)會測算，上半年全國鋰電池產(chǎn)量超過40
北京新一批京彩綠色消費券8月5日10時發(fā)放

北京新一批京彩綠色消費券8月5日10時發(fā)放每人可領1600元

熱點

滾動
綜合
房產(chǎn)

熱點