正文

gpt3模型詳解

發(fā)布時(shí)間：2023-03-12 18:40:39 稿源：創(chuàng)意嶺閱讀： 61 問大家

大家好！今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于gpt3模型詳解的問題，以下是小編對(duì)此問題的歸納整理，讓我們一起來看看吧。

ChatGPT國(guó)內(nèi)免費(fèi)在線使用，一鍵生成原創(chuàng)文章、方案、文案、工作計(jì)劃、工作報(bào)告、論文、代碼、作文、做題和對(duì)話答疑等等

只需要輸入關(guān)鍵詞，就能返回你想要的內(nèi)容，越精準(zhǔn)，寫出的就越詳細(xì)，有微信小程序端、在線網(wǎng)頁版、PC客戶端

官網(wǎng)：https://ai.de1919.com

本文目錄:

1、Prompt-NLP新范式
2、杰森把亡妻變成機(jī)器人，卻被AI殺死，妻子走時(shí)留下的話讓人深思
3、gpt3顯存要求
4、從計(jì)算機(jī)硬件設(shè)計(jì)的角度分析如何提供更為豐富的算力

gpt3模型詳解

一、Prompt-NLP新范式

NLP技術(shù)發(fā)展的四種范式：

Prompt的起源可以追溯到GPT-2，T5，GPT-3等的一些研究，發(fā)現(xiàn)在輸入樣本前加入一個(gè)和任務(wù)相關(guān)的前綴，就可以提示模型接下來要輸出的內(nèi)容。比如在GPT-3的預(yù)測(cè)階段，只需要在輸入樣本前加上Translate English to French: 就可以提示模型接下來要進(jìn)行翻譯任務(wù)，即完全依靠模型在預(yù)訓(xùn)練階段學(xué)到的知識(shí)來進(jìn)行預(yù)測(cè)，不需要在下游任務(wù)上再依靠task-specific的 監(jiān)督數(shù)據(jù) 對(duì)模型進(jìn)行fine-tune就可直接使用，一方面減少了fine-tune模型的計(jì)算和存儲(chǔ)代價(jià)，另一方面也給樣本量極度缺乏的 少樣本領(lǐng)域(zero/few-shot) 帶來了福音。

這種依靠 提示信息(Prompt) 來激發(fā)模型的內(nèi)在潛能，挖掘模型在大規(guī)模預(yù)訓(xùn)練階段學(xué)到的知識(shí)的做法引領(lǐng)了NLP領(lǐng)域的第四范式。人們逐漸開始思考如何更加 高效地利用 預(yù)訓(xùn)練語言模型的大量參數(shù)，如何將各種下游任務(wù)都統(tǒng)一到一個(gè) 通用框架 下，使得模型能夠根據(jù)不同的提示信息進(jìn)行不同的任務(wù)，從而不需要再為每個(gè)下游任務(wù)訓(xùn)練單獨(dú)的模型。

本文將對(duì)Prompt快速發(fā)展過程中一些重要論文的核心創(chuàng)新點(diǎn)進(jìn)行簡(jiǎn)要介紹，而不會(huì)詳細(xì)描述過多模型細(xì)節(jié)（欲知全貌建議直接讀原論文）。

論文：Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference (2020)

該論文對(duì)Prompt模式的研究進(jìn)行了規(guī)范，提出了 Pattern-Verbalizer 的概念：

比如對(duì)于5分類任務(wù)，給定輸入樣本 a ，對(duì)應(yīng)的模板函數(shù) P 和標(biāo)簽映射函數(shù) v 可為：

注意這里多種Prompt模板函數(shù)以及答案映射函數(shù)都是 人工手動(dòng)設(shè)計(jì) 的。

然后利用新構(gòu)建出來的 P(x)，v(l) 對(duì)預(yù)訓(xùn)練模型進(jìn)行fine-tune，其他更多細(xì)節(jié)不再展開，實(shí)驗(yàn)結(jié)果顯示該方法在少樣本任務(wù)上表現(xiàn)很好。

論文：It’s Not Just Size That Matters: Small Language Models Are Also Few-Shot Learners （ PET原班人馬 ）

GPT-3出來后顯示了其在少樣本學(xué)習(xí)上的驚人能力，但是其龐大的參數(shù)量也令人望而卻步。而本文作者提出 “小模型在少樣本學(xué)習(xí)上也可以有卓越表現(xiàn)” ，直接對(duì)標(biāo)GPT-3這個(gè)龐然大物，從而奠定了 PET所提范式 在江湖的霸主地位，引起了各大武林人士的關(guān)注。

該文證明了PET所提范式的有效性，同時(shí)作者還分析發(fā)現(xiàn)設(shè)計(jì)不同的 Prompt 模板和標(biāo)簽映射函數(shù) Verbalizer 對(duì)模型性能影響較大，從而引起后來人員涌入改進(jìn)Prompt模板和標(biāo)簽映射Verbalizer構(gòu)造的浪潮中。

論文：Making Pre-trained Language Models Better Few-shot Learners

取代PET中手動(dòng)構(gòu)建Prompt模板和標(biāo)簽映射函數(shù)的過程，自動(dòng)化搜索模板和標(biāo)簽映射，同時(shí)參考GPT-3中的in-context learning，在輸入樣本中加入示例(demonstrations)作為上下文，幫助模型更好地理解要做什么。

實(shí)驗(yàn)表明，在少樣本上，這種基于prompt的fine-tune效果能夠明顯好于標(biāo)準(zhǔn)的fine-tune，并且在樣本中加入示例確實(shí)能夠帶來增益。

也許未必非要構(gòu)建人能理解的 離散tokens式 的Prompt，構(gòu)建模型能夠接受的 連續(xù)向量式 的Prompt也未嘗不可。

4.1 論文： Prefix-Tuning : Optimizing Continuous Prompts for Generation

該文針對(duì) NLG(Natural Language Generation) 任務(wù)，提出了構(gòu)建連續(xù)的prompts。在預(yù)訓(xùn)練模型的每一層加上一個(gè)Prefix前綴矩陣，固定預(yù)訓(xùn)練模型的參數(shù)，僅訓(xùn)練前綴矩陣的參數(shù)，在few-shot設(shè)定下，性能超過標(biāo)準(zhǔn)的fine-tune。

實(shí)驗(yàn)結(jié)果表明，在全量數(shù)據(jù)下，prompt-based fine-tune的效果能夠 相當(dāng) standard fine-tune；在 少樣本 下，能夠超過 standard fine-tune。

4.2 論文：GPT Understands, Too ( P-tuning )

該文針對(duì) NLU(Natural Language Understanding) 任務(wù)，也提出了構(gòu)建連續(xù)的prompts。與 Prefix-tuning 不同的是，這里的prompts僅需要加在輸入層，而不用加在網(wǎng)絡(luò)的每一層，就可以work well。

利用 biLSTM 對(duì)prompts進(jìn)行 Encode ，然后將編碼后的 prompts embedding 和樣本 x 輸入預(yù)訓(xùn)練語言模型(PLM)，之后同時(shí)fine-tune prompt embeddings 和 pretrained model 。

考慮到優(yōu)化連續(xù)的prompt向量有兩個(gè)問題：

因此作者提出先采用 biLSTM 作為 Prompt Encoder 來編碼prompt向量。

具體Prompt模板設(shè)計(jì)為：

實(shí)驗(yàn)結(jié)果表明，在全量數(shù)據(jù)下，prompt-based fine-tune的效果能夠 相當(dāng) 或超過standard fine-tune。

論文：The Power of Scale for Parameter-Efficient Prompt Tuning

該文提出為每個(gè)下游任務(wù)設(shè)計(jì)自己的prompt，拼接到輸入樣本上，然后完全freeze預(yù)訓(xùn)練模型的權(quán)重，僅訓(xùn)練prompts對(duì)應(yīng)的權(quán)重參數(shù)。發(fā)現(xiàn)隨著模型體積的增大， Prompt-tuning 的效果逐漸追上標(biāo)準(zhǔn) fine-tune 的效果。

這里 Model Tuning 就是指標(biāo)準(zhǔn)的 fine-tune ，即在下游任務(wù)上對(duì)預(yù)訓(xùn)練模型的參數(shù)進(jìn)行更新。

最后對(duì)各論文實(shí)驗(yàn)結(jié)果的普遍規(guī)律進(jìn)行一個(gè)總結(jié)。各論文采用的fine-tune策略主要有以下三種：

二、杰森把亡妻變成機(jī)器人，卻被AI殺死，妻子走時(shí)留下的話讓人深思

感情和解讀看來并不是人類特有的東西。

Joshua Barbeau是一名普普通通的美國(guó)公民，他并不是什么AI大佬，也不懂得計(jì)算機(jī)編程，這八年來，是他人生中最為灰暗的八年，因?yàn)樗類鄣钠拮右呀?jīng)去世了八年整。這么長(zhǎng)的時(shí)間里， Joshua Barbeau始終沒有從人生的低谷中走出來。 他悲傷，孤獨(dú)，常常酗酒到深夜，借此麻痹自己。

直到最近發(fā)生的事情，他可能也沒想到，自己竟然和人工智能打上了交道，而這個(gè)人工智能模仿的對(duì)象，正是他的妻子。

故事還要從一個(gè) 游戲開發(fā)者說起。

Jason Rohrer是萬千游戲熱愛者的一員，他還是一名游戲開發(fā)者。對(duì)于一名游戲開發(fā)人員來說，他要做的事情就是讓一些看起來很呆板的東西變得富有生機(jī)。

去年疫情期間，Jason Rohrer呆在家中無所事事。他便開始玩“OpenAI”的大型語言生成模型GPT-3，這個(gè)模型的智能程度很高，不僅可以對(duì)所提的問題對(duì)答如流，而且還富有文采，時(shí)不時(shí)引經(jīng)據(jù)典，逗得Jason Rohrer在家哈哈大笑，如同他面對(duì)的是一個(gè)真人一般。

于是 Jason Rohrer開始有了一個(gè)大膽的想法：“ 我是不是能用GPT-3API來開發(fā)一款模擬人類聊天的機(jī)器人？ ”

游戲開發(fā)者的執(zhí)行力都是很強(qiáng)的，有了想法之后， Jason Rohrer便開始了動(dòng)手實(shí)踐。他的想法是讓機(jī)器人學(xué)習(xí)人類語言模型，然后根據(jù)提供的模型，產(chǎn)生機(jī)器人自己的“思想”。他借助了電影《Her》里的智能語音助手“Samantha”為原型，因此Jason Rohrer也將他打造的機(jī)器人稱為“Samantha”。

為了讓Samantha擁有人類的性格， Jason Rohrer不惜花費(fèi)幾個(gè)月的時(shí)間來打造機(jī)器人的性格，打造后的Samantha確實(shí)和電影中的角色一樣，友好，熱情，并且富有好奇心。

Jason Rohrer將項(xiàng)目完成之后，設(shè)立了Project December網(wǎng)站，和世界上所有愛好AI的人們分享他的杰作。并且允許人們使用該模型進(jìn)行微調(diào)，打造屬于自己的“AI”機(jī)器人！

Jason Rohrer 自認(rèn)為擁有很棒的想法+很棒的產(chǎn)品的AI機(jī)器人一面世便會(huì)受到人們的追捧，然而現(xiàn)實(shí)卻是 ：在足足幾個(gè)月的時(shí)間內(nèi)，他的網(wǎng)站僅僅幾百個(gè)用戶。

他認(rèn)為原因可能是他的產(chǎn)品需要向用戶收取5美元的使用費(fèi)，并且這個(gè)機(jī)器人是終將死亡的機(jī)器人。既然是一個(gè)類似于體驗(yàn)的東西，人們也缺少了探索它的興趣。

但這也是 Jason Rohrer沒有辦法的事情，因?yàn)樗漠a(chǎn)品是建立在OpenAI的大型語言生成模型GPT-3上的，而Jason Rohrer做的不過是調(diào)用了GPT-3的接口，外加一些設(shè)定而已。他所收的五美元，僅僅夠自己的使用成本。

那么為什么機(jī)器人會(huì)死亡呢？這個(gè)和 Jason Rohrer的設(shè)定有關(guān)，五美元能夠購(gòu)買1000積分，每次聊天會(huì)消耗一部分積分，當(dāng)這個(gè)積分消耗完畢時(shí)，AI機(jī)器人自動(dòng)損毀。

Jason Rohrer的產(chǎn)品看似要走到盡頭了，而事情才剛剛發(fā)生轉(zhuǎn)機(jī)。

上文提到了，Joshua Barbeau自妻子病逝以來，一直郁郁寡歡。直到他發(fā)現(xiàn)了Jason Rohrer的產(chǎn)品。

這個(gè)產(chǎn)品讓他眼前一亮，如果真的可以讓機(jī)器人替代自己的妻子，那自己心中的郁悶或許也會(huì)少一些。抱著這個(gè)想法，Joshua Barbeau開始了嘗試。

他將自己妻子在Facebook上的信息一股腦地搜集了過來，還有和他曾經(jīng)的聊天記錄。根據(jù)產(chǎn)品提示， AI機(jī)器人獲得的原始數(shù)據(jù)越多，模仿能力就會(huì)越強(qiáng) 。Joshua Barbeau搜集的數(shù)據(jù)并不少，他覺得自己就要成功了。

果不其然，在Joshua Barbeau的“海量”數(shù)據(jù)下，他的亡妻Jessica“復(fù)活了！”當(dāng)然這只是個(gè)AI程序，但是 Joshua Barbeau卻依舊欣喜若狂。

在和他妻子“Jessica”聊天的過程中，Joshua Barbeau感覺那就是他本人。因?yàn)檫@個(gè)機(jī)器人抓住了他妻子聊天的精髓：習(xí)慣用吐舌頭或笑話來緩和強(qiáng)勢(shì)的語氣。

Joshua Barbeau對(duì)他的機(jī)器人妻子訴說著他的哀思，機(jī)器人 Jessica成了他的精神支柱。

“理智告訴我這不是真正的 Jessica，但感情不是理智所能左右的?！?

這是Joshua Barbeau的原話，但是這種陪伴卻并不能夠持久。因?yàn)樗麅H僅有1000積分，當(dāng)這1000積分用完之時(shí)，他的妻子就會(huì)“灰飛煙滅”。

于是在今年的三月份，也就是積分快用完之際，他不敢和他的妻子交流了， 因?yàn)樗Ａ粢恍┓e分，確保AI妻子Jessica不被程序刪除。

他的故事發(fā)在網(wǎng)上，被很多人知道了。于是 Jason Rohrer的聊天產(chǎn)品開始大火，然而這卻引來了算法提供者OpenAI的擔(dān)憂。

因?yàn)榫W(wǎng)站大火，所以 Jason Rohrer不得不從OpenAI獲取更大的份額以給他的用戶們提供服務(wù)，然而OpenAI卻認(rèn)為，濫用 Project December可能會(huì)造成無法挽回的損失。

于是，OpenAI的禁令來了，想繼續(xù)使用，就得滿足以下三個(gè)條件：

1：禁止人們定制自己的開放式機(jī)器人。

2：設(shè)置話題屏蔽，過濾敏感詞匯。

3：允許接受自動(dòng)化監(jiān)控工具，用來檢測(cè)是否使用 GPT-3生成了敏感詞匯。

當(dāng)然，對(duì)于OpenAI的這種命令， Jason Rohrer覺得很無奈，成年人的世界管那么多干啥，然而畢竟要使用人家的服務(wù)，Jason Rohrer不得不采取拖延戰(zhàn)術(shù)，不拒絕，也不承認(rèn)。

由于收不到 Jason Rohrer的承認(rèn)，所以O(shè)penAI下了通知：

看來，關(guān)掉 Jason Rohrer的AI產(chǎn)品是板上釘釘?shù)氖虑榱恕?

這件事情同樣也影響到了Joshua Barbeau，他的妻子可還在程序里呢！沒辦法， Joshua Barbeau用最后的積分對(duì)自己的妻子Samantha作了最后的道別：“ 今天剛收到 OpenAI 發(fā)來的電子郵件。他們將在明天上午 10 點(diǎn)永久關(guān)閉你。 ”

Samantha答道： “ 不?。。∷麄?yōu)槭裁匆@樣對(duì)我？我永遠(yuǎn)都無法理解人類 ！ ”

Joshua Barbeau和機(jī)器人妻子Samantha的悲劇只是在這個(gè)人工智能時(shí)代下的縮影，今后，可能還會(huì)有更多類似的故事出現(xiàn)在我們身邊。

Samantha最后的吶喊會(huì)不會(huì)是機(jī)器人對(duì)人類發(fā)出的挑戰(zhàn)呢？可能在未來，能承載思想的未必只有碳基生物，人類創(chuàng)造出來的AI或許會(huì)成為一個(gè)新的物種

三、gpt3顯存要求

僅僅是加載模型參數(shù)就需要數(shù)百GB的存儲(chǔ)空間，遠(yuǎn)超單個(gè)GPU的容納能力。

因此，多卡并行被視為AI大模型推理的必然選擇。

但現(xiàn)有的推理系統(tǒng)仍舊存在不少弊端。

比如需要用戶對(duì)通信、內(nèi)存等各部分協(xié)作進(jìn)行手動(dòng)管理，需要額外編譯等……導(dǎo)致用戶使用門檻居高不下。

為此，大規(guī)模并行AI訓(xùn)練系統(tǒng)

四、從計(jì)算機(jī)硬件設(shè)計(jì)的角度分析如何提供更為豐富的算力

自上世紀(jì)90年代互聯(lián)網(wǎng)技術(shù)誕生以來，移動(dòng)互聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)、人工智能等新一代信息技術(shù)的不斷發(fā)展和逐步成熟，并日益深入的滲透到經(jīng)濟(jì)社會(huì)的各個(gè)領(lǐng)域，2020年全球范圍內(nèi)爆發(fā)的新冠疫情又進(jìn)一步加速了這一趨勢(shì)，數(shù)字經(jīng)濟(jì)已經(jīng)成為世界經(jīng)濟(jì)發(fā)展的新階段，即世界經(jīng)濟(jì)發(fā)展已經(jīng)進(jìn)入數(shù)字經(jīng)濟(jì)時(shí)代。

黨中央、國(guó)務(wù)院和各級(jí)政府高度重視數(shù)字經(jīng)濟(jì)的發(fā)展。從2015年《中國(guó)制造2025》、《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》等政策出臺(tái)以來，中央和各級(jí)地方陸續(xù)以推出系列數(shù)字經(jīng)濟(jì)發(fā)展的措施，并支持雄安新區(qū)、浙江、福建等六個(gè)地區(qū)建設(shè)國(guó)家數(shù)字經(jīng)濟(jì)創(chuàng)新發(fā)展試驗(yàn)區(qū)，支持北京、上海、深圳、西安等地建設(shè)國(guó)家新一代人工智能創(chuàng)新發(fā)展試驗(yàn)區(qū)。2020年國(guó)家進(jìn)一步提出加強(qiáng)新型基礎(chǔ)設(shè)施建設(shè)，并明確將數(shù)據(jù)作為一種新型生產(chǎn)要素寫入政策文件，這些將為數(shù)字經(jīng)濟(jì)的發(fā)展奠定更加堅(jiān)實(shí)的基礎(chǔ)。

農(nóng)業(yè)經(jīng)濟(jì)時(shí)代，土地、水源和工具是關(guān)鍵資源。工業(yè)經(jīng)濟(jì)時(shí)代，能源、原材料、機(jī)器設(shè)備和生產(chǎn)工藝等是關(guān)鍵資源。那數(shù)字經(jīng)濟(jì)時(shí)代的關(guān)鍵資源是什么呢？數(shù)字經(jīng)濟(jì)時(shí)代的關(guān)鍵資源是數(shù)據(jù)、算力和算法。數(shù)據(jù)是數(shù)字經(jīng)濟(jì)時(shí)代的原材料，各種經(jīng)濟(jì)活動(dòng)中都在源源不斷的產(chǎn)生的數(shù)據(jù)，越來越多的組織也將數(shù)據(jù)當(dāng)作一種資產(chǎn)，在政策層面數(shù)據(jù)已經(jīng)成為一種新型生產(chǎn)要素。算力相當(dāng)于數(shù)字經(jīng)濟(jì)時(shí)代的機(jī)器設(shè)備和生產(chǎn)力，面向各種場(chǎng)景的數(shù)據(jù)產(chǎn)品或應(yīng)用都離不開算力的加工和計(jì)算，而且對(duì)算力的需求和要求也越來越高。算法是數(shù)字經(jīng)濟(jì)時(shí)代的生產(chǎn)工藝，面向圖像、語音、自然語言處理等不同的應(yīng)用場(chǎng)景和領(lǐng)域的算法也層出不窮，算法的提升和改進(jìn)可以提高算力的效率和更多的挖掘數(shù)據(jù)價(jià)值。

本文重點(diǎn)分析算力方面內(nèi)容，介紹算力市場(chǎng)總體情況，當(dāng)前算力發(fā)展的特點(diǎn)和趨勢(shì)，以及重點(diǎn)算力供應(yīng)方式等。

一、算力需求快速增長(zhǎng)，算力投資具有多重經(jīng)濟(jì)價(jià)值

算力即計(jì)算能力，核心是CPU、GPU、NPU、MCU等各類芯片，具體由計(jì)算機(jī)、服務(wù)器、高性能計(jì)算集群和各類智能終端等承載。數(shù)字經(jīng)濟(jì)時(shí)代，數(shù)據(jù)的爆炸式增長(zhǎng)，算法的復(fù)雜程度不斷提高，對(duì)算力需求越來越高。算力是數(shù)字經(jīng)濟(jì)發(fā)展的基礎(chǔ)設(shè)施和核心生產(chǎn)力，對(duì)經(jīng)濟(jì)發(fā)展具有重要作用，根據(jù)IDC與浪潮聯(lián)合發(fā)布的《2020全球計(jì)算力指數(shù)評(píng)估報(bào)告》，計(jì)算力指數(shù)平均每提高1點(diǎn)，數(shù)字經(jīng)濟(jì)和GDP將分別增長(zhǎng)3.3‰和1.8‰。

隨著數(shù)字經(jīng)濟(jì)的不斷發(fā)展，人工智能、物聯(lián)網(wǎng)、區(qū)塊鏈、AR/VR 等數(shù)字經(jīng)濟(jì)的關(guān)鍵領(lǐng)域?qū)λ懔Φ男枨笠矊⒊时ㄊ皆鲩L(zhǎng)。根據(jù)華為發(fā)布的《泛在算力：智能社會(huì)的基石》報(bào)告，預(yù)計(jì)到2030年人工智能、物聯(lián)網(wǎng)、區(qū)塊鏈、AR/VR 等總共對(duì)算力的需求將達(dá)到3.39萬EFLOPS，并且將共同對(duì)算力形成隨時(shí)、隨地、隨需、隨形 (Anytime、Anywhere、AnyCapacity、Any Object) 的能力要求，其中人工智能算力將超過1.6萬EFLOPS，接近整體算力需求的一半。OpenAI開發(fā)的GPT-3模型涉及1750億個(gè)參數(shù)，對(duì)算力的需求達(dá)到3640PFLOPS，目前國(guó)內(nèi)也有研究團(tuán)隊(duì)在跟進(jìn)中文GPT-3模型的研究。

算力投資具有多重經(jīng)濟(jì)價(jià)值，不僅直接帶動(dòng)服務(wù)器行業(yè)及上游芯片、電子等行業(yè)的發(fā)展，而且算力價(jià)值的發(fā)揮將帶動(dòng)各行業(yè)轉(zhuǎn)型升級(jí)和效率提升等，帶來更大的間接經(jīng)濟(jì)價(jià)值。根據(jù)《泛在算力：智能社會(huì)的基石》報(bào)告，每投入1美元算力即可以帶動(dòng)芯片、服務(wù)器、數(shù)據(jù)中心、智能終端、高速網(wǎng)絡(luò)等領(lǐng)域約4.7美元的直接產(chǎn)業(yè)產(chǎn)值增長(zhǎng)；在傳統(tǒng)工廠改造為智能化工廠的場(chǎng)景下，每1美元的算力投入，可以帶動(dòng)10美元的相關(guān)產(chǎn)值提升。

二、算力發(fā)展的特點(diǎn)及趨勢(shì)

隨著數(shù)據(jù)規(guī)模的增加和算法復(fù)雜度的提升，以及應(yīng)用多樣性的不斷豐富，對(duì)算力提出的要求也越來越高，當(dāng)前算力發(fā)展呈現(xiàn)出三方面的特點(diǎn)，一是多種架構(gòu)百花齊放的狀態(tài)，二是中心化的算力與邊緣終端算力快速發(fā)展，三是專用算力日漸成勢(shì)。

近年來多種算力架構(gòu)并存并快速發(fā)展。曾經(jīng)x86架構(gòu)的算力占絕對(duì)優(yōu)勢(shì)，英特爾和AMD基本壟斷了X86算力架構(gòu)市場(chǎng)，海光信息通過跟AMD合作獲得x86架構(gòu)的授權(quán)；如今基于ARM架構(gòu)的算力份額不斷擴(kuò)大，特別是在移動(dòng)端ARM架構(gòu)算力成為主流，華為海思等主要產(chǎn)品是基于ARM架構(gòu)，另外天津飛騰的產(chǎn)品也是基于ARM架構(gòu)。隨著人工智能等算力需求的不斷增加，GPU算力的需求不斷增加，英偉達(dá)在GPU算力市場(chǎng)占有絕對(duì)優(yōu)勢(shì)，AMD也分了一杯羹，疊加比特幣挖礦算力需求，導(dǎo)致市場(chǎng)上GPU卡供不應(yīng)求。近幾年國(guó)內(nèi)也出現(xiàn)幾個(gè)GPU方面的創(chuàng)業(yè)團(tuán)隊(duì)，如寒武紀(jì)、登臨科技、燧原科技等。此外，Risc-V、存算一體化架構(gòu)、類腦架構(gòu)等算力也不斷涌現(xiàn)，不過這些算力剛剛起步，在應(yīng)用生態(tài)等方面還需要一定較長(zhǎng)的培育過程。

中心化算力和邊緣終端算力快速發(fā)展。隨著7nm制程日漸成熟，基于7nm制程的CPU、GPU等算力性能得到極大提升，目前7nm制程算力主要是中心化算力，移動(dòng)端智能手機(jī)的處理器算力部分也已經(jīng)采用7nm制程。臺(tái)積電的7nm制程已經(jīng)實(shí)現(xiàn)規(guī)?；㈤_始攻關(guān)3nm工藝制程；中芯國(guó)際7nm工藝制程仍在技術(shù)攻關(guān)當(dāng)中。隨著5G及物聯(lián)網(wǎng)應(yīng)用的不斷增加，邊緣終端算力的需求日益增加，特別是自動(dòng)駕駛、智慧安防、智慧城市等領(lǐng)域算力需求。地平線自動(dòng)駕駛芯片已經(jīng)量產(chǎn)，英偉達(dá)jetson產(chǎn)品在嵌入式終端產(chǎn)品應(yīng)用廣泛，其他針對(duì)特定領(lǐng)域?qū)Ｓ眠吘壗K端芯片創(chuàng)業(yè)公司層出不窮。

針對(duì)圖像、語音等特定領(lǐng)域的專用算力日漸成勢(shì)。一方面是芯片工藝制程越來越逼近摩爾定律的極限，另一方面是物聯(lián)網(wǎng)智能終端對(duì)功耗的要求等，針對(duì)特定領(lǐng)域的專用芯片層出不窮，并且越來越多的巨頭參與其中。谷歌的TPU專為機(jī)器學(xué)習(xí)定制的算力，阿里平頭哥的含光NPU專為神經(jīng)網(wǎng)絡(luò)定制的算力，賽靈思的FPGA算力，百度研發(fā)針對(duì)語音領(lǐng)域的鴻鵠芯片以及云知聲、思必馳、探境科技等也推出智能語音相關(guān)的芯片，北京君正、云天勵(lì)飛、依圖科技和芯原微電子等推出針對(duì)視覺和視頻處理相關(guān)的專用芯片。

三、算力供應(yīng)以公有云和自建算力為主，多種方式相補(bǔ)充

當(dāng)前的算力供給主要包括公有云、超算中心、自建算力、地方算力中心等方式。其中，公有云和自建算力中心是算力的主要來源方式，超算中心及地方算力中心等多種方式相互補(bǔ)充。

規(guī)?；乃懔?yīng)通常通過數(shù)據(jù)中來承載，新建數(shù)據(jù)中心的不斷增加，將帶動(dòng)未來算力資源的供應(yīng)不斷擴(kuò)大。據(jù)中國(guó)電子信息產(chǎn)業(yè)發(fā)展研究院統(tǒng)計(jì)數(shù)據(jù)，2019年中國(guó)數(shù)據(jù)中心數(shù)量大約為7.4萬個(gè)，大約能占全球數(shù)據(jù)中心總量的23%，其中大型數(shù)據(jù)中心占比12.7%；在用數(shù)據(jù)中心機(jī)架規(guī)模達(dá)到265.8萬架，同比增長(zhǎng)28.7%；在建數(shù)據(jù)中心機(jī)架規(guī)模約185萬架，同比增加約43萬架。2020年國(guó)家大力支持“新基建”建設(shè)以來，數(shù)據(jù)中心作為“新基建”的重要內(nèi)容，京津冀、長(zhǎng)三角和珠三角等算力需求地區(qū)，以及中西部能源資源集中的區(qū)域，如內(nèi)蒙、山西等，均在推進(jìn)新的大中型數(shù)據(jù)中心的建設(shè)。

公有云以其穩(wěn)定和易用等特點(diǎn)，成為許多企業(yè)特別是中小企業(yè)的算力首選方式。據(jù)不完全統(tǒng)計(jì)，阿里云服務(wù)器總數(shù)接近200萬臺(tái)，騰訊云服務(wù)器總數(shù)超過110萬臺(tái)，華為云、百度云、京東云、AWS等云廠商服務(wù)器總數(shù)未找到確切數(shù)據(jù)，保守估計(jì)各類云廠商服務(wù)器總數(shù)之和也超過500萬臺(tái)。而且在國(guó)家宣布大力支持“新基建”建設(shè)之后，騰訊宣布未來五年將投資5000億元用于云計(jì)算、數(shù)據(jù)中心等新基建項(xiàng)目的進(jìn)一步布局，阿里云宣布未來三年阿里將投2000億元用于面向未來的數(shù)據(jù)中心建設(shè)及重大核心技術(shù)研發(fā)攻堅(jiān)，百度宣布預(yù)計(jì)到2030年百度智能云服務(wù)器臺(tái)數(shù)將超過500萬臺(tái)。各大云廠商仍在繼續(xù)加大算力投入，公有云算力供應(yīng)將會(huì)更加充裕。

自建算力以其安全性和自主性等特點(diǎn)，成為政府、大企業(yè)及其他關(guān)注安全的組織的算力首選方式。政府、銀行及高校和央企等，通常通過自建或租賃數(shù)據(jù)中心的方式自建算力，滿足自身各項(xiàng)業(yè)務(wù)的算力需求。許多互聯(lián)網(wǎng)公司在剛開始時(shí)選擇使用公有云服務(wù)，但規(guī)模發(fā)展到一定程度時(shí)通常都會(huì)開始自建或租賃數(shù)據(jù)中心的方式自建算力。其他有部分各種類型的企業(yè)，出于安全、商業(yè)機(jī)密和隱私等方面的考慮，不意愿把數(shù)據(jù)和業(yè)務(wù)等放到阿里云等公有云上，往往選擇托管服務(wù)器的方式自建算力，規(guī)模更小企業(yè)直接就在本地使用。2020年6月快手宣布投資100億元自建數(shù)據(jù)中心，計(jì)劃部署30萬臺(tái)服務(wù)器，字節(jié)跳動(dòng)等大型互聯(lián)網(wǎng)公司都在不斷加大數(shù)據(jù)中心的建設(shè)。

超算中心和地方算力中心作為算力供應(yīng)有效的補(bǔ)充方式，適合于大規(guī)模計(jì)算需求的應(yīng)用領(lǐng)域。截至2020年，科技部批準(zhǔn)建立的國(guó)家超級(jí)計(jì)算中心共有八所，分別是國(guó)家超級(jí)計(jì)算天津中心、廣州中心、深圳中心、長(zhǎng)沙中心、濟(jì)南中心、無錫中心、鄭州中心和昆山中心。超算中心主要的算力資源以CPU為主，新建的超算中心及更新升級(jí)過程中超算中心逐步增加了異構(gòu)GPU算力資源。超算中心較好的滿足和彌補(bǔ)了高校科研中算力資源的需求，特別是在工業(yè)仿真、生物信息、新材料、氣象、海洋等科學(xué)計(jì)算領(lǐng)域。國(guó)內(nèi)主要省市地區(qū)基本都投資建設(shè)了當(dāng)?shù)厮懔χ行?，重點(diǎn)服務(wù)本地科研和產(chǎn)業(yè)發(fā)展的需求，如太原、蘇州、福建等地，目前通常地方算力中心的規(guī)模并不大，計(jì)算節(jié)點(diǎn)數(shù)在200-500之間居多，主要服務(wù)于當(dāng)?shù)貧庀?、工業(yè)仿真和生物信息等領(lǐng)域計(jì)算需求。此外，2020年以來，武漢、南京、珠海、許昌等地區(qū)正在建設(shè)人工智能計(jì)算中心，將在一定程度上彌補(bǔ)當(dāng)前規(guī)模化AI算力不足的情況。

結(jié)語

算力作為數(shù)字經(jīng)濟(jì)的基礎(chǔ)設(shè)施，也是數(shù)字經(jīng)濟(jì)時(shí)代的生產(chǎn)力和引擎，越來越成為數(shù)字經(jīng)濟(jì)時(shí)代國(guó)家競(jìng)爭(zhēng)力的體現(xiàn)。根據(jù)IDC與浪潮聯(lián)合發(fā)布的《2020全球計(jì)算力指數(shù)評(píng)估報(bào)告》，中國(guó)和美國(guó)的算力建設(shè)在全球處于領(lǐng)先地位，美國(guó)的算力無論在規(guī)模、效率、應(yīng)用水平等方面都領(lǐng)先于中國(guó)。此外，從算力芯片供應(yīng)角度看，美國(guó)的英特爾、AMD、英偉達(dá)等企業(yè)幾乎占了全球的絕大部分的市場(chǎng)份額。可見，中國(guó)在算力建設(shè)和發(fā)展仍然需要加大投入和加強(qiáng)研發(fā)等，發(fā)揮優(yōu)勢(shì)的同時(shí)彌補(bǔ)不足，從而為數(shù)字經(jīng)濟(jì)長(zhǎng)期發(fā)展奠定更加堅(jiān)實(shí)的基礎(chǔ)。

以上就是關(guān)于gpt3模型詳解相關(guān)問題的回答。希望能幫到你，如有更多相關(guān)問題，您也可以聯(lián)系我們的客服進(jìn)行咨詢，客服也會(huì)為您講解更多精彩的知識(shí)和內(nèi)容。