正文

人工智能模型如何建立（人工智能模型如何建立的）

發(fā)布時間：2023-03-14 04:45:01 稿源：創(chuàng)意嶺閱讀： 131 問大家

大家好！今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于人工智能模型如何建立的問題，以下是小編對此問題的歸納整理，讓我們一起來看看吧。

ChatGPT國內(nèi)免費(fèi)在線使用，一鍵生成原創(chuàng)文章、方案、文案、工作計(jì)劃、工作報告、論文、代碼、作文、做題和對話答疑等等

只需要輸入關(guān)鍵詞，就能返回你想要的內(nèi)容，越精準(zhǔn)，寫出的就越詳細(xì)，有微信小程序端、在線網(wǎng)頁版、PC客戶端

官網(wǎng)：https://ai.de1919.com

本文目錄:

1、AI生成模型：超越數(shù)據(jù)觀測與計(jì)算機(jī)模擬的第三條科學(xué)探索之路？
2、如何組建人工智能團(tuán)隊(duì)：11個關(guān)鍵角色
3、教人工智能以“我”的視角看世界
4、學(xué)習(xí)人工智能，需要什么數(shù)學(xué)基礎(chǔ)？

人工智能模型如何建立（人工智能模型如何建立的）

一、AI生成模型：超越數(shù)據(jù)觀測與計(jì)算機(jī)模擬的第三條科學(xué)探索之路？

導(dǎo)語

最先進(jìn)的人工智能算法已經(jīng)開始在探測星系的演化、計(jì)算量子力學(xué)波函數(shù)、探索新的化合物等領(lǐng)域施展拳腳。那么，還有沒有那種無法自動化而只能由科學(xué)家完成的工作？

如今的物理學(xué)和天文學(xué)實(shí)驗(yàn)會產(chǎn)生海量的數(shù)據(jù)，已經(jīng)沒有人或團(tuán)隊(duì)能夠跟進(jìn)所有的這些數(shù)據(jù)了。其中一些數(shù)據(jù)每天以TB級的規(guī)模增加，而且這個趨勢不會減弱。在二十一世紀(jì) 20 年代中期射電望遠(yuǎn)鏡 Square Kilometer Arra 將投入使用，它每年產(chǎn)生的數(shù)據(jù)量和整個互聯(lián)網(wǎng)的數(shù)據(jù)量一樣多。

面對數(shù)據(jù)洪流，許多科學(xué)家開始求助于人工智能。只需要少量的人工輸入，人工智能系統(tǒng)（如神經(jīng)網(wǎng)絡(luò)）就能夠在數(shù)據(jù)海洋中漫游，識別異常，挖掘出人類尚未發(fā)現(xiàn)的模式。

當(dāng)然，利用計(jì)算機(jī)來輔助科學(xué)研究的歷史可以追溯到約 75 年前，然而人類幾千年前就在手工調(diào)查研究數(shù)據(jù)來尋找其中的有意義的模式。但是，近期一些科學(xué)家認(rèn)為以機(jī)器學(xué)習(xí)、人工智能為代表的新技術(shù)能以一種全新的模式去進(jìn)行科研工作。其中一種被稱為生成模型的方法，能從對觀測數(shù)據(jù)的諸多解釋中找到最可信的理論，更為重要的是，該方法在研究中無需預(yù)先編入對于系統(tǒng)可能起作用的物理過程。其擁護(hù)者認(rèn)為，生成模型的創(chuàng)新程度足可以被視為理解宇宙的潛在的“第三種方法”。

在傳統(tǒng)上，我們是通過觀測來了解自然的?；叵胍幌?，開普勒就是通過研究第谷的行星位置表，辨識潛在的行星運(yùn)行模式，才得以推斷出行星是沿橢圓軌道運(yùn)行的。同樣的，科學(xué)可通過模擬來獲得進(jìn)步。一位天文學(xué)家可能會模擬銀河系及其鄰近的仙女座星系的運(yùn)動，并預(yù)測它們將在幾十億年后碰撞。觀測和模擬都有助于科學(xué)家生成假設(shè)，然后用進(jìn)一步的觀測來檢驗(yàn)假設(shè)，而生成模型不同于這兩種方法。

瑞士聯(lián)邦理工學(xué)院的天文物理學(xué)家 Kevin Schawinski 也是一位生成模型的積極支持者。他認(rèn)為：“ 生成模型是介于觀測和模擬之間的第三種方法， 這是解決問題的另一種方式。”

Kevin Schawinski 是一名天體物理學(xué)家，他經(jīng)營著一家名為 Modulos 的人工智能公司，他認(rèn)為一種名為生成模型的技術(shù)提供了第三種了解宇宙的方式。

一些科學(xué)家僅僅把生成模型及其它新技術(shù)當(dāng)作傳統(tǒng)科研中的工具，但是大多數(shù)研究者都認(rèn)為 AI 的影響力巨大，并且在科學(xué)研究領(lǐng)域會發(fā)揮越來越大的作用。費(fèi)米國家加速器實(shí)驗(yàn)室的天體物理學(xué)家 Brian Nord 使用人工神經(jīng)網(wǎng)絡(luò)來研究宇宙。他擔(dān)心沒有什么是不能通過自動化完成的事情，“這個推測倒是有點(diǎn)令人恐慌?！?/p>

來自“生成”的探索

從研究生畢業(yè)時起，Schawinski 就因用數(shù)據(jù)驅(qū)動科學(xué)研究而聞名。在攻讀博士學(xué)位期間，他面對的任務(wù)是，根據(jù)星系的外觀數(shù)據(jù)對數(shù)千個星系進(jìn)行分類。因?yàn)闆]有什么現(xiàn)成的軟件能幫助他完成這項(xiàng)工作，他決定用眾包的方式完成這項(xiàng)工作——于是，銀河動物園（Galaxy Zoo）公民科學(xué)項(xiàng)目誕生了。

從 2007 年開始，普通的電腦用戶只要記錄下他們推測的星系最佳歸類，就能幫助到天文學(xué)家。通過多數(shù)票勝出來判定，通常能帶來正確的分類結(jié)果。

這是一個成功的項(xiàng)目，但 Schawinski 也注意到， AI 讓這個模式過時了——今天，一個具有機(jī)器學(xué)習(xí)和云計(jì)算背景的天才科學(xué)家只需要花費(fèi)一個下午就能完成這個工作。

在 2016 年，Schawinski 把目光投向了生成模型，這個強(qiáng)大的新工具。本質(zhì)上來說，生成模型是在求解，當(dāng)給定條件 X 和觀測結(jié)果 Y 時，概率 P(X,Y) 有多大。這個方法已經(jīng)被證明是非常有效的。

生成模型中最為著名的就是生成對抗網(wǎng)絡(luò)（GAN）。經(jīng)過充分的訓(xùn)練后，GAN 模型能夠修復(fù)損壞和像素缺失的圖像，也能讓模糊的圖像變得清晰。該模型通過競爭（對抗）來學(xué)習(xí)推斷缺失的信息，這個神經(jīng)網(wǎng)絡(luò)的一部分被稱作生成模型（generator）：生成虛擬的數(shù)據(jù)；另一部分被稱為判別模型（discriminator）：把生成出來的虛假數(shù)據(jù)和真是數(shù)據(jù)分割開來。兩個部分交替訓(xùn)練，逐步優(yōu)化（類似于博弈）。

或許，你已經(jīng)看過最近流傳甚廣的GAN生成的假面孔。正如那個標(biāo)題所言“這些人并不存在卻又真實(shí)得嚇人”。

上面看到的臉孔都不是真實(shí)的，上面的 A 列，和左側(cè)的 B 列都是由生成對抗網(wǎng)絡(luò)（GAN）使用真實(shí)的面部元素構(gòu)建的。然后，GAN 將 A 中的面部的基本特征（性別，年齡和臉形）與 B 中的面部的精細(xì)特征（頭發(fā)顏色、眼睛顏色）相結(jié)合，構(gòu)建出了上圖表格中的所有人臉圖像。

潛在空間

概括地說，生成模型獲得數(shù)據(jù)（大多數(shù)是圖像），并把他們分解成抽象的基本要素——科學(xué)家將其稱為數(shù)據(jù)的“潛在空間”。算法能控制潛在空間中的元素，以此來探究這些元素如何影響原始的數(shù)據(jù)。這個方法有助于揭示該系統(tǒng)運(yùn)作的物理過程。

潛在空間是一個抽象的難以想象的概念。不過我們可以做一個類比：當(dāng)你在試圖確定一個人臉的性別時，你的大腦可能在做什么呢？也許會注意到人的發(fā)型、鼻子的形狀，甚至在運(yùn)用一些你無法用言語描述的判斷模式。同樣的，計(jì)算機(jī)程序也在數(shù)據(jù)中尋找顯著的特征。即便計(jì)算機(jī)并非不知道什么是性別，什么是小胡子，但如果我們提供給機(jī)器學(xué)習(xí)系統(tǒng)的數(shù)據(jù)集標(biāo)注了“男性”和“女性”，并且一部分人還有一個標(biāo)簽叫“小胡子”，計(jì)算機(jī)能快速地推斷出其中的關(guān)聯(lián)性。

生成模型與星系演化

12月發(fā)表在《天文學(xué)與天體物理學(xué)》（Astronomy & Astrophysics）上的一篇論文中，Schawinski 與他在蘇黎世聯(lián)邦理工學(xué)院的同事 Dennis Turp 和 Ce Zhang 使用生成模型來研究星系在演化過程中所經(jīng)歷的物理變化。

因?yàn)樗麄兪褂玫能浖c GAN 相似，但其在對潛在空間處理的技術(shù)與 GAN 有所差異，所以從技術(shù)角度來說這不是 GAN。他們的模型創(chuàng)建了人工數(shù)據(jù)集，去測試假設(shè)的物理過程。比如說，他們想知道恒星形成的“淬熄”（形成速率快速下降）與星系環(huán)境密度的增加之間的關(guān)系。

對 Schawinski 來說，關(guān)鍵問題是僅從數(shù)據(jù)中能挖掘出多少和恒星與星系演變相關(guān)的信息。“讓我們忘卻所有的關(guān)于天體物理學(xué)的知識。僅依靠數(shù)據(jù)本身，我們能在多大程度上重新發(fā)現(xiàn)這些知識？”

首先，星系的圖片被壓縮至他們的潛在空間，然后 Schawinski 在這個空間中調(diào)整元素，使其能對應(yīng)上星系的特定環(huán)境變化，比如周圍物質(zhì)的密度。這樣就有了一個假設(shè)生成器。通過重構(gòu)這個星系，讓大量原本處于低密度環(huán)境中的星系處于高密度環(huán)境中以此來看看帶來了什么不同。

這三位研究者注意到隨著星系從低密度環(huán)境走向高密度環(huán)境，它們的顏色會變得更紅，恒星也變得更加集中。Schawinski 指出這一點(diǎn)與現(xiàn)有的星系觀測相吻合，問題是，為什么會這樣？

Schawinski 說，后續(xù)的工作還沒有實(shí)現(xiàn)自動化，“人類必須參與其中，那么，什么樣的物理原理可以解釋這種效應(yīng)？”對于這個過程，可能有兩種解釋，一是在高密度環(huán)境中，星系更紅是因?yàn)槠渲邪烁嗟膲m埃；或者是因?yàn)楹阈堑男纬蓽p少了（換句話說，恒星更老了）。

現(xiàn)在有了生成模型，這兩種思路都能接受檢驗(yàn)。改變與與塵埃和恒星形成率相關(guān)的潛在空間元素，就能觀測這種改變對星系顏色的影響。Schawinski 說：“答案很顯然，星系更紅是因?yàn)楹阈切纬陕试谙陆?，而不是因?yàn)閴m埃。因此，我們應(yīng)該采納這個解釋?！?/p>

利用生成模型，天體物理學(xué)家可以研究星系如何從低密度環(huán)境走向高密度環(huán)境，以及這些變化背后的物理原理。

生成模型相較于傳統(tǒng)方式的優(yōu)勢

這種方法與傳統(tǒng)的模擬方法相近，但與之有關(guān)鍵的差別。Schawinski 表示：“模擬本質(zhì)上是由假設(shè)驅(qū)動的。也就是說，我們自認(rèn)為已經(jīng)洞悉了觀測現(xiàn)象背后的物理法則。所以，我們把恒星形成規(guī)律、暗物質(zhì)行為的原理等等這些我們自認(rèn)為正確的假設(shè)放在一起，模擬運(yùn)行。但是，模擬環(huán)境真的與實(shí)際情況吻合嗎？”。他用生成模型所做的事情與模擬完全相反，“我們不知道任何事情，不做任何假設(shè)，我們希望數(shù)據(jù)本身能告訴我們可能會發(fā)生什么?！?/p>

生成模型在這項(xiàng)研究中取得的成功并不意味著天文學(xué)家和研究者就是多余的。但這似乎提醒研究者們——僅僅掌握了大量數(shù)據(jù)的人工智能系統(tǒng)就能夠完成對天體物理學(xué)的學(xué)習(xí)。Schawinski 說：“這不是完全自動化的科學(xué)，但這意味著我們至少有能力去構(gòu)建部分工具，使科學(xué)過程自動化?！?/p>

雖然生成模型非常強(qiáng)大，但這是否真的代表了一種新的科學(xué)研究方法還有待商榷。

對于紐約大學(xué)和 Flatiron 研究所的宇宙學(xué)家 David Hogg 來說，這項(xiàng)技術(shù)令人印象深刻，但充其量也只是一種從數(shù)據(jù)中提取模式特征的復(fù)雜方法——這是天文學(xué)家?guī)讉€世紀(jì)以來都在做得事情。換而言之，這是觀測、分析的高級形式。

和 Schawinski 相同，Hogg 的工作也充分應(yīng)用人工智能；他一直在利用神經(jīng)網(wǎng)絡(luò)來對恒星進(jìn)行基于光譜特征的分類，并使用數(shù)據(jù)啟動的模型來推斷恒星的其他物理屬性。但是他認(rèn)為他的工作和 Schawinski 的一樣，都是經(jīng)過檢驗(yàn)的科學(xué)。Hogg 表示：“我不認(rèn)為這是第三種方法。只是我們這個社群在對數(shù)據(jù)處理的方法上更加復(fù)雜而已。特別的是，我們越來越善于將數(shù)據(jù)與數(shù)據(jù)進(jìn)行比較。但是依我看來，我的工作仍然是在做觀測?！?/p>

人工智能：

勤奮而“難以捉摸”的科研助手

無論在概念上是否有創(chuàng)新性，人工智能和神經(jīng)網(wǎng)絡(luò)已經(jīng)顯然在當(dāng)代天文學(xué)和物理學(xué)研究中發(fā)揮了關(guān)鍵作用。在海德堡理論研究所工作的物理學(xué)家 Kai Polsterer 領(lǐng)導(dǎo)著一個天體信息學(xué)小組，這個小組主要關(guān)注以數(shù)據(jù)為中心的天體物理學(xué)研究新方法。從星系數(shù)據(jù)集中提取紅移信息曾經(jīng)是一項(xiàng)艱巨的任務(wù)，而現(xiàn)在他們小組使用機(jī)器學(xué)習(xí)算法就能解決這個問題。

Polsterer 認(rèn)為這些基于基于人工智能的新系統(tǒng)是“勤奮的助手”，可以連續(xù)處理數(shù)據(jù)數(shù)個小時而不抱怨單調(diào)無聊，不抱怨工作條件。這些系統(tǒng)可以完成所有枯燥乏味的繁重工作，研究者就能脫身去做“又酷又有趣的科學(xué)工作”。

Polsterer 警告說，這些系統(tǒng)并不是完美的，算法只能去做他們被訓(xùn)練過的事情，系統(tǒng)對輸入的數(shù)據(jù)是“無感覺的”。給 AI 系統(tǒng)一張星系圖片它可以估算其紅移和年齡，但是你給同一個系統(tǒng)一張自拍照或者一張臭魚爛蝦的照片，它也會照方抓藥估算出一個（錯誤的）年齡。Polsterer 認(rèn)為，人類科學(xué)家的監(jiān)督工作非常重要。工作還是要回到研究者身上，研究者才是要負(fù)責(zé)解釋這些現(xiàn)象的人。

就這一點(diǎn)而言，費(fèi)米實(shí)驗(yàn)室的 Nord 警告道，神經(jīng)網(wǎng)絡(luò)不僅要給出結(jié)果，也要給出相關(guān)的誤差線，如果在科學(xué)研究中，你做了一個測量但沒有報告相關(guān)的誤差估計(jì)，就沒有人會認(rèn)真對待這個結(jié)果。

就像許多的人工智能研究員一樣，Nord 也關(guān)注神經(jīng)網(wǎng)絡(luò)給出的結(jié)果的可解釋性，通常來說，一個 AI 系統(tǒng)在給出結(jié)果時無法明確地表示出這個結(jié)果是如何獲得的。

然而，并不是每個人都覺得結(jié)果不透明是一個必須關(guān)注的問題，法國CEA Saclay理論物理研究所的研究員 Lenka Zdeborová 指出，人類的直覺同樣難以捉摸，給你看一張貓的圖片，你能立刻認(rèn)出這是一只貓，但是你并不知道你是怎樣做到這一點(diǎn)的，從這個角度上來說，人的大腦就是個黑盒。

并不僅僅是天體物理學(xué)家和宇宙物理學(xué)家在向人工智能助力、數(shù)據(jù)驅(qū)動的科學(xué)研究發(fā)展。Perimeter 理論物理研究所和安大略滑鐵盧大學(xué)的量子物理學(xué)家 Roger Melko 已經(jīng)使用神經(jīng)網(wǎng)絡(luò)來解決該領(lǐng)域中的一些最棘手最重要的問題，例如多粒子系統(tǒng)的波函數(shù)的數(shù)學(xué)表示。

因?yàn)椴ê瘮?shù)的數(shù)學(xué)形式可能會隨著它所描述的系統(tǒng)中的粒子數(shù)量呈指數(shù)級增長，這被 Melko 稱為是“指數(shù)維度詛咒”，在這樣的工作中 AI 就是不可缺少的組成部分了。

這個困難類似于在國際象棋和圍棋中找到最好的走法：玩家會試圖多看一步，想想對手會出什么招，然后再選擇自己的最佳應(yīng)對策略。但是隨著思考步數(shù)的增加，復(fù)雜性也大為增加。

當(dāng)然， AI 已經(jīng)攻克了這兩個領(lǐng)域。 1997 年 5 月 11 日，深藍(lán)計(jì)算機(jī)在國際象棋領(lǐng)域戰(zhàn)勝了人類；2017年4月10日，AlphaGo 戰(zhàn)勝了柯潔，AI 在圍棋領(lǐng)域戰(zhàn)勝了人類。Melko 認(rèn)為，量子物理學(xué)也面臨同樣的問題。

機(jī)器的思想

無論是 Schawinski 所聲稱的他找到的是科學(xué)研究的“第三方法”，還是如 Hogg 所說的這“僅僅是傳統(tǒng)上的觀測和數(shù)據(jù)分析”。我們可以明確的是， AI 正在改變科學(xué) 探索的方式并且在加速科學(xué)發(fā)現(xiàn)，值得探討的是，這場 AI 革命在科學(xué)領(lǐng)域能走多遠(yuǎn)？

有時候，人們會對“人工智能科學(xué)家”的成就大肆褒獎。十年前，一個名叫亞當(dāng)?shù)?AI 機(jī)器人化學(xué)家研究了面包師傅的酵母的基因組，并找出了負(fù)責(zé)制造某種特定氨基酸的是哪些基因。（亞當(dāng)觀察缺少某些特定基因的酵母菌落，并與擁有這些基因的菌落的行為進(jìn)行比較，由此找到差異完成研究。）

當(dāng)時Wired雜志的標(biāo)題是：機(jī)器人獨(dú)立完成科學(xué)發(fā)現(xiàn)。

最近，格拉斯哥大學(xué)的化學(xué)家 Lee Cronin 在使用機(jī)器人去隨機(jī)混合化學(xué)物質(zhì)，由此來觀測會形成什么樣的化合物，并通過質(zhì)譜儀、核磁共振機(jī)和紅外分光計(jì)實(shí)時監(jiān)控反應(yīng)，這個系統(tǒng)最終能學(xué)會預(yù)測哪些組合的化學(xué)反應(yīng)最為劇烈。Cronin 表示即使這個系統(tǒng)不能帶來新的發(fā)現(xiàn)，機(jī)器人系統(tǒng)也能讓化學(xué)家的研究效率提高 90%。

去年，蘇黎世聯(lián)邦理工學(xué)院的另一組科學(xué)家們在訓(xùn)練神經(jīng)網(wǎng)絡(luò)從數(shù)據(jù)中推導(dǎo)物理定律。他們的系統(tǒng)類似于“機(jī)器人開普勒”，利用從地球上觀測到的太陽和火星的位置信息，重新發(fā)現(xiàn)了日心說；并且通過觀測小球碰撞模型發(fā)現(xiàn)了動能守恒。因?yàn)槲锢矶赏ǔ卸喾N表述形式，科學(xué)家們想知道這個系統(tǒng)能否提供種更簡潔的方法來思考已知的物理定律。

這些都是 AI 啟動、助力科學(xué) 探索的例子。盡管在每一個例子中，這些新方法的革命性都會收到爭議。但在這個信息浩如煙海且高速增長的時代，最值得商榷的問題可能是：僅從數(shù)據(jù)中，我們能獲得多少信息？

在《The Book of Why: The New Science of Cause and Effect》一書中，計(jì)算機(jī)科學(xué)家 Judea Pearl 和科學(xué)作家 Dana Mackenzie 斷言到：數(shù)據(jù)“愚蠢至極”。他們寫到： 關(guān)于因果性的問題“永遠(yuǎn)不能僅憑數(shù)據(jù)去尋找答案”。

“每當(dāng)你看到以無模型的方式分析數(shù)據(jù)的論文或研究時，你可以肯定的是這項(xiàng)研究成果僅僅是總結(jié)，或許做了轉(zhuǎn)述，但絕對不是在解釋數(shù)據(jù)。”Schawinski 對 Pearl 的觀點(diǎn)抱有同感，“只使用數(shù)據(jù)”這個想法有點(diǎn)類似于“稻草人”。他也從未生成以這樣的方式做因果推斷。他想說的是：“和我們通常的工作相比，我們可以用數(shù)據(jù)多做點(diǎn)事?！?/p>

另一個經(jīng)常聽到的觀點(diǎn)是： 科學(xué)需要創(chuàng)造力。

可是到目前為止，我們還不知道，如何將創(chuàng)造力編入計(jì)算機(jī)。（Cronin 的機(jī)器人化學(xué)家只是在簡單地嘗試科研工作，似乎不能算是特別有創(chuàng)造力）Polsterer 認(rèn)為：“創(chuàng)建一套理論，有理有據(jù)的理論，我認(rèn)為需要創(chuàng)造力，而創(chuàng)造力離不開人類。”

然而，創(chuàng)造力來自何方呢？Polsterer 懷疑這和 不喜歡無聊 有關(guān)，這恐怕是機(jī)器所沒有的體驗(yàn)。“要擁有創(chuàng)造力，你必須厭惡無聊，然而我認(rèn)為電腦就永遠(yuǎn)不會感受到無聊?！比欢?，“創(chuàng)造力”、“靈感”卻常常用來描述深藍(lán)、AlphaGo 這樣的 AI 程序。我們在描述機(jī)器的思想時的困難映射出我們在描述自己思維過程時的困難。

Schawinski 最近離開了學(xué)術(shù)界，去了私人企業(yè)。他現(xiàn)在經(jīng)營著一家名為 Modulos 的初創(chuàng)公司，該公司雇傭了許多聯(lián)邦理工學(xué)院的科學(xué)家。根據(jù)該公司的網(wǎng)站介紹，該公司位于“人工智能和機(jī)器學(xué)習(xí)這股風(fēng)潮的風(fēng)眼中”。無論當(dāng)前人工智能技術(shù)和成熟的人工智能之間存在多大的差距，他和其他專家都認(rèn)為機(jī)器已經(jīng)準(zhǔn)備好了去完成更多的科學(xué)家的工作。不過，AI 的局限性還有待考證。

Schawinski 暢想道：“在可以預(yù)見的未來，有沒有可能去制造出一臺能過發(fā)現(xiàn)物理定律、數(shù)學(xué)原理的機(jī)器，甚至超越當(dāng)今最聰明的人類的能力極限？科學(xué)的未來終將被人力所不能及的機(jī)器所掌握么？這是一個好問題，但我不知道答案?！?/p>

推薦閱讀

Nature機(jī)器智能：破解因果推斷難題

物理學(xué)家要失業(yè)？機(jī)器學(xué)習(xí)能自學(xué)量子力學(xué)！

做科研做到絕望是一種什么樣的體驗(yàn)？

科研投入越來越多，重大成果的產(chǎn)出卻越來越少？

要不要加入我們？一起影響世界！

集智俱樂部QQ群｜877391004

商務(wù)合作及投稿轉(zhuǎn)載｜swarma@swarma.org

搜索公眾號：集智俱樂部

加入“沒有圍墻的研究所”

讓蘋果砸得更猛烈些吧！

二、如何組建人工智能團(tuán)隊(duì)：11個關(guān)鍵角色

音樂家、化學(xué)家、物理學(xué)家能為企業(yè)的人工智能團(tuán)隊(duì)帶來什么啟發(fā)?將有很多。人們需要了解人工智能的一系列技能和角色，其中包括非技術(shù)性的技能和角色，它們將推動人工智能的成功應(yīng)用。

人工智能計(jì)劃的成功可能取決于藝術(shù)和哲學(xué)，也取決于數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)。這是因?yàn)槠髽I(yè)有效部署人工智能需要建立一個全面的團(tuán)隊(duì)，其中包括來自各種背景和技能集的人員，以及非技術(shù)角色。

Ness數(shù)字工程公司首席技術(shù)官M(fèi)osheKranc說，“任何人工智能計(jì)劃都需要IT專家和行業(yè)領(lǐng)域?qū)＜业慕Y(jié)合。IT專家了解機(jī)器學(xué)習(xí)工具包：哪些算法系列最有可能解決特定問題?如何調(diào)整特定的算法以提高結(jié)果的準(zhǔn)確性?而行業(yè)領(lǐng)域?qū)＜規(guī)硖囟I(lǐng)域的知識：哪些數(shù)據(jù)源可用?數(shù)據(jù)有多臟?機(jī)器學(xué)習(xí)算法的建議質(zhì)量如何?如果沒有行業(yè)領(lǐng)域?qū)＜业妮斎?，IT專家可能無法回答這些問題?！?/p>

因此得出的結(jié)論是：人工智能的成功確實(shí)依賴于團(tuán)隊(duì)，而不是任何個人或角色。

SAS公司執(zhí)行副總裁兼首席信息官Keith Collins說，“當(dāng)建立一支有效的人工智能團(tuán)隊(duì)時，我們需要尋求行業(yè)專家或超級團(tuán)隊(duì)，而團(tuán)隊(duì)合作才會贏得勝利。多元化的學(xué)科是人工智能成功的關(guān)鍵?！?/p>

人工智能人才的四大核心類型

Collins認(rèn)為人工智能團(tuán)隊(duì)需要四個核心類型的人員：

•了解業(yè)務(wù)流程對于建立真實(shí)場景和有價值的結(jié)果至關(guān)重要的人員。

•了解機(jī)器學(xué)習(xí)、統(tǒng)計(jì)、預(yù)測和優(yōu)化等分析技術(shù)并且正確使用的人員。

•了解數(shù)據(jù)來自哪里，質(zhì)量如何，如何維護(hù)安全和信任的人員。

•了解如何通過結(jié)果來實(shí)施分析的人工智能架構(gòu)師。

Collins指出，與其他IT領(lǐng)導(dǎo)者和人工智能專家一樣，這些核心學(xué)科或角色可以從各種背景中汲取靈感。他以音樂、化學(xué)、物理等學(xué)科為例。

他說：“這些學(xué)科鼓勵人們從復(fù)雜的交互系統(tǒng)中理解科學(xué)的過程和思維。他們通常擅長建立良好實(shí)驗(yàn)所需的批判性思維技能和應(yīng)用機(jī)器學(xué)習(xí)的成果?！?/p>

多元化人工智能團(tuán)隊(duì)的價值

多元化團(tuán)隊(duì)的價值范圍廣泛：例如，它可以幫助企業(yè)更好地應(yīng)對人工智能偏見。解決業(yè)務(wù)問題(包括最大和最棘手的問題)也很重要，這可能是企業(yè)首先制定人工智能戰(zhàn)略的原因之一。

Very公司高級數(shù)據(jù)科學(xué)家和物聯(lián)網(wǎng)實(shí)踐主管Jeff McGehee說，“人們普遍認(rèn)為，多樣化的意見對于解決所有復(fù)雜的問題至關(guān)重要。多樣性與生活體驗(yàn)有關(guān)，專業(yè)背景是大多數(shù)人生活體驗(yàn)的重要組成部分，它可以為人工智能項(xiàng)目增加維度，并為尋找創(chuàng)新解決方案提供新的視角?！?/p>

McGehee還指出，建立人工智能或其他不同的團(tuán)隊(duì)需要企業(yè)的積極努力，并作為招聘和雇傭?qū)嵺`的一部分。企業(yè)會發(fā)現(xiàn)實(shí)現(xiàn)多樣性可能不是一個可行的團(tuán)隊(duì)建設(shè)策略。

考慮到這一點(diǎn)，需要了解對于人工智能團(tuán)隊(duì)具有價值的一系列專家和角色，其中包括非技術(shù)角色。

1.領(lǐng)域?qū)＜?/p>

人們可以將這些角色和人員視為主題專家。無論使用哪個術(shù)語，都需要了解他們對企業(yè)的人工智能計(jì)劃的重要性。

McGehee說，“開發(fā)人工智能系統(tǒng)需要深入了解系統(tǒng)運(yùn)行的領(lǐng)域。開發(fā)人工智能系統(tǒng)的專家很少會成為系統(tǒng)實(shí)際領(lǐng)域的專家。行業(yè)領(lǐng)域?qū)＜铱梢蕴峁╆P(guān)鍵見解，使人工智能系統(tǒng)發(fā)揮最佳性能?！?/p>

Ness公司Kranc指出，這些專家可以解決其所在領(lǐng)域針對企業(yè)和戰(zhàn)略的問題。

他表示，行業(yè)領(lǐng)域?qū)＜翌愋腿Q于要解決的問題。無論所需的洞察力是在創(chuàng)收和運(yùn)營效率還是在供應(yīng)鏈管理方面，行業(yè)領(lǐng)域?qū)＜叶夹枰卮疬@些問題：

•哪些見解最有價值?

•收集的有關(guān)行業(yè)領(lǐng)域的數(shù)據(jù)是否可以作為見解的基礎(chǔ)?

•得出的見解是否具有意義?

以下將介紹一些特定的行業(yè)領(lǐng)域示例，但首先了解一下人工智能團(tuán)隊(duì)中的其他一些關(guān)鍵角色。

2.數(shù)據(jù)科學(xué)家

Jane.ai公司人工智能研發(fā)主管Dave Costenaro表示，這是人工智能團(tuán)隊(duì)在新建項(xiàng)目上工作的三個關(guān)鍵需求中的第一個。其示例項(xiàng)目包括聊天代理、計(jì)算機(jī)視覺系統(tǒng)或預(yù)測引擎。

Costenaro說，“數(shù)據(jù)科學(xué)家有著各種背景，如統(tǒng)計(jì)學(xué)、工程學(xué)、計(jì)算機(jī)科學(xué)、心理學(xué)、哲學(xué)、音樂等，通常都具有強(qiáng)烈的好奇心，這迫使他們深入系統(tǒng)中尋找和使用模式，例如他們可以為人工智能項(xiàng)目提供什么，確定它能做什么，并訓(xùn)練它做到這一點(diǎn)。”

3.數(shù)據(jù)工程師

Costenaro說，“程序員從數(shù)據(jù)科學(xué)家那里獲得想法、模型、算法，并通過規(guī)范化代碼、使其在服務(wù)器上運(yùn)行以及成功地與適當(dāng)?shù)挠脩簟⒃O(shè)備、API等進(jìn)行對話，并將它們變?yōu)楝F(xiàn)實(shí)。”

4.產(chǎn)品設(shè)計(jì)師

Costenaro表示，三項(xiàng)關(guān)鍵需求的最終結(jié)果也說明了人工智能團(tuán)隊(duì)的非技術(shù)專業(yè)知識的價值。

他說：“產(chǎn)品設(shè)計(jì)師也來自各種背景，例如藝術(shù)、設(shè)計(jì)、工程、管理、心理學(xué)、哲學(xué)。他們?yōu)樗韬陀杏玫臇|西制定了路線圖?！?/p>

5. 人工智能倫理學(xué)家和社會學(xué)家

人工智能倫理學(xué)家和社會學(xué)家可能在某些部門(特別是醫(yī)療保健或政府部門)中發(fā)揮著至關(guān)重要的作用，但在廣泛的使用案例中似乎可能會變得越來越重要。

McGehee說，“人工智能系統(tǒng)的一個重要組成部分是了解它如何影響人們，以及代表性不足的群體是否受到公平對待。如果一個系統(tǒng)具有前所未有的準(zhǔn)確性，但沒有產(chǎn)生預(yù)期的社會影響，它注定會失敗?！?/p>

6.律師

McGehee表示，在這個新興領(lǐng)域也看到了對法律專業(yè)知識的單獨(dú)而相關(guān)的需求。McGehee說，“GDPR法規(guī)為制定圍繞算法決策的法規(guī)樹立了先例。隨著世界各國對人工智能在工業(yè)中的應(yīng)用越來越了解，預(yù)計(jì)將出臺更多的法律。精通這一領(lǐng)域的律師可能是一種寶貴的財富?！?/p>

由于行業(yè)領(lǐng)域?qū)＜胰绱酥匾?，正如Kranc和McGehee所闡述的那樣，有必要研究一些行業(yè)領(lǐng)域的具體例子，其中包括技術(shù)和非技術(shù)領(lǐng)域。這些領(lǐng)域應(yīng)該是人工智能團(tuán)隊(duì)建設(shè)的一部分，具體取決于企業(yè)的特定目標(biāo)和用例。

Jane.ai公司的Costenaro指出，“由于人工智能通常只是增強(qiáng)現(xiàn)有商業(yè)用例的一個使能層，因此過去支持過這個用例的團(tuán)隊(duì)成員仍然是具有價值的，出于同樣的原因也是必不可少的?！?/p>

Costenaro提供了五個可能具有價值的人工智能貢獻(xiàn)者的角色示例，并解釋了如何在人工智能環(huán)境中調(diào)整和增強(qiáng)現(xiàn)有角色。

7. 高管和策略師

Costenaro說，“企業(yè)高管領(lǐng)導(dǎo)層將需要考慮哪些業(yè)務(wù)模式可以通過人工智能實(shí)現(xiàn)自動化和改進(jìn)，并權(quán)衡來自以下團(tuán)隊(duì)的新機(jī)會和風(fēng)險，如數(shù)據(jù)隱私、人機(jī)交互等?！?/p>

8. IT主管

不要對非技術(shù)角色的價值感到困惑：如果沒有IT，企業(yè)的人工智能戰(zhàn)略就不會走得太遠(yuǎn)。 Costenaro指出，IT團(tuán)隊(duì)需要解決以下問題：“如果正在為模型培訓(xùn)積累和存儲大量數(shù)據(jù)，那么將如何確保數(shù)據(jù)的隱私性和安全性?此外，將如何存儲并從服務(wù)器到客戶的設(shè)備快速可靠地提供服務(wù)?”

Costenaro補(bǔ)充道，這也將推動對DevOps專業(yè)人士和擁有云原生技術(shù)(如容器和編排)專業(yè)知識人員需求的不斷增長。而IT部門有機(jī)會使用諸如聊天機(jī)器人之類的人工智能工具來簡化內(nèi)部服務(wù)。

9.人力資源領(lǐng)導(dǎo)者

Costenaro說，“與此類似，人力資源部也有很多機(jī)會通過使用像聊天機(jī)器人這樣的人工智能工具來為客戶提供服務(wù)，從而提高效率?！?/p>

此外，人力資源似乎很可能成為評估組織內(nèi)人工智能影響的一個重要參與者，這與McGehee將倫理學(xué)家和律師等角色包括在內(nèi)并沒有不同。

10.營銷和銷售領(lǐng)導(dǎo)者

正如Kranc指出的那樣，如果企業(yè)的人工智能計(jì)劃與創(chuàng)收相關(guān)，那么應(yīng)該考慮從銷售和營銷等領(lǐng)域添加領(lǐng)域?qū)I(yè)知識。

Costenaro還指出，作為人工智能項(xiàng)目的一部分，銷售和營銷專業(yè)人員可能需要利用銷售自動化工具和機(jī)器人流程自動化(RPA)等技術(shù)來增強(qiáng)他們現(xiàn)有的技能和流程。

11.運(yùn)營專家

在整個IT部門內(nèi)，運(yùn)營和DevOps專業(yè)人員都有特定的領(lǐng)域?qū)I(yè)知識來實(shí)施人工智能計(jì)劃。Costenaro列舉了以下問題作為需要在哪里運(yùn)用專業(yè)知識的例子：

•哪些可以實(shí)現(xiàn)自動化和改進(jìn)?

•如果使用機(jī)器學(xué)習(xí)模型，將如何創(chuàng)建新的數(shù)據(jù)收集流程以持續(xù)培訓(xùn)和改進(jìn)這些模型?

•可以從開源存儲庫中獲取現(xiàn)成的、預(yù)先訓(xùn)練好的模型和/或數(shù)據(jù)集，從而獲得巨大的先機(jī)嗎?第三方供應(yīng)商提供的API服務(wù)是否會考慮一些任務(wù)和用例?

雖然人工智能可以解決一些重大問題，但也一定會產(chǎn)生新的挑戰(zhàn)。這就是構(gòu)成多元化團(tuán)隊(duì)的根本原因。

McGehee說。“具有不同背景和個性的人員關(guān)注不同的項(xiàng)目細(xì)節(jié)和限制因素，這很有用，因?yàn)樗岣吡怂兄匾?xì)節(jié)的可能性，并提供了確定解決方案的整體方法?！?

三、教人工智能以“我”的視角看世界

來源: 科技日報

教人工智能以“我”的視角看世界

世界是多維的，生活中同樣的景物在不同的視角下會呈現(xiàn)出不同的形態(tài)。若要讓人工智能更像人類，就要讓其視角更接近人。從人類的角度觀察環(huán)境，人工智能或許會看到一個新的天地。

近日，由臉譜（Facebook）和9個國家的13所大學(xué)及實(shí)驗(yàn)室組成的學(xué)術(shù)聯(lián)盟宣布，11月將開源讓人工智能擁有以第一人稱視角與世界進(jìn)行交互能力的Ego4D(Egocentric 4D Perception)項(xiàng)目。這個項(xiàng)目包含超過3025小時的第一人稱視頻，涉及來自73個城市的700多名參與者的日常生活。這些視頻將有助于使人工智能認(rèn)知世界的方式更加趨向于人類。

那么，目前人工智能主要通過哪種視角認(rèn)知世界，不同視角對于人工智能認(rèn)知環(huán)境會產(chǎn)生哪些影響？人工智能感知環(huán)境、認(rèn)識世界主要通過哪些技術(shù)？想要認(rèn)知世界的方式更像人類，人工智能還需突破哪些瓶頸？

人工智能通常采用第三人稱視角

“要令人工智能系統(tǒng)如同人類一樣與世界交互，人工智能領(lǐng)域需要發(fā)展出一種全新的第一人稱感知范式。這意味著人工智能在實(shí)時運(yùn)動、交互時，要以第一人稱視角理解日?；顒印！蹦樧V首席研究科學(xué)家克里斯汀·格勞曼曾言。

如何理解人工智能的第一人稱和第三人稱視角？譚茗洲解釋道：“第一人稱視角代入感很強(qiáng)，比如在玩游戲時，你如身臨其境，看到的游戲畫面就是你真實(shí)世界看到的畫面。第三人稱視角又叫作上帝視角，仿佛你一直飄在角色身邊一樣，如影隨形，可以看到角色本身及周圍的情況。例如，第三人稱視角下藏在掩體后可以看到掩體前面的情況；而在第一人稱視角下，囿于視角范圍，在掩體后則只能看到掩體本身?！?/p>

“再如自動駕駛，其視覺系統(tǒng)如果只從旁觀者的（如車的角度）收集數(shù)據(jù)，即便通過數(shù)十萬個基于旁觀視角看到的車輛行進(jìn)圖像或視頻進(jìn)行訓(xùn)練，人工智能可能依然不知道如何去做，很難達(dá)到現(xiàn)在的自動駕駛水平。因?yàn)檫@種旁觀者的視角與坐在車內(nèi)方向盤前的視角很不一樣，第一人稱視角下，真人駕駛員做出的反應(yīng)還包括點(diǎn)剎、猛剎等行為，這些數(shù)據(jù)是從旁觀者視角無法搜集的?！弊T茗洲進(jìn)一步說。

“以前人工智能界很少以第一人稱視角收集數(shù)據(jù)集，這個項(xiàng)目彌補(bǔ)了人工智能視角體系的短板。未來AR、VR的發(fā)展十分重要，如果人工智能可以從‘我’出發(fā)，以第一人稱視角來觀察理解世界，將開啟人類和人工智能沉浸式體驗(yàn)的新時代?！弊T茗洲指出。

克里斯汀·格勞曼也表示：“下一代人工智能系統(tǒng)需要從一種完全不同的數(shù)據(jù)中學(xué)習(xí)，即從事件中心視覺而不是邊線視覺展示世界的視頻中學(xué)習(xí)?！?/p>

建立真實(shí)世界數(shù)據(jù)集

目前讓人工智能感知環(huán)境、認(rèn)識世界，建立類人化的認(rèn)知體系主要通過什么“抓手”展開？

業(yè)內(nèi)專家指出，歷史證明，基準(zhǔn)和數(shù)據(jù)集是人工智能行業(yè)創(chuàng)新的關(guān)鍵催化劑。今天，幾乎可以識別圖像中任何對象的計(jì)算機(jī)視覺系統(tǒng)都是建立在數(shù)據(jù)集和基準(zhǔn)之上的，數(shù)據(jù)集和基準(zhǔn)為研究人員提供了一個研究真實(shí)世界圖像的實(shí)驗(yàn)臺。

“臉譜日前發(fā)布的這個項(xiàng)目，其實(shí)本身就是建立一個數(shù)據(jù)集，旨在訓(xùn)練人工智能模型更像人類。其開發(fā)了5個圍繞第一人稱視覺體驗(yàn)的基準(zhǔn)挑戰(zhàn)，即把第一人稱視角拆解成5個目標(biāo)，開展相應(yīng)的訓(xùn)練集競賽?！弊T茗洲指出。

Ego4D的5個基準(zhǔn)是：情景記憶，什么時候發(fā)生？預(yù)測，我接下來可能會做什么？手—物交互，我在做什么？視聽日記，誰在什么時候說了什么？社交互動，誰在和誰互動？

譚茗洲強(qiáng)調(diào)，上述基準(zhǔn)測試將促進(jìn)開發(fā)人工智能助手所必需的構(gòu)建模塊的研究。人工智能助手不僅可以理解現(xiàn)實(shí)世界中的指令并與之交互，同時可以在元宇宙中實(shí)現(xiàn)對元宇宙中指令的理解和交互。

為了建立這個數(shù)據(jù)集，與臉譜合作的大學(xué)團(tuán)隊(duì)向研究參與者分發(fā)了現(xiàn)成的頭戴式攝像頭和其他可穿戴傳感器，以便捕獲第一人稱的、未經(jīng)編輯的日常生活視頻。項(xiàng)目的重點(diǎn)是參與者從日常場景中捕獲視頻，比如購物、烹飪、邊玩游戲邊聊天，以及與家人和朋友進(jìn)行其他團(tuán)體活動等。

視頻采集了攝像頭佩戴者在特定環(huán)境中選擇注視的對象，以及攝像頭佩戴者如何從自我中心角度與人和物互動。到目前為止，攝像頭佩戴者已經(jīng)執(zhí)行了數(shù)百項(xiàng)活動，并與數(shù)百種不同的對象進(jìn)行交互，項(xiàng)目的所有數(shù)據(jù)都是公開的。

“臉譜這項(xiàng)研究能夠更快地推動人工智能領(lǐng)域自我中心認(rèn)知研究的進(jìn)步。這將對我們未來的生活、工作和娛樂方式產(chǎn)生積極影響?！弊T茗洲表示。

讓人工智能認(rèn)知能力更像人

人工智能發(fā)展的終極目標(biāo)是讓人類受益，讓我們能夠應(yīng)對現(xiàn)實(shí)世界中日益復(fù)雜的挑戰(zhàn)。想象一下，通過AR設(shè)備能夠在琴、棋、書、畫課堂中準(zhǔn)確顯示如何彈琴、下棋、握筆和勾勒；形象生動地指導(dǎo)家庭主婦根據(jù)食譜烘焙燒烤、烹飪菜肴；健忘的老人借以眼前全息圖的幫助回憶過去……

臉譜強(qiáng)調(diào)，希望通過Ego4D項(xiàng)目為學(xué)術(shù)界和行業(yè)專家開辟一條全新的道路，幫助構(gòu)建更智能、更靈活和更具交互性的計(jì)算機(jī)視覺系統(tǒng)。隨著人工智能越加深入理解人類的日常生活方式，相信將這個項(xiàng)目能以前所未有的方式對人工智能的體驗(yàn)進(jìn)行情境化和個性化。然而，目前的研究還只是觸及自我中心認(rèn)知的皮毛。

“第二，還需要以事件和行為的關(guān)聯(lián)為研究中心，定義人工智能的行為。一件事情的發(fā)生包括多個行為，要用人類反饋的方式訓(xùn)練人工智能系統(tǒng)，使人工智能的行為與我們的意圖一致?！弊T茗洲進(jìn)一步表示。

譚茗洲強(qiáng)調(diào)：“此外，聽覺和視覺、語言和行為等之間還需要配合、響應(yīng)、聯(lián)動，這就要構(gòu)建多模態(tài)交互模型，縱深研究視角為何會聚焦投向并與意圖識別相結(jié)合，形成與行為之間聯(lián)動的機(jī)制等?！?

四、學(xué)習(xí)人工智能，需要什么數(shù)學(xué)基礎(chǔ)？

需要必備的知識有:

1、線性代數(shù)：如何將研究對象形式化？

2、概率論：如何描述統(tǒng)計(jì)規(guī)律？

3、數(shù)理統(tǒng)計(jì)：如何以小見大？

4、最優(yōu)化理論：如何找到最優(yōu)解？

5、信息論：如何定量度量不確定性？

6、形式邏輯：如何實(shí)現(xiàn)抽象推理？

7、線性代數(shù)：如何將研究對象形式化？

人工智能簡介: