-
當(dāng)前位置:首頁(yè) > 創(chuàng)意學(xué)院 > 技術(shù) > 專題列表 > 正文
openai首席技術(shù)官(it首席技術(shù)官)
大家好!今天讓創(chuàng)意嶺的小編來(lái)大家介紹下關(guān)于openai首席技術(shù)官的問(wèn)題,以下是小編對(duì)此問(wèn)題的歸納整理,讓我們一起來(lái)看看吧。
ChatGPT國(guó)內(nèi)免費(fèi)在線使用,一鍵生成原創(chuàng)文章、方案、文案、工作計(jì)劃、工作報(bào)告、論文、代碼、作文、做題和對(duì)話答疑等等
只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,越精準(zhǔn),寫(xiě)出的就越詳細(xì),有微信小程序端、在線網(wǎng)頁(yè)版、PC客戶端
官網(wǎng):https://ai.de1919.com
本文目錄:
一、馬斯克躋身全球第四大富豪,旗下都有哪些公司?
1、SpaceX
2020 年 5 月 30 日,有史以來(lái)第一次,一家私人商業(yè)航空航天公司將宇航員送入地球太空軌道。將 NASA 宇航員 Robert Behnken 和 Douglas Hurley 送入太空的火箭就是馬斯克旗下的 spaceX 的獵鷹 9 號(hào),搭載宇航員的"龍"飛船也是出自 spaceX。這是馬斯克火星殖民野心的一部分。
2、The Boring Company
該公司的最終目標(biāo)是在主要城市建立隧道網(wǎng)絡(luò),以緩解地面交通。該公司在其網(wǎng)站上辯稱,隧道是城市的一個(gè)很好的解決方案。
3、Neuralink
你能想象有一天,電影《黑客帝國(guó)》中的腦接口儀器會(huì)實(shí)現(xiàn),馬斯克曾宣稱,腦鏈接口可以讓人的大腦類似電腦硬件一樣,擴(kuò)展人的神經(jīng)系統(tǒng)。
4、OpenAI
OpenAI 是特斯拉自動(dòng)駕駛系統(tǒng),以及腦鏈接口的擴(kuò)展。
5、特斯拉
特斯拉甚至超過(guò)了豐田,成為市值最大的汽車制造公司,也是新世紀(jì)以來(lái)成長(zhǎng)最快的制造業(yè)公司;也許特斯拉在中國(guó)上海、德國(guó)柏林等都已經(jīng)有新的超級(jí)工廠的規(guī)劃,旗下電動(dòng)汽車也成為了世界各地的明星汽車產(chǎn)品。
二、馬斯克的交易
轉(zhuǎn):Aliens On Earth Elon Musk Has His Doubts
作為Space X的首席執(zhí)行官和創(chuàng)始人,埃隆·馬斯克完全知道外星人是否存在(他之前聲稱是外星人創(chuàng)造了金字塔)。Space X是第一家發(fā)射宇宙飛船抵達(dá)國(guó)際空間站并將人類送上太空的私營(yíng)公司。最近在喬·羅根博客的采訪中,羅根問(wèn)他是否有外星生命體存在,并且正在訪問(wèn)地球時(shí)。馬斯克搖了搖頭,回答說(shuō):“不,據(jù)我所知,沒(méi)有直接證據(jù)表明地球上有外星生命。如果外星生物在地球上,那么多擁有iPhone的人為什么沒(méi)有任何照片證據(jù)?五角大樓和中央情報(bào)局公布的UFO是模糊的黑白畫(huà)面視頻。這句話的意思是,目前還不清楚UFO是否來(lái)自外星?!?/p>
除了擔(dān)任Space X和特斯拉公司的首席執(zhí)行官之外,馬斯克還是開(kāi)發(fā)腦機(jī)接口的Neuralink和開(kāi)發(fā)下一代人工智能的OpenAI的聯(lián)合創(chuàng)始人。同時(shí),馬斯克也是鉆探公司的首席執(zhí)行官,該公司負(fù)責(zé)鉆探地下運(yùn)輸隧道,所有這些都讓馬斯克成為了“世界上最富有的人”。
人們很容易就能找到那些相信外星生命存在的人,不管他們是否訪問(wèn)過(guò)地球。大多數(shù)主流科學(xué)家和天文學(xué)家都同意這一點(diǎn)。
大家有沒(méi)有想過(guò),一家高調(diào)的太空運(yùn)輸公司,執(zhí)著于過(guò)時(shí)的火箭推進(jìn)技術(shù)。這關(guān)于深層國(guó)家和陰謀集團(tuán)對(duì)未來(lái)的邪惡計(jì)劃,所以馬斯克當(dāng)然會(huì)支持深層國(guó)家掩蓋大量外星種族存在的證據(jù),那些秘密團(tuán)體的特工們正在不斷的與這些種族互動(dòng)。自1947年CIA和MJ 12成立以來(lái),DS一直在壓制外星人的存在和他們的先進(jìn)技術(shù)不受地球人的影響。他們只想獨(dú)占這種先進(jìn)的外星技術(shù),這樣他們就可以統(tǒng)治地球和我們的太陽(yáng)系。由于馬斯克和這個(gè)由政府、銀行家和實(shí)業(yè)家組成的精英陰謀集團(tuán)的聯(lián)系如此緊密,他擁有幾乎所有的資源和人脈,他一定知道外星生命存在的真相。我的猜測(cè)是,他已經(jīng)將自己的股份出售給Deep State,使用過(guò)時(shí)的火箭推進(jìn)技術(shù)來(lái)維持地球的隔離狀態(tài)和先進(jìn) 科技 存在的真相。抵抗運(yùn)動(dòng)曾表示,“馬斯克是某個(gè)正面SSP派系的名人,他在和光明勢(shì)力合作,有可能成為壓縮突破的引導(dǎo)者。但很可惜,他現(xiàn)在已經(jīng)沒(méi)有在和光明勢(shì)力合作了。他本質(zhì)上是一個(gè)被光明會(huì)創(chuàng)傷編程控制的好人,他現(xiàn)在與光明會(huì)合作并積極配合他們的議程——利用星鏈衛(wèi)星加強(qiáng)隔離地球的電磁能量網(wǎng)格?!?/p>
#馬斯克# #spacex# #外星人#[/cp]
三、openai什么時(shí)候可以中文的
2022年6月,openai再2022年6月的時(shí)候可以中文的,在2015年open AI出現(xiàn)的時(shí)候,一直是沒(méi)有中文的,但是在2020年的時(shí)候,官方宣布準(zhǔn)備設(shè)置三種語(yǔ)言。顧大家進(jìn)行使用。直到2022年六月份正式版出現(xiàn),已經(jīng)完全可以使用open AI來(lái)用中文操作了。
四、alphago是什么語(yǔ)言開(kāi)發(fā)的
Android以Java為編程語(yǔ)言,使接口到功能,都有層出不窮的變化,其中Activity等同于J2ME的MIDlet,一個(gè) Activity 類(class)負(fù)責(zé)創(chuàng)建視窗(window),一個(gè)活動(dòng)中的Activity就是在 foreground(前景)模式,背景運(yùn)行的程序叫做Service。兩者之間.
英語(yǔ)作文human vs alphago
Google's artificial intelligence-driven AlphaGo sofare program will challenge Ke Jie, the world's top professional Go player, at China's Future of Go Summit in May. The prospect of this petition beeen human and artificial intelligence has captured the attention of the Chinese public, where the game was invented more than 2,500 years ago, and driven interest in Google's DeepMind machine learning method that developed AlphaGo.We believe a machine could never replace a person as an adversary in future.It's a cold machine without blood, while we have spiritual power.
怎么看待alphago的這個(gè)失誤
谷歌非常有謀略,先讓阿爾法狗連贏三次,奠定勝利的事實(shí),展示人工智能的厲害!讓人恐慌! 然后,谷歌讓阿爾法狗輸棋給李世石,以明白無(wú)誤的方式告訴恐慌的人們:不要害怕,我們掌控著人工智能的! 如果人工智能把人逼上絕路,人工智能產(chǎn)業(yè)就會(huì)遭到人們的封殺! 谷歌輸一局,緩和局面。
中日韓還有成千上萬(wàn)圍棋學(xué)習(xí)者和相關(guān)從業(yè)人員,Google是商業(yè)公司,當(dāng)然不會(huì)把事情做絕,肯定會(huì)考量這方面的因素。
比賽結(jié)束,alphago四比一完勝李世石,僅勝利的一局有很多人認(rèn)為是谷歌為了讓alphago有世界排名而故意輸?shù)囊痪?,因?yàn)槿绻粋€(gè)棋手一直連勝,是沒(méi)有世界排名的,輸了一局才有排名,按照官方發(fā)布目前alphago排名世界第二,中國(guó)小將柯杰世界第一。
如何評(píng)價(jià)AlphaGo的圍棋水平
AlphaGo能夠戰(zhàn)勝李世石的確證明了他是有職業(yè)頂尖的水平,也就是的職業(yè)九段,其計(jì)算能力與局部分析能力超越職業(yè)九段!可是,AlphaGo要想拿到職業(yè)冠軍是基本不可能的,因?yàn)樗粫?huì)自主學(xué)習(xí),需要輸入對(duì)方的棋譜才能占優(yōu)優(yōu)勢(shì)。
此外,在局部與大局的判斷上,AlphaGo是有缺陷的,如果是遇到巔峰時(shí)期的李昌鎬或是聶老聶衛(wèi)平先生,折現(xiàn)缺點(diǎn)就會(huì)被無(wú)限放大。
總而言之,現(xiàn)在它的對(duì)局還是太少了,需要更多的對(duì)局與研究,看不同的棋風(fēng)與派別對(duì)它的勝率的影響,究竟綜合實(shí)力是多少,還需要考究!
人工智能的利與弊作文結(jié)尾?
機(jī)器人還是不一樣,完全不受外界與情緒的任何干擾,坐下便拼殺起來(lái)。
它的芯片經(jīng)歷了十年換代,幾乎對(duì)所有圍棋套路了如指掌,面對(duì)我的每一步棋,都能識(shí)破我的意圖,找到最合適的解決方法,更別提失誤了,而我卻并不急躁,慢慢悠悠,心中早已打好了算盤。
這盤棋下得出奇得慢,半個(gè)月,1個(gè)月,我也并不著急,AlphaGo作為一個(gè)高智商機(jī)器人也能準(zhǔn)確捕捉到我的所有需求,我們不僅棋下得有條不紊,它更是端茶倒水,冷風(fēng)熱氣,無(wú)微不至。
這棋轉(zhuǎn)眼便下了三個(gè)月,我打定主意,心中不急,這AlphaGo作為機(jī)器人便更不知著急了,倒是觀眾們耐心早已磨完,他們催促也好,咒罵也罷,我自不動(dòng),每日只想一步棋,每日只下一步棋,但我內(nèi)心卻從未平靜。
我等待著機(jī)會(huì),更等待著靈感,后來(lái)已無(wú)人有心再關(guān)注這場(chǎng)比賽,我的心中也越發(fā)平靜了。
直到那一天,我依如往常早早起床,一邊誦讀著道德經(jīng),一邊在園中散步。
突然,一個(gè)靈感穿過(guò)我的頭腦,一個(gè)陰陽(yáng)卦象圖轉(zhuǎn)變?yōu)榱艘环灞P,“我若擊殺這個(gè)未曾關(guān)注過(guò)的棋點(diǎn),他豈不再無(wú)機(jī)會(huì)?”我哈哈大笑,回到棋盤前,下了這一步我等了許久的棋,不出所料,AlphaGo一籌莫展,投子認(rèn)輸。
世界轟動(dòng),人們重新將關(guān)注點(diǎn)拉到了我身上,我也不過(guò)多解釋,手放背后:“道可道,非常道……”我先人一盤棋能下幾個(gè)月,參悟世間之道,下的是道,而非棋,這豈是一個(gè)機(jī)器人能理解的?”從此之后,人們不再挑戰(zhàn)AlphaGo,亦不再過(guò)度追求棋中勝負(fù),他們好像也沉靜了下來(lái),回歸了這項(xiàng)運(yùn)動(dòng)最本質(zhì)的精髓,思考人生,思考自然,思考世界,找到了心中的那片桃花源。
如何評(píng)價(jià)柯潔與 AlphaGo 的對(duì)決
柯潔經(jīng)歷了英雄般的戰(zhàn)斗后,依然第二局輸給AlphaGo。
最有價(jià)值的信息可能來(lái)自AlphaGo之父薩比斯,中盤階段他評(píng)論說(shuō):“不可思議,根據(jù)AlphaGo的評(píng)估,柯潔現(xiàn)在下得很完美。
”賽后薩比斯則評(píng)論:“這是一場(chǎng)驚心動(dòng)魄的令人驚奇的比賽,柯潔幾乎把AlphaGo逼到了極限。
”柯潔今天的最大收獲是測(cè)出阿法狗的真實(shí)水平。
期望這次比賽能夠驗(yàn)證。
當(dāng)然它有兩個(gè)前提條件,一是柯潔把最好水平發(fā)揮出來(lái),二是AlphaGo能夠經(jīng)受真正的考驗(yàn),而不是表面看它只贏一兩個(gè)子,實(shí)際上后臺(tái)勝率顯示根本沒(méi)有機(jī)會(huì)。
前天的第一局,AlphaGo贏了1.5目。
這是一個(gè)很小的差距,但柯潔下得談不上多出色,因?yàn)閺念^到尾他基本沒(méi)什么機(jī)會(huì)。
AlphaGo并不是一個(gè)賭徒,能贏100目絕不贏99;它是根據(jù)勝率估算來(lái)行棋的,如果贏1目而它認(rèn)為勝率是100%,就沒(méi)必要去下贏100目而勝率只有99%的棋。
所以,第一局柯潔遠(yuǎn)遠(yuǎn)沒(méi)有逼出AlphaGo的真正實(shí)力。
昨天AlphaGo方面的消息,認(rèn)為這次雖然只是一個(gè)單機(jī)版,但棋力已經(jīng)比去年贏李世石的時(shí)候提高了三子。
這是一個(gè)挺嚇人的消息,因?yàn)樗鼤?huì)讓人類棋手覺(jué)得,目前這個(gè)版本至少比人類強(qiáng)三子以上。
老實(shí)講這挺絕望的,三子以上,四子。
那等于徹底宣布人類棋手跟AlphaGo已經(jīng)是天壤之別。
知道,面對(duì)一個(gè)可以讓四子的對(duì)手,這是職業(yè)和業(yè)余的差距,比賽已經(jīng)失去意義,準(zhǔn)確地說(shuō)那叫戲耍。
它可以只贏1目甚至半目,但不說(shuō)明任何問(wèn)題,就像柯潔也可以讓只輸半目,但那又能說(shuō)明什么。
難道會(huì)跑大街上喊,快看,柯潔只贏了半目。
誰(shuí)都知道,柯潔想怎么贏就怎么贏,半目和100目沒(méi)差別。
今天的比賽,由于“幾乎把AlphaGo逼到了極限”,雖然不是讓子棋,但基本可以猜出,在人類棋手高水平發(fā)揮的前提下,目前AlphaGo讓不到人類三子,可能是二子或者略多。
掛盤講解的李世石也做出這種判斷:AlphaGo并沒(méi)有提升三子的實(shí)力,估計(jì)大概有二子。
至此,本次比賽人類棋手的目標(biāo)或者說(shuō)心愿已經(jīng)達(dá)到:測(cè)試出AlphaGo的真正實(shí)力。
否則,AlphaGo就永遠(yuǎn)是上帝般的存在。
知道它強(qiáng),但不知道它到底多強(qiáng),所以它就是上帝。
知道,沒(méi)有上帝。
如果由于無(wú)法評(píng)測(cè)AI(人工智能)的水平,而把它視為上帝一樣的存在,這不是人類進(jìn)化或者說(shuō)發(fā)展的方向。
等于把命運(yùn)交給未知,哪怕這個(gè)未知是人類創(chuàng)造出來(lái)的,也有理由疑慮甚至恐懼。
所以要感謝柯杰,不愧圍棋第一人,他今天的勇氣和表現(xiàn),至少讓暫時(shí)可以從外部角度了解到AlphaGo的真實(shí)水平。
這是比勝負(fù)更重要的事情。
如何評(píng)價(jià)AlphaGo
題目:《人工智能》3月15日,舉世矚目的“人機(jī)大戰(zhàn)”塵埃落定,人工智能“阿爾法狗圍棋”(AlphaGo)以4:1的比分戰(zhàn)勝人類圍棋頂尖高手李世石九段,為世人留下一個(gè)不愿接受又不得不接受的事實(shí)。
面對(duì)“阿爾法狗圍棋”(AlphaGo),有人不服,如中國(guó)的超級(jí)圍棋新星柯潔九段,就公開(kāi)向“阿爾法狗圍棋”(AlphaGo)叫板:“你贏不了我!”有人嘆息:人類智慧最后的尊嚴(yán)在一只“小狗”面前丟失。
有人甚至悲觀地認(rèn)為,機(jī)器統(tǒng)治人類的時(shí)代即將來(lái)臨。
其實(shí),所謂人類尊嚴(yán)、所謂機(jī)器人的統(tǒng)治時(shí)代,只是我們一些人的臆想,“阿爾法狗圍棋”(AlphaGo)的勝利,說(shuō)到底就是一次技術(shù)革命的勝利,是人類對(duì)自身的一次超越。
正如西安交通大學(xué)副校長(zhǎng)、國(guó)家重點(diǎn)基礎(chǔ)研究計(jì)劃(973)“基于視認(rèn)知的非結(jié)構(gòu)化信息處理基礎(chǔ)理論與關(guān)鍵技術(shù)”首席科學(xué)家徐宗本說(shuō)的:“任何人工智能技術(shù)的成功一定是當(dāng)代最新技術(shù)綜合運(yùn)用的成功,片面說(shuō)成誰(shuí)戰(zhàn)勝誰(shuí)是不公平的,也是無(wú)意義的,說(shuō)人類智慧的最后壁壘被攻破,這都是無(wú)稽之談。
”“阿爾法狗圍棋”(AlphaGo)的勝利,背后的最大價(jià)值在于,它激勵(lì)人們持續(xù)不斷地探索過(guò)去人工智能領(lǐng)域一直看似難以實(shí)現(xiàn)的人類智能級(jí)別。
從這一點(diǎn)上看,人工智能的勝利也有非凡的意義,甚至可以說(shuō)具有劃時(shí)代的意義。
是的,翻開(kāi)人類歷史,哪一次技術(shù)革命不帶來(lái)人類社會(huì)翻天覆地的變化?蒸汽機(jī)的發(fā)明、使用,使人類從農(nóng)業(yè)手工業(yè)時(shí)代進(jìn)入了工業(yè)社會(huì);電動(dòng)機(jī)的誕生,使人類從工業(yè)社會(huì)跨入了現(xiàn)代化。
而以原子能、電子計(jì)算機(jī)、空間技術(shù)和生物工程的發(fā)明與應(yīng)用為主要標(biāo)志的信息技術(shù)革命,更讓人類從此進(jìn)入了自動(dòng)化、信息化時(shí)代。
每一次技術(shù)革命,伴隨的都是生產(chǎn)力的發(fā)展和人類自身的解放。
“阿爾法狗圍棋”(AlphaGo)的 勝利,是不是會(huì)掀起又一次技術(shù)革命,我們還需拭目以待。
然而,人工智能的進(jìn)步,卻可以讓我們展望到人類美妙無(wú)比的前景。
我們似乎可以看到,不久的將來(lái),到 處都是機(jī)器人在人們的指令下為人們服務(wù);我們似乎可以看到,那些對(duì)于目前醫(yī)術(shù)來(lái)說(shuō)幾乎無(wú)解的人類大腦和神經(jīng)疾病,如自閉癥、老年癡呆癥這樣的國(guó)際醫(yī)學(xué)難 題,隨著人工智能的進(jìn)步,一切都會(huì)迎刃而解;我們似乎可以看到,有了人工智能的協(xié)助,人類真正步入了大同的理想社會(huì)。
是的,“阿爾法狗圍棋”(AlphaGo)的勝利,是人類的智慧向前邁出的又一步,有了這一步,我們的世界將更加美好。
當(dāng)然,面對(duì)這些進(jìn)步,我們不能只是圍觀、娛樂(lè)和敬仰,我們應(yīng)該用我們的智慧,去促成人工智能更大的進(jìn)步!
AlphaGo是什么 谷歌AlphaGo全解讀
AlphaGo一般指阿爾法圍棋阿爾法圍棋(AlphaGo)是第一個(gè)擊敗人類職業(yè)圍棋選手、第一個(gè)戰(zhàn)勝圍棋世界冠軍的人工智能程序。
其主要工作原理是“深度學(xué)習(xí)”。
阿爾法圍棋(AlphaGo)是一款圍棋人工智能程序。
其主要工作原理是“深度學(xué)習(xí)”。
“深度學(xué)習(xí)”是指多層的人工神經(jīng)網(wǎng)絡(luò)和訓(xùn)練它的方法。
一層神經(jīng)網(wǎng)絡(luò)會(huì)把大量矩陣數(shù)字作為輸入,通過(guò)非線性激活方法取權(quán)重,再產(chǎn)生另一個(gè)數(shù)據(jù)集合作為輸出。
這就像生物神經(jīng)大腦的工作機(jī)理一樣,通過(guò)合適的矩陣數(shù)量,多層組織鏈接一起,形成神經(jīng)網(wǎng)絡(luò)“大腦”進(jìn)行精準(zhǔn)復(fù)雜的處理,就像人們識(shí)別物體標(biāo)注圖片一樣。
對(duì)于最強(qiáng)AlphaGo Zero如何煉成的真心話,都在這里
最強(qiáng)AlphaGo Zero怎樣煉成剛剛,Deepmind在Reddit的Machine Learning板塊舉辦了在線答疑活動(dòng)AMA,Deepmind強(qiáng)化學(xué)習(xí)組負(fù)責(zé)人David Silver和其同事熱情地回答了網(wǎng)友們提出的各種問(wèn)題。
由于在AMA前一天Deepmind剛剛發(fā)表了《Mastering the game of Go without human knowledge》(不使用人類知識(shí)掌握圍棋)的論文,相關(guān)的提問(wèn)和討論也異常熱烈。
什么是AMA?AMA(Ask Me Anything)是由Reddit的特色欄目,你也可以將其理解為在線的“真心話大冒險(xiǎn)”。
AMA一般會(huì)約定一個(gè)時(shí)間,并提前若干天在Reddit上收集問(wèn)題,回答者統(tǒng)一解答。
本次Deepmind AMA的回答人是:David Silver:Deepmind強(qiáng)化學(xué)習(xí)組負(fù)責(zé)人,AlphaGo首席研究員。
David Silver1997年畢業(yè)于劍橋大學(xué),獲得艾迪生威斯利獎(jiǎng)。
David于2004年在阿爾伯塔大學(xué)獲得計(jì)算機(jī)博士學(xué)位,2013年加盟DeepMind,是AlphaGo項(xiàng)目的主要技術(shù)負(fù)責(zé)人。
Julian Schritieser:Deepmind高級(jí)軟件工程師。
此前有多位機(jī)器學(xué)習(xí)界的大牛/公司在Reddit Machine Learning版塊開(kāi)設(shè)AMA,包括:Google Brain Team、OpenAI Research Team 、Andrew Ng and Adam Coates、Jürgen Schmidhuber、Geoffrey Hinton、Michael Jordan 、Yann LeCun、Yoshua Bengio等。
我們從今天Deepmind的AMA中選取了一些代表性的問(wèn)題,整理如下:關(guān)于論文與技術(shù)細(xì)節(jié)Q: Deepmind Zero的訓(xùn)練為什么如此穩(wěn)定?深層次的增強(qiáng)學(xué)習(xí)是不穩(wěn)定和容易遺忘的,自我對(duì)局也是不穩(wěn)定和容易遺忘的,如果沒(méi)有一個(gè)好的基于模仿的初始化狀態(tài)和歷史檢查點(diǎn),二者結(jié)合在一起應(yīng)該是一個(gè)災(zāi)難...但Zero從零開(kāi)始,我沒(méi)有看到論文中有這部分的內(nèi)容,你們是怎么做到的呢?David Silver:在深層增強(qiáng)學(xué)習(xí)上,AlphaGo Zero與典型的無(wú)模式算法(如策略梯度或者Q學(xué)習(xí))采用的是完全不同的算法。
通過(guò)使用AlphaGo搜索,我們可以極大改進(jìn)策略和自我對(duì)局的結(jié)果,然后我們會(huì)用簡(jiǎn)單的、基于梯度的更新來(lái)訓(xùn)練下一個(gè)策略及價(jià)值網(wǎng)絡(luò)。
比起基于簡(jiǎn)便的基于梯度的策略改進(jìn),這樣的做法會(huì)更加穩(wěn)定。
Q:我注意到ELO等級(jí)分增長(zhǎng)的數(shù)據(jù)只與到第40天,是否是因?yàn)檎撐慕馗宓脑??或者說(shuō)之后AlphaGo的數(shù)據(jù)不再顯著改善?David Silver:AlphaGo已經(jīng)退役了!這意味著我們將人員和硬件資源轉(zhuǎn)移到其他AI問(wèn)題中,我們還有很長(zhǎng)的路要走吶。
Q:關(guān)于論文的兩個(gè)問(wèn)題:Q1:您能解釋為什么AlphaGo的殘差塊輸入尺寸為19x19x17嗎?我不知道為什么每個(gè)對(duì)局者需要用8個(gè)堆疊的二進(jìn)制特征層來(lái)描述?我覺(jué)得1、2個(gè)層就夠了啊。
雖然我不是100%理解圍棋的規(guī)則,但8個(gè)層看起來(lái)也多了點(diǎn)吧?Q2:由于整個(gè)通道使用自我對(duì)局與最近的/最好的模型進(jìn)行比較,你們覺(jué)得這對(duì)于采用參數(shù)空間的特定SGD驅(qū)動(dòng)軌跡對(duì)否會(huì)有過(guò)擬合的風(fēng)險(xiǎn)?David Silver:說(shuō)起來(lái)使用表征可能比現(xiàn)在用的8層堆疊的做法更好!但我們使用堆疊的方式觀察歷史數(shù)據(jù)有三個(gè)原因:1)它與其他領(lǐng)域的常見(jiàn)輸入一致;2)我們需要一些歷史狀態(tài)來(lái)表示被KO;3)如果有一些歷史數(shù)據(jù),我們可以更好地猜測(cè)對(duì)手最近下的位置,這可以作為一種關(guān)注機(jī)制(注:在圍棋中,這叫“敵之要點(diǎn)即我之要點(diǎn)”),而第17層用于標(biāo)注我們現(xiàn)在究竟是執(zhí)黑子還是白子,因?yàn)橐紤]貼目的關(guān)系。
Q:有了強(qiáng)大的棋類引擎,我們可以給玩家一個(gè)評(píng)級(jí)——例如Elo圍棋等級(jí)分就是通過(guò)棋手對(duì)局的分析逐步得出的,那么AlphaGo是否可以對(duì)過(guò)去有等級(jí)分前的棋手的實(shí)力進(jìn)行分析?這可能為研究人類的認(rèn)知提供一個(gè)平臺(tái)。
Julian Schritieser:感謝分享,這個(gè)主意很棒!我認(rèn)為在圍棋中這完全可以做到,或許可以用最佳應(yīng)對(duì)和實(shí)際應(yīng)對(duì)的價(jià)值差異或者政策網(wǎng)絡(luò)給每一手位置評(píng)估得到的概率來(lái)進(jìn)行?我有空的時(shí)候試一下。
Q: 既然AlphaGo已經(jīng)退役了,是否有將其開(kāi)源的計(jì)劃?這將對(duì)圍棋社區(qū)和機(jī)器學(xué)習(xí)研究產(chǎn)生巨大的影響。
還有,Hassabis在烏鎮(zhèn)宣稱的圍棋工具將會(huì)什么時(shí)候發(fā)布?David Silver:現(xiàn)在這個(gè)工具正在準(zhǔn)備中。
不久后你就能看到新的消息。
Q:AlphaGo開(kāi)發(fā)過(guò)程中,在系統(tǒng)架構(gòu)上遇到的最大障礙是什么?David Silver:我們遇到的一個(gè)重大挑戰(zhàn)是在和李世石比賽的時(shí)候,當(dāng)時(shí)我們意識(shí)到AlphaGo偶爾會(huì)受到我們所謂的“妄想”的影響,也就是說(shuō),程序可能會(huì)錯(cuò)誤理解當(dāng)前盤面局勢(shì),并在錯(cuò)誤的方向上持續(xù)許多步。
我們嘗試了許多方案,包括引入更多的圍棋知識(shí)或人類元知識(shí)來(lái)解決這個(gè)問(wèn)題。
但最終我們?nèi)〉昧顺晒Γ瑥腁lphaGo本身解決了這個(gè)問(wèn)題,更多地依靠強(qiáng)化學(xué)習(xí)的力量來(lái)獲得更高質(zhì)量的解決方案。
圍棋愛(ài)好者的問(wèn)題Q:1846年,在十四世本因坊跡目秀策與十一世井上幻庵因碩的一盤對(duì)局中,秀策下的第127手讓幻庵因碩一時(shí)驚急兩耳發(fā)赤,該手成為扭轉(zhuǎn)敗局的“耳赤一手”。
如果是AlphaGo,是否也會(huì)下出相同的一首棋?Julian Schritieser:我問(wèn)了樊麾,他的回答是這樣的:當(dāng)時(shí)的圍棋不貼目,而AlphaGo的對(duì)局中,黑棋需貼7.5目。
貼目情況不同造成了古今棋局的差異,如果讓AlphaGo穿越到當(dāng)年下那一手,很有可能下的是不同的另一個(gè)地方。
Q:從已發(fā)布的AlphaGo相互對(duì)局看,執(zhí)白子的時(shí)間更為充裕,因...
AlphaGo這個(gè)系統(tǒng)主要由幾個(gè)部分組成:走棋網(wǎng)絡(luò)(Policy Neork),給定當(dāng)前局面,預(yù)測(cè)/采樣下一步的走棋。
快速走子(Fast rollout),目標(biāo)和1一樣,但在適當(dāng)犧牲走棋質(zhì)量的條件下,速度要比1快1000倍。
估值網(wǎng)絡(luò)(Value Neork),給定當(dāng)前局面,估計(jì)是白勝還是黑勝。
蒙特卡羅樹(shù)搜索(Monte Carlo Tree Search,MCTS),把以上這三個(gè)部分連起來(lái),形成一個(gè)完整的系統(tǒng)。
我們的DarkForest和AlphaGo同樣是用4搭建的系統(tǒng)。
DarkForest較AlphaGo而言,在訓(xùn)練時(shí)加強(qiáng)了1,而少了2和3,然后以開(kāi)源軟件Pachi的缺省策略 (default policy)部分替代了2的功能。
以下介紹下各部分。
1、走棋網(wǎng)絡(luò)走棋網(wǎng)絡(luò)把當(dāng)前局面作為輸入,預(yù)測(cè)/采樣下一步的走棋。
它的預(yù)測(cè)不只給出最強(qiáng)的一手,而是對(duì)棋盤上所有可能的下一著給一個(gè)分?jǐn)?shù)。
棋盤上有361個(gè)點(diǎn),它就給出361個(gè)數(shù),好招的分?jǐn)?shù)比壞招要高。
DarkForest在這部分有創(chuàng)新,通過(guò)在訓(xùn)練時(shí)預(yù)測(cè)三步而非一步,提高了策略輸出的質(zhì)量,和他們?cè)谑褂迷鰪?qiáng)學(xué)習(xí)進(jìn)行自我對(duì)局后得到的走棋網(wǎng)絡(luò)(RL neork)的效果相當(dāng)。
當(dāng)然,他們并沒(méi)有在最后的系統(tǒng)中使用增強(qiáng)學(xué)習(xí)后的網(wǎng)絡(luò),而是用了直接通過(guò)訓(xùn)練學(xué)習(xí)到的網(wǎng)絡(luò)(SL neork),理由是RL neork輸出的走棋缺乏變化,對(duì)搜索不利。
有意思的是在AlphaGo為了速度上的考慮,只用了寬度為192的網(wǎng)絡(luò),而并沒(méi)有使用最好的寬度為384的網(wǎng)絡(luò)(見(jiàn)圖2(a)),所以要是GPU更快一點(diǎn)(或者更多一點(diǎn)),AlphaGo肯定是會(huì)變得更強(qiáng)的。
所謂的0.1秒走一步,就是純粹用這樣的網(wǎng)絡(luò),下出有最高置信度的合法著法。
這種做法一點(diǎn)也沒(méi)有做搜索,但是大局觀非常強(qiáng),不會(huì)陷入局部戰(zhàn)斗中,說(shuō)它建模了“棋感”一點(diǎn)也沒(méi)有錯(cuò)。
我們把DarkForest的走棋網(wǎng)絡(luò)直接放上KGS就有3d的水平,讓所有人都驚嘆了下。
可以說(shuō),這一波圍棋AI的突破,主要得益于走棋網(wǎng)絡(luò)的突破。
這個(gè)在以前是不可想像的,以前用的是基于規(guī)則,或者基于局部形狀再加上簡(jiǎn)單線性分類器訓(xùn)練的走子生成法,需要慢慢調(diào)參數(shù)年,才有進(jìn)步。
當(dāng)然,只用走棋網(wǎng)絡(luò)問(wèn)題也很多,就我們?cè)贒arkForest上看到的來(lái)說(shuō),會(huì)不顧大小無(wú)謂爭(zhēng)劫,會(huì)無(wú)謂脫先,不顧局部死活,對(duì)殺出錯(cuò),等等。
有點(diǎn)像高手不經(jīng)認(rèn)真思考的隨手棋。
因?yàn)樽咂寰W(wǎng)絡(luò)沒(méi)有價(jià)值判斷功能,只是憑“直覺(jué)”在下棋,只有在加了搜索之后,電腦才有價(jià)值判斷的能力。
2、快速走子那有了走棋網(wǎng)絡(luò),為什么還要做快速走子呢?有兩個(gè)原因,首先走棋網(wǎng)絡(luò)的運(yùn)行速度是比較慢的,AlphaGo說(shuō)是3毫秒,我們這里也差不多,而快速走子能做到幾微秒級(jí)別,差了1000倍。
所以在走棋網(wǎng)絡(luò)沒(méi)有返回的時(shí)候讓CPU不閑著先搜索起來(lái)是很重要的,等到網(wǎng)絡(luò)返回更好的著法后,再更新對(duì)應(yīng)的著法信息。
其次,快速走子可以用來(lái)評(píng)估盤面。
由于天文數(shù)字般的可能局面數(shù),圍棋的搜索是毫無(wú)希望走到底的,搜索到一定程度就要對(duì)現(xiàn)有局面做個(gè)估分。
在沒(méi)有估值網(wǎng)絡(luò)的時(shí)候,不像國(guó)象可以通過(guò)算棋子的分?jǐn)?shù)來(lái)對(duì)盤面做比較精確的估值,圍棋盤面的估計(jì)得要通過(guò)模擬走子來(lái)進(jìn)行,從當(dāng)前盤面一路走到底,不考慮岔路地算出勝負(fù),然后把勝負(fù)值作為當(dāng)前盤面價(jià)值的一個(gè)估計(jì)。
這里有個(gè)需要權(quán)衡的地方:在同等時(shí)間下,模擬走子的質(zhì)量高,單次估值精度高但走子速度慢;模擬走子速度快乃至使用隨機(jī)走子,雖然單次估值精度低,但可以多模擬幾次算平均值,效果未必不好。
所以說(shuō),如果有一個(gè)質(zhì)量高又速度快的走子策略,那對(duì)于棋力的提高是非常有幫助的。
為了達(dá)到這個(gè)目標(biāo),神經(jīng)網(wǎng)絡(luò)的模型就顯得太慢,還是要用傳統(tǒng)的局部特征匹配(local pattern matching)加線性回歸(logistic regression)的方法,這辦法雖然不新但非常好使,幾乎所有的廣告推薦,競(jìng)價(jià)排名,新聞排序,都是用的它。
與更為傳統(tǒng)的基于規(guī)則的方案相比,它在吸納了眾多高手對(duì)局之后就具備了用梯度下降法自動(dòng)調(diào)參的能力,所以性能提高起來(lái)會(huì)更快更省心。
AlphaGo用這個(gè)辦法達(dá)到了2微秒的走子速度和24.2%的走子準(zhǔn)確率。
24.2%的意思是說(shuō)它的最好預(yù)測(cè)和圍棋高手的下子有0.242的概率是重合的,相比之下,走棋網(wǎng)絡(luò)在GPU上用2毫秒能達(dá)到57%的準(zhǔn)確率。
這里,我們就看到了走子速度和精度的權(quán)衡。
和訓(xùn)練深度學(xué)習(xí)模型不同,快速走子用到了局部特征匹配,自然需要一些圍棋的領(lǐng)域知識(shí)來(lái)選擇局部特征。
對(duì)此AlphaGo只提供了局部特征的數(shù)目(見(jiàn)Extended Table 4),而沒(méi)有說(shuō)明特征的具體細(xì)節(jié)。
我最近也實(shí)驗(yàn)了他們的辦法,達(dá)到了25.1%的準(zhǔn)確率和4-5微秒的走子速度,然而全系統(tǒng)整合下來(lái)并沒(méi)有復(fù)現(xiàn)他們的水平。
我感覺(jué)上24.2%并不能完全概括他們快速走子的棋力,因?yàn)橹灰咤e(cuò)關(guān)鍵的一步,局面判斷就完全錯(cuò)誤了;而圖2(b)更能體現(xiàn)他們快速走子對(duì)盤面形勢(shì)估計(jì)的精確度,要能達(dá)到他們圖2(b)這樣的水準(zhǔn),比簡(jiǎn)單地匹配24.2%要做更多的工作,而他們并未在文章中強(qiáng)調(diào)這一點(diǎn)。
在AlphaGo有了快速走子之后,不需要走棋網(wǎng)絡(luò)和估值網(wǎng)絡(luò),不借助任何深度學(xué)習(xí)和GPU的幫助,不使用增強(qiáng)學(xué)習(xí),在單機(jī)上就已經(jīng)達(dá)到了3d的水平(見(jiàn)Extended Table 7倒數(shù)第二行),這是相當(dāng)厲害的了。
任何使用傳統(tǒng)方法在單機(jī)上達(dá)...
轉(zhuǎn)載請(qǐng)注明出處作文大全網(wǎng) » alphago是什么語(yǔ)言開(kāi)發(fā)的
以上就是關(guān)于openai首席技術(shù)官相關(guān)問(wèn)題的回答。希望能幫到你,如有更多相關(guān)問(wèn)題,您也可以聯(lián)系我們的客服進(jìn)行咨詢,客服也會(huì)為您講解更多精彩的知識(shí)和內(nèi)容。
推薦閱讀:
openai官網(wǎng)地址(openapi官網(wǎng))
openai為什么國(guó)內(nèi)不讓用(open it up為什么下架)
社區(qū)景觀設(shè)計(jì)說(shuō)明(社區(qū)景觀設(shè)計(jì)說(shuō)明怎么寫(xiě))