-
當前位置:首頁 > 創(chuàng)意學院 > 技術 > 專題列表 > 正文
人工智能訓練模型(人工智能訓練模型過程)
大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關于人工智能訓練模型的問題,以下是小編對此問題的歸納整理,讓我們一起來看看吧。
ChatGPT國內(nèi)免費在線使用,一鍵生成原創(chuàng)文章、方案、文案、工作計劃、工作報告、論文、代碼、作文、做題和對話答疑等等
只需要輸入關鍵詞,就能返回你想要的內(nèi)容,越精準,寫出的就越詳細,有微信小程序端、在線網(wǎng)頁版、PC客戶端
官網(wǎng):https://ai.de1919.com
本文目錄:
一、AI人工智能-CNN概念輕松入門
假設給定一張圖(可能是字母X或者字母O),通過CNN即可識別出是X還是O,如下圖所示,那怎么做到的呢
如果采用經(jīng)典的神經(jīng)網(wǎng)絡模型,則需要讀取整幅圖像作為神經(jīng)網(wǎng)絡模型的輸入(即全連接的方式),當圖像的尺寸越大時,其連接的參數(shù)將變得很多,從而導致計算量非常大。
而我們?nèi)祟悓ν饨绲恼J知一般是從局部到全局,先對局部有感知的認識,再逐步對全體有認知,這是人類的認識模式。在圖像中的空間聯(lián)系也是類似,局部范圍內(nèi)的像素之間聯(lián)系較為緊密,而距離較遠的像素則相關性較弱。因而,每個神經(jīng)元其實沒有必要對全局圖像進行感知,只需要對局部進行感知,然后在更高層將局部的信息綜合起來就得到了全局的信息。這種模式就是卷積神經(jīng)網(wǎng)絡中降低參數(shù)數(shù)目的重要神器:局部感受野。
如果字母X、字母O是固定不變的,那么最簡單的方式就是圖像之間的像素一一比對就行,但在現(xiàn)實生活中,字體都有著各個形態(tài)上的變化(例如手寫文字識別),例如平移、縮放、旋轉(zhuǎn)、微變形等等,如下圖所示:
我們的目標是對于各種形態(tài)變化的X和O,都能通過CNN準確地識別出來,這就涉及到應該如何有效地提取特征,作為識別的關鍵因子。
回想前面講到的“局部感受野”模式,對于CNN來說,它是一小塊一小塊地來進行比對,在兩幅圖像中大致相同的位置找到一些粗糙的特征(小塊圖像)進行匹配,相比起傳統(tǒng)的整幅圖逐一比對的方式,CNN的這種小塊匹配方式能夠更好的比較兩幅圖像之間的相似性。如下圖:
以字母X為例,可以提取出三個重要特征(兩個交叉線、一個對角線),如下圖所示:
假如以像素值"1"代表白色,像素值"-1"代表黑色,則字母X的三個重要特征如下:
那么這些特征又是怎么進行匹配計算呢?(不要跟我說是像素進行一一匹配的,汗?。?/p>
這時就要請出今天的重要嘉賓:卷積。那什么是卷積呢,不急,下面慢慢道來。
當給定一張新圖時,CNN并不能準確地知道這些特征到底要匹配原圖的哪些部分,所以它會在原圖中把每一個可能的位置都進行嘗試,相當于把這個feature(特征)變成了一個過濾器。這個用來匹配的過程就被稱為卷積操作,這也是卷積神經(jīng)網(wǎng)絡名字的由來。
卷積的操作如下圖所示:
是不是很像把毛巾沿著對角卷起來,下圖形象地說明了為什么叫「卷」積
在本案例中,要計算一個feature(特征)和其在原圖上對應的某一小塊的結(jié)果,只需將兩個小塊內(nèi)對應位置的像素值進行乘法運算,然后將整個小塊內(nèi)乘法運算的結(jié)果累加起來,最后再除以小塊內(nèi)像素點總個數(shù)即可(注:也可不除以總個數(shù)的)。
如果兩個像素點都是白色(值均為1),那么1 1 = 1,如果均為黑色,那么(-1) (-1) = 1,也就是說,每一對能夠匹配上的像素,其相乘結(jié)果為1。類似地,任何不匹配的像素相乘結(jié)果為-1。具體過程如下(第一個、第二個……、最后一個像素的匹配結(jié)果):
根據(jù)卷積的計算方式,第一塊特征匹配后的卷積計算如下,結(jié)果為1
對于其它位置的匹配,也是類似(例如中間部分的匹配)
計算之后的卷積如下
以此類推,對三個特征圖像不斷地重復著上述過程,通過每一個feature(特征)的卷積操作,會得到一個新的二維數(shù)組,稱之為feature map。其中的值,越接近1表示對應位置和feature的匹配越完整,越是接近-1,表示對應位置和feature的反面匹配越完整,而值接近0的表示對應位置沒有任何匹配或者說沒有什么關聯(lián)。如下圖所示:
可以看出,當圖像尺寸增大時,其內(nèi)部的加法、乘法和除法操作的次數(shù)會增加得很快,每一個filter的大小和filter的數(shù)目呈線性增長。由于有這么多因素的影響,很容易使得計算量變得相當龐大。
為了有效地減少計算量,CNN使用的另一個有效的工具被稱為“池化(Pooling)”。池化就是將輸入圖像進行縮小,減少像素信息,只保留重要信息。
池化的操作也很簡單,通常情況下,池化區(qū)域是2 2大小,然后按一定規(guī)則轉(zhuǎn)換成相應的值,例如取這個池化區(qū)域內(nèi)的最大值(max-pooling)、平均值(mean-pooling)等,以這個值作為結(jié)果的像素值。
下圖顯示了左上角2 2池化區(qū)域的max-pooling結(jié)果,取該區(qū)域的最大值max(0.77,-0.11,-0.11,1.00),作為池化后的結(jié)果,如下圖:
池化區(qū)域往左,第二小塊取大值max(0.11,0.33,-0.11,0.33),作為池化后的結(jié)果,如下圖:
其它區(qū)域也是類似,取區(qū)域內(nèi)的最大值作為池化后的結(jié)果,最后經(jīng)過池化后,結(jié)果如下:
對所有的feature map執(zhí)行同樣的操作,結(jié)果如下:
最大池化(max-pooling)保留了每一小塊內(nèi)的最大值,也就是相當于保留了這一塊最佳的匹配結(jié)果(因為值越接近1表示匹配越好)。也就是說,它不會具體關注窗口內(nèi)到底是哪一個地方匹配了,而只關注是不是有某個地方匹配上了。
通過加入池化層,圖像縮小了,能很大程度上減少計算量,降低機器負載。
常用的激活函數(shù)有sigmoid、tanh、relu等等,前兩者sigmoid/tanh比較常見于全連接層,后者ReLU常見于卷積層。
回顧一下前面講的感知機,感知機在接收到各個輸入,然后進行求和,再經(jīng)過激活函數(shù)后輸出。激活函數(shù)的作用是用來加入非線性因素,把卷積層輸出結(jié)果做非線性映射。
在卷積神經(jīng)網(wǎng)絡中,激活函數(shù)一般使用ReLU(The Rectified Linear Unit,修正線性單元),它的特點是收斂快,求梯度簡單。計算公式也很簡單,max(0,T),即對于輸入的負值,輸出全為0,對于正值,則原樣輸出。
下面看一下本案例的ReLU激活函數(shù)操作過程:
第一個值,取max(0,0.77),結(jié)果為0.77,如下圖
第二個值,取max(0,-0.11),結(jié)果為0,如下圖
以此類推,經(jīng)過ReLU激活函數(shù)后,結(jié)果如下:
對所有的feature map執(zhí)行ReLU激活函數(shù)操作,結(jié)果如下:
通過將上面所提到的卷積、激活函數(shù)、池化組合在一起,就變成下圖:
通過加大網(wǎng)絡的深度,增加更多的層,就得到了深度神經(jīng)網(wǎng)絡,如下圖:
全連接層在整個卷積神經(jīng)網(wǎng)絡中起到“分類器”的作用,即通過卷積、激活函數(shù)、池化等深度網(wǎng)絡后,再經(jīng)過全連接層對結(jié)果進行識別分類。
首先將經(jīng)過卷積、激活函數(shù)、池化的深度網(wǎng)絡后的結(jié)果串起來,如下圖所示:
由于神經(jīng)網(wǎng)絡是屬于監(jiān)督學習,在模型訓練時,根據(jù)訓練樣本對模型進行訓練,從而得到全連接層的權重(如預測字母X的所有連接的權重)
在利用該模型進行結(jié)果識別時,根據(jù)剛才提到的模型訓練得出來的權重,以及經(jīng)過前面的卷積、激活函數(shù)、池化等深度網(wǎng)絡計算出來的結(jié)果,進行加權求和,得到各個結(jié)果的預測值,然后取值最大的作為識別的結(jié)果(如下圖,最后計算出來字母X的識別值為0.92,字母O的識別值為0.51,則結(jié)果判定為X)
上述這個過程定義的操作為”全連接層“(Fully connected layers),全連接層也可以有多個,如下圖:
將以上所有結(jié)果串起來后,就形成了一個“卷積神經(jīng)網(wǎng)絡”(CNN)結(jié)構(gòu),如下圖所示:
綜述:卷積神經(jīng)網(wǎng)絡主要由兩部分組成,一部分是特征提?。ň矸e、激活函數(shù)、池化),另一部分是分類識別(全連接層),著名的手寫文字識別卷積神經(jīng)網(wǎng)絡結(jié)構(gòu)圖:
CNN進化歷史:
卷積神經(jīng)網(wǎng)絡(CNN)近年來取得了長足的發(fā)展,是深度學習中的一顆耀眼明珠。CNN不僅能用來對圖像進行分類,還在圖像分割(目標檢測)任務中有著廣泛的應用。CNN已經(jīng)成為了圖像分類的黃金標準,一直在不斷的發(fā)展和改進。
CNN的起點是神經(jīng)認知機模型,此時已經(jīng)出現(xiàn)了卷積結(jié)構(gòu),經(jīng)典的LeNet誕生于1998年。然而之后CNN的鋒芒開始被SVM等模型蓋過。隨著ReLU、dropout的提出,以及GPU和大數(shù)據(jù)帶來的歷史機遇,CNN在2012年迎來了歷史突破:AlexNet。隨后幾年,CNN呈現(xiàn)爆發(fā)式發(fā)展,各種CNN模型涌現(xiàn)出來。
CNN的主要演進方向如下:
1、網(wǎng)絡結(jié)構(gòu)加深
2、加強卷積功能
3、從分類到檢測
4、新增功能模塊
下圖是CNN幾個經(jīng)典模型(AlexNet、VGG、NIN、GoogLeNet、ResNet)的對比圖,可見網(wǎng)絡層次越來越深、結(jié)構(gòu)越來越復雜,當然模型效果也是越來越好:
二、街道垃圾識別系統(tǒng)的原理是什么?
不久前上海關于垃圾分類的出臺政策大家應該還記得,做好垃圾分類成為了許多人的難題。其實,隨著人工智能技術的突飛猛進,自動分類垃圾桶已經(jīng)出現(xiàn)了。目前有許多關于人工智能自動分類垃圾的應用,像是芬蘭的Bin-e垃圾桶,阿里的“浣熊”智能垃圾分類系統(tǒng)等等,相信國內(nèi)人工智能自動分類垃圾應用將成為新的發(fā)展趨勢,人工智能自動分類垃圾的普及也只是時間問題。下面來看看人工智能自動分類垃圾的應用原理。

人工智能可以應用于垃圾分類嗎?
在不久的將來,人工智能垃圾桶將更廣泛地應用開來,讓垃圾分類變得更簡單、更高效。今年7月,上海第二批人工智能應用場景需求正式“發(fā)榜”,“人工智能在生活垃圾分類中的應用”便是其中之一。根據(jù)相關場景需求內(nèi)容,未來的智能垃圾箱房,可以進行生活垃圾圖像采集和識別,智能提示投放分類垃圾桶,當居民投放錯誤時可立即發(fā)現(xiàn)并報警,對濕垃圾中的典型干垃圾雜質(zhì)進行警報提醒,可識別的雜質(zhì)類型還可通過智能學習逐步增加。
在生活垃圾分類清運方面,不同種類的生活垃圾清運車可自動識別分類垃圾桶,并進行收運,確保分類收運。通過車載攝像和圖像傳感設備,記錄小區(qū)濕垃圾的收集過程,在濕垃圾傾倒入車時,進行雜質(zhì)識別并記錄報警。在垃圾處理中轉(zhuǎn)站,自動分類機器人或智能抓斗,可通過機械手抓取各種形狀的垃圾,識別可回收垃圾、有害垃圾等,并放置到不同的回收處理裝置中。通過圖像識別技術,對中轉(zhuǎn)入集裝的垃圾,判別垃圾批次質(zhì)量,預防之前的漏檢以及危險物品。不僅如此,對于部分人群不便定時定點投放垃圾的問題,居民可以通過APP下發(fā)指令,GPS垃圾回收機器人接到命令后,啟用自身的GPS和運動傳感器前往定位住戶的指定地點,幫助居民將垃圾自動投放到不同的垃圾桶內(nèi)。
人工智能自動分類垃圾的應用案例:
波蘭創(chuàng)業(yè)公司開發(fā)了一種基于人工智能和云服務的智能垃圾桶,可以自行判斷出垃圾種類并分類。通過傳感器、攝像頭、具有深度學習特點的AI圖像識別算法,來自動分類垃圾。Bin-e垃圾桶用起來特別簡單,用戶只需在Bin-e垃圾桶前掃描一下垃圾、艙門便會打開,將垃圾放入其中便可以了。其實,垃圾桶早已分辨出垃圾類型,將其壓縮并分類放置。另外,垃圾桶的內(nèi)容、剩余空間都會即時上傳到云空間,而回收公司只需要通過App即可隨時檢查,當然也可收到通知信息。除了回收垃圾,Bin-e垃圾桶甚至還能夠通過垃圾分析附近用戶的消費習慣(當然是非實名的方式),包括飲料、食品的品牌和數(shù)量,對于一些經(jīng)營商業(yè)廣場的商業(yè)用戶來說,顯然是具有一定價值
阿里人工智能實驗室公布一項內(nèi)部代號為“浣熊”的智能垃圾分類系統(tǒng),這是一個可以根據(jù)不同城市垃圾分類標準,自動識別上萬種常見垃圾,迅速準確的進行垃圾分類的智能系統(tǒng)?!叫堋到y(tǒng)已存儲超萬條物品數(shù)據(jù),能夠?qū)崿F(xiàn)日常生活垃圾全識別。基于AI(人工智能)訓練模型的‘浣熊’系統(tǒng)還可主動升級垃圾數(shù)據(jù)庫,自動適應不同城市分類要求。
人工智能自動分類垃圾的應用原理:
1、“垃圾”圖像數(shù)據(jù)準備
為了實現(xiàn)一個理想的垃圾自動分類器,需要有一個已經(jīng)分好類別的“垃圾”圖像數(shù)據(jù)集作為訓練的基礎。然而當前并沒有這樣一個可以直接使用的數(shù)據(jù)集,所以我們首先自己動手收集海量的“垃圾”圖像并為每張圖像標注上相應的類別。數(shù)據(jù)集的收集一直是一件耗時耗力的工作,為了快速便捷地完成“垃圾”圖像數(shù)據(jù)集的收集,我們依據(jù)官方發(fā)布的垃圾分類指南上每一類所包含的垃圾名稱,通過在百度圖片上爬取名稱對應的圖像來實現(xiàn)。
在實際的應用場景中,待分類的樣本往往是不可控的,所以一般會增加“其他”這個類別用來收留各種異常樣本。在垃圾分類中,除可回收物、有害垃圾和濕垃圾外都屬于干垃圾,所以干垃圾已經(jīng)扮演了“其他”的角色。我們的“垃圾”圖像數(shù)據(jù)集最終分為可回收垃圾、有害垃圾、濕垃圾和干垃圾四個類別。
2、垃圾自動分類器
垃圾自動分類本質(zhì)上是一個圖像分類問題,當前基于深度卷積神經(jīng)網(wǎng)絡的圖像分類算法發(fā)展很快,各種方法層出不窮。在深度學習出現(xiàn)之前,可變形部件模型(DPM)一直是流行的目標檢測方法。深度學習出現(xiàn)后,以R-CNN、Fast R-CNN、Faster R-CNN為代表的兩階段算法和以YOLOv1-3、SSD、RetinaNet為代表的單階段算法成為主流。前者是先由算法生成一系列待檢測目標的候選框,再通過卷積神經(jīng)網(wǎng)絡進行候選框的分類;后者則不用產(chǎn)生候選框,直接將目標邊框定位的問題轉(zhuǎn)化為回歸問題處理。
和垃圾分類器一樣,一個理想的垃圾檢測器,需要大量的“垃圾”標注數(shù)據(jù)來支撐。但是與分類數(shù)據(jù)集相比,檢測數(shù)據(jù)集除了標注類別外還要標注圖位置坐標,這樣的標注工作更為艱巨。在完成垃圾檢測的圖像數(shù)據(jù)集后,就可以利用當前主流的深度學習檢測算法來實現(xiàn)批量垃圾的分類。
以上就是人工智能自動分類垃圾的應用原理深度分析。在大家的實際生活中,人工智能對于垃圾分類的應用,可能還存在著許多的不足,但是相信未來隨著人工智能技術的進一步發(fā)展,這些問題都能夠迎刃而解。關于AI垃圾分類的原理,礙于篇幅的限制就暫時講到這里啦。如果對于人能智能相關內(nèi)容還有興趣的小伙伴,可以繼續(xù)關注博學谷資訊。
三、聚焦六新:人工智能未來何在?賦能山西大有可為
人工智能是新一輪 科技 革命和產(chǎn)業(yè)變革的重要驅(qū)動力量。山西各行各業(yè)如何+人工智能,助力轉(zhuǎn)型綜改?行業(yè)大咖紛紛表達自己的看法。
“我們的物流分揀設備在太原得到運用,還覆蓋全國40%的快遞分揀點,才能讓大家享受如此快捷又低成本的物流便利?!敝袊茖W院微電子研究所智能制造電子研發(fā)中心主任李功燕舉例說明,新的信息技術為中國的智能制造領域提供了彎道超車的機會,有效降低了工業(yè)部件的成本,也提供了更多發(fā)展機遇。
而在新松機器人投資有限公司總經(jīng)理武興華看來,這樣的發(fā)展會帶來顛覆性的改變。新松機器人改變了中國機器人只有進口沒有出口的 歷史 。隨著人工智能和信創(chuàng)產(chǎn)業(yè)的到來,未來將實現(xiàn)機器換人、機器超人,甚至機器替人。比如目前大比例的企業(yè)正在進行機器對人的替代,新松的教育機器人甚至可以在一定程度上替換掉頂級的老師。“目前,我們在研究人類意識和機器的結(jié)合,雖然還沒有實質(zhì)性的突破,但整體框架結(jié)構(gòu)已經(jīng)搭建起來。”武興華如是說。
用好人工智能的同時,也要促進人工智能更好地成長。人工智能里最重要的就是建立模型、訓練模型,需要大量標準的數(shù)據(jù)支撐,但很多電力公司40%-60%的數(shù)據(jù)是無效數(shù)據(jù)。如何給人工智能提供更準確的數(shù)據(jù)?云圣智能聯(lián)合創(chuàng)始人朱勝利認為0-500米的新空間是未來發(fā)展、挖掘數(shù)據(jù)并服務于新基建的重要空間?!巴ㄟ^在新空間中采集新數(shù)據(jù),把人工智能和信創(chuàng)產(chǎn)業(yè)結(jié)合在一起,才能為產(chǎn)業(yè)、國家和全球作出更大貢獻。”朱勝利說。
事實上,除了企業(yè)發(fā)力,山西的支持政策也為人工智能提供了優(yōu)越的成長空間。“信創(chuàng)產(chǎn)業(yè)是牽引其他產(chǎn)業(yè)發(fā)展的根基。太原市在發(fā)展信創(chuàng)產(chǎn)業(yè)方面就走在了全國的前列。山西省發(fā)展信創(chuàng)產(chǎn)業(yè)生態(tài),以此來帶動其他新興產(chǎn)業(yè)發(fā)展,并把打造信創(chuàng)產(chǎn)業(yè)生態(tài)和創(chuàng)新高地作為戰(zhàn)略工程、‘一號工程’,這樣的定位是非常深遠的?!鄙轿靼傩判畔⒓夹g有限公司董事長王憲朝說。
人工智能雖大有可為,但“安全”不可忽視。
中國長城 科技 集團股份有限公司副總裁谷虹認為,算例包括網(wǎng)絡,是人工智能、云計算、大數(shù)據(jù)、區(qū)塊鏈等諸多高新技術的基礎,因而算例安全是非常重要的,但同時又是非常難做到的。因為算例競爭是全球競爭的最基本的核心點,經(jīng)過多年的努力,中國的算例已經(jīng)達到了一定的水平,甚至在某些領域走到了世界前列。我們現(xiàn)在有飛騰CPU、華為鯤鵬CPU。在算例安全中,產(chǎn)業(yè)安全也是重要的一環(huán)。“在此,我也呼吁相關的使用方、研發(fā)方可以考慮到算例的安全?!惫群缯f。
相信在政府的大力支持、各界的共同努力下,山西的人工智能和信創(chuàng)產(chǎn)業(yè)一定會迎來更大的發(fā)展機遇,蹚出嶄新的合作共贏之路。
四、大數(shù)據(jù)人工智能培訓?
大數(shù)據(jù)人工智能培訓推薦選擇【達內(nèi)教育】。大數(shù)據(jù)人工智能需要學習的東西如下:
1、數(shù)學基礎。數(shù)學基礎知識蘊含著處理智能問題的基本思想與方法,也是理解復雜算法的必備要素。這一模塊覆蓋了人工智能必備的數(shù)學基礎知識,包括線性代數(shù)、概率論、最優(yōu)化方法等。
2、機器學習。機器學習的作用是從數(shù)據(jù)中習得學習算法,進而解決實際的應用問題,是【人工智能】的核心內(nèi)容之一。這一模塊覆蓋了機器學習中的主要方法,包括線性回歸、決策樹、支持向量機、聚類等。
3、人工神經(jīng)網(wǎng)絡。作為機器學習的一個分支,神經(jīng)網(wǎng)絡將認知科學引入機器學習中,以模擬生物神經(jīng)系統(tǒng)對真實世界的交互反應,并取得了良好的效果。這一模塊覆蓋了神經(jīng)網(wǎng)絡中的基本概念,包括多層神經(jīng)網(wǎng)絡、前饋與反向傳播、自組織神經(jīng)網(wǎng)絡等。
4、深度學習。包含多個中間層的神經(jīng)網(wǎng)絡,數(shù)據(jù)爆炸和計算力飆升推動了深度學習的崛起。這一模塊覆蓋了深度學習的概念與實現(xiàn),包括深度前饋網(wǎng)絡、深度學習中的正則化、自編碼器等。感興趣的話點擊此處,免費學習一下
想了解更多有關大數(shù)據(jù)人工智能的相關信息,推薦咨詢【達內(nèi)教育】?!具_內(nèi)教育】重磅推出“因材施教、分級培優(yōu)”創(chuàng)新教學模式,同一課程方向,面向不同受眾群體,提供就業(yè)、培優(yōu)、才高三個級別教學課程,達內(nèi)“因材施教、分級培優(yōu)“差異化教學模式,讓每一位來達內(nèi)學習的學員都能找到適合自己的課程。達內(nèi)IT培訓機構(gòu),試聽名額限時搶購。
以上就是關于人工智能訓練模型相關問題的回答。希望能幫到你,如有更多相關問題,您也可以聯(lián)系我們的客服進行咨詢,客服也會為您講解更多精彩的知識和內(nèi)容。
推薦閱讀: