視覺識別技術(shù)(視覺識別技術(shù)的基本概念和目的)
大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于視覺識別技術(shù)的問題,以下是小編對此問題的歸納整理,讓我們一起來看看吧。
創(chuàng)意嶺作為行業(yè)內(nèi)優(yōu)秀企業(yè),服務(wù)客戶遍布全國,相關(guān)業(yè)務(wù)請撥打175-8598-2043,或微信:1454722008
本文目錄:
一、什么是機(jī)器視覺技術(shù)
機(jī)器視覺是用機(jī)器模擬人的視覺功能,即通過機(jī)器視覺產(chǎn)品(圖像攝取裝置,分CMOS和CCD兩種)將被攝取目標(biāo)轉(zhuǎn)換成圖像信號,傳送給專用的圖像處理系統(tǒng)進(jìn)行各種運(yùn)算處理來提取信息并加以理解,最終用于實際識別、檢測、測量和控制的技術(shù)。
二、科沃斯地寶T10 TURBO體驗:3.0時代實力成果,“語”眾不同的AI掃拖機(jī)器人
現(xiàn)如今,市面上大多數(shù)的掃地機(jī)器人產(chǎn)品還僅僅停留在簡單的掃地、拖地功能以及并不智能的體驗上。但用戶的需求卻在悄然發(fā)生轉(zhuǎn)變,越來越多的用戶開始希望掃地機(jī)器人智能高效,增添更先進(jìn)的交互功能或是更精確的場景劃分識別,提升原本低效單一的家庭清潔體驗。為了滿足用戶日益增長的需求,近日,科沃斯推出了全新T系列旗艦地寶T10 TURBO AI掃拖機(jī)器人,帶來了全自動功能基站、OK YIKO語音交互以及更精準(zhǔn)的TrueMapping2.0全局規(guī)劃與AIVI3.0人工智能視覺識別技術(shù),從產(chǎn)品理念,到功能設(shè)計,這款全新的AI掃拖機(jī)器人為用戶提供了不同于以往更加智能的使用方式以及深度清潔系統(tǒng),讓掃地機(jī)器人進(jìn)化成為一款全能型的智能家居服務(wù)機(jī)器人。
外觀--精妙設(shè)計,不僅優(yōu)雅出眾更能方便使用。
在設(shè)計上,地寶T10 TURBO在保持簡約設(shè)計風(fēng)格的同時,延續(xù)了一貫的科技感和高品質(zhì)。圓潤精妙的一體化曲面設(shè)計,大面積珍珠白配色點(diǎn)綴著一些銀色的細(xì)節(jié),突顯了整機(jī)的一個高端質(zhì)感。
在dToF激光掃描模塊上有三個小孔,這是三個麥克風(fēng),支持著開頭所提到的語音操控功能,幫助地寶T10 TURBO更好地接受用戶的語音指令。機(jī)身內(nèi)側(cè)也配備了高質(zhì)量的揚(yáng)聲器,對用戶指令的語音反饋也十分的清晰。
地寶T10 TURBO配備了一個大尺寸的多功能基站,包含了清洗拖布、烘干拖布以及充電的功能。打開基站的頂蓋可以看到兩個水箱,分別是清水箱和污水箱,在清洗拖布的時候使用清水搓洗拖布,再將污水回收到污水桶中。污水箱與清水箱采用了不同的顏色,便于區(qū)分。
基站還具備自清潔功能,可以對基站底座進(jìn)行沖洗,并將污水收集到污水箱中。整個過程有著很高的封閉性設(shè)計,完全不用擔(dān)心污水外漏。地寶T10 TURBO的基站內(nèi)貼心的配備了附件收納盒,可以放置官方的清洗劑和毛刷。
這一次地寶T10 TURBO還針對充電部分進(jìn)行了改進(jìn),將原本位于機(jī)身底部的充電片改變至機(jī)身頂部的側(cè)方。一方面讓水箱的自清潔系統(tǒng)不影響正常的充電,另外可以減少充電片的污損,充電片的兩個小觸點(diǎn)在清潔時也非常簡單,觸點(diǎn)中間的長方形區(qū)域為回充傳感器,用于尋找充電底座的位置。
使用--專注考慮用戶需求,將功能化繁為簡,帶來輕松上手的真AI掃拖機(jī)器人,實現(xiàn)真智能的全局清掃。
01.身藏聰明的語音助手,下達(dá)指令即刻解放雙手!
在使用掃地機(jī)器人的過程中,相信以往我們能夠與手機(jī)連接或支持智能音箱進(jìn)行中轉(zhuǎn)操控就可以已經(jīng)感覺很智能。但現(xiàn)在,在地寶T10 TURBO上,科沃斯實現(xiàn)了AI掃地機(jī)器人真正的智能化操作。
因為地寶T10 TURBO的身體內(nèi)自帶“YIKO語音助手”,用戶可以通過“OK,YIKO”來喚醒地寶T10 TURBO,實現(xiàn)更智能便捷的人機(jī)交互。
當(dāng)“YIKO語音助手”收到指令后,不僅能夠控制地寶T10 TURBO完成指定區(qū)域的地面清潔工作外,還可以利用YIKO語音助手實現(xiàn)個性化清掃的全能操控,例如自動清潔、基站自清潔、返回基站、設(shè)置吸力、音量等,同時實現(xiàn)與目前主流智能音箱相同的對話功能,可以通過語音的方式詢問地寶T10 TURBO時間、天氣、進(jìn)行互動聊天。在使用的過程中可以完全脫離手機(jī)操控,直接進(jìn)行語音就能完成。
也就是說,地寶T10 TURBO的智能語音操控其實對于家中的老人小孩來說非常友好,無論身在家中何處,只需輕松呼喚“OK YIKO”下達(dá)指定,地寶T10 TURBO 就能快速響應(yīng)并完成指令動作。不需要增加掃地機(jī)器人的使用學(xué)習(xí)成本就能通過語音完成所有的操作,大大降低了產(chǎn)品的使用門檻和難度,讓人與科技的默契更加簡單。
地寶T10 TURBO還支持聲源定位技術(shù),用戶可以隨時將設(shè)備召喚到自身附近來執(zhí)行地面清潔的工作,地寶T10 TURBO根據(jù)聲音來判斷用戶所在的方向,從而實現(xiàn)諸如“來我這清潔一下”“到我這來”等語音操作。
02.AIVI3.0視覺識別再度升級 猶如無人駕駛,避障更流暢!
地寶T10 TURBO的避障能力在這一次也進(jìn)行了再度升級,識人辯物更加出色。得益于搭載了自動駕駛級別的地平線旭日3芯片及專用AI加速器,目前地寶T10 TURBO已具備5TOPS的超高算力,算力較先前更是提升16倍。算力飆升的同時,AIVI3.0人工智能與視覺識別技術(shù)也帶來了優(yōu)秀的圖像處理能力,960P星光級攝像頭能夠快速采集物體圖像信息,物體單幀識別準(zhǔn)確度提升20%,識別速度提升20倍!這讓地寶T10 TURBO擁有了強(qiáng)大的視覺避障能力,從而更加準(zhǔn)確的識別室內(nèi)環(huán)境在屋內(nèi)順暢行走,并對障礙物體進(jìn)行靈敏繞行。
除了能識別常見的地面障礙物識別之外,地寶T10 TURBO此番還新增了垃圾桶,地墊、體重秤等障礙物識別,甚至連人形、寵物等動態(tài)障礙物也能做到精準(zhǔn)避讓。不止于此,地寶T10 TURBO還能夠自動識別地板、瓷磚、地毯等不同材質(zhì)的地面。當(dāng)檢測到不同材質(zhì)的地面時,地寶T10 TURBO也可以調(diào)整吸力,匹配最佳的清潔方案。
實際測試中即使是較細(xì)的桌子腿,地寶T10 TURBO也能輕松躲避。在智能躲避障礙物的同時,還可以將周圍的地面做到高覆蓋的清潔,不會存在有死角或者遺漏的問題。
03.TrueMapping2.0全局精準(zhǔn)規(guī)劃,建圖快存圖穩(wěn)!
地寶T10 TURBO還搭載了TrueMapping 2.0全局規(guī)劃技術(shù)以及dToF傳感器,因采用了調(diào)制光信號,波長更長,所以針對不同的亮光或暗光環(huán)境下,都可以靈活行走精準(zhǔn)導(dǎo)航,從而實現(xiàn)更快速穩(wěn)定的建圖。
在配對設(shè)置之后,T10 TURBO就可以直接進(jìn)行快速建圖,升級之后的建圖精度能夠提升4倍,掃描范圍也擴(kuò)大到2倍,掃描完成之后會進(jìn)行自動保存首次的建圖,若發(fā)生疊圖或不想更新區(qū)域也可通過APP一鍵恢復(fù)地圖!
從上面所說的AIVI 3.0人工智能與視覺識別技術(shù)和TrueMapping2.0全局規(guī)劃技術(shù)的組合可以看出,地寶T10 TURBO的清掃效果和使用體驗已再次進(jìn)化,更有意思的是,它支持在APP端將2D地圖轉(zhuǎn)化為3D地圖,用戶可以在3D地圖的基礎(chǔ)之上,根據(jù)自己家庭的家具擺設(shè)情況進(jìn)行實際的調(diào)整,在APP中有豐富的家具供用戶選擇,可以打造一個更接近真實情況的3D地圖。
3D地圖的優(yōu)勢在于對家具位置的識別會更加的精準(zhǔn),地寶T10 TURBO在清掃時就可以更好的識別家具以及線材。
04.24小時全屋智能巡航 打掃省心還能安防!
前文說到地寶T10 TURBO支持配合手機(jī)APP的使用,下載ECOVACS Home就可以完成手機(jī)與地寶T10 TURBO的配對連接。
在手機(jī)APP中,用戶可以通過遠(yuǎn)程操控對不同的房間進(jìn)行設(shè)置,從打掃順序到不同的打掃模式,以及自定義區(qū)域的清掃都可以在APP上實現(xiàn)設(shè)置。地寶T10 TURBO在清潔過程中,清掃線路以及狀態(tài)都可以通過APP查看。同時還可以在手機(jī)APP上也可以進(jìn)行一系列的預(yù)約操作,設(shè)置完成之后地寶就可以按照每日的清掃流程進(jìn)行打掃,非常省心。
通過ECOVACS Home,用戶還可以連接地寶T10 TURBO的攝像頭,通過地寶T10 TURBO來觀察家里的情況,配合24小時全屋智能巡航功能,起到家庭安防的作用。用戶還可以將視頻小窗口播放,配合掃地機(jī)器人的清掃線路圖,沒準(zhǔn)可以發(fā)現(xiàn)一些丟失在家里的小物件,也能帶來一些小的驚喜。另外,地寶T10 TURBO還獲得萊茵隱私認(rèn)證,機(jī)器人的攝像頭工作指示燈,視頻啟動時指示燈同步顯示,同時每15分鐘還會進(jìn)行“視頻中”的語音提示,數(shù)據(jù)安全性值得保證。
05.3000Pa大吸力,無縫不入清潔徹底!
地寶T10 TURBO配備了3000Pa超大吸力。同時雙邊刷的設(shè)計可以將地面的垃圾聚攏在一起,再經(jīng)由浮動滾刷送入風(fēng)口,大吸力能夠?qū)⒌孛婵p隙內(nèi)的灰塵也清理干凈,可以對地面進(jìn)行較為徹底的清潔。
浮動滾刷采用了軟膠和雙邊毛刷的組合,對于灰塵以及毛發(fā)的清潔效果都很不錯。針對其清掃效果,我們也進(jìn)行了清掃測試,使用砂糖以及食物碎屑來測試下掃拖機(jī)器人的清掃能力。
很輕的砂糖及食物碎屑有著容易被風(fēng)吹散的問題,有些掃地機(jī)器人并不能夠很徹底的對其進(jìn)行清理。地寶T10 TURBO在打掃的時候,先通過雙邊刷將地面上的砂糖、碎屑進(jìn)行聚攏,再通過貼近地面的浮動滾刷直接清理干凈,整個過程簡單高效。清掃過程中邊刷的力度非常適中,起到了很好的到聚攏的效果,完全沒有出現(xiàn)把碎屑全部打散的情況。
06.旋轉(zhuǎn)加壓擦地系統(tǒng) 拖地輕松頑漬無蹤!
地寶T10 TURBO配備了OZMO Turbo 2.0旋轉(zhuǎn)加壓擦地系統(tǒng),這個模塊使用了簡單拆卸的魔術(shù)貼設(shè)計,可以更穩(wěn)固的將兩塊拖布貼在拖布支架上,這一次地寶T10 TURBO拖布的直徑增加了200px,提供了更大的清潔面積。清潔地面時,兩塊拖布在旋轉(zhuǎn)的同時向下加壓,有著非常顯著的清潔效果。
我們也對地寶T10 TURBO的拖地功能進(jìn)行了測試,使用咖啡、飲料作為污漬灑在地面上。通過語音指令讓地寶T10 TURBO前去打掃。面對這些污漬,地寶T10 TURBO可以非常順利的清理干凈。
在拖地清掃模式下,只需要經(jīng)過一次就能夠?qū)⒄麄€污漬清理干凈,比使用拖布來回清掃要更加的便捷高效。如果地面不慎沾染一些污漬,這時只需要配合T10 TURBO的智能語音功能進(jìn)行定位清潔,更是省去了自己清理的煩惱。
07.基站一鍵自清潔,“10”分潔凈呵護(hù)全家健康!
地寶T10 TURBO提供了自動回洗、烘干拖布的功能,實現(xiàn)了自動化自清潔方式,非常的方便,有了地寶T10 TURBO,用戶就可以徹底的解放雙手。
地寶T10 TURBO的全自動功能基站提供了4L大容量清水、污水箱分離設(shè)計,搭配地板專用清潔劑,可以更強(qiáng)效的去除拖布和地面污漬。
清洗之前的拖布
清洗之后的拖布
地寶T10 TURBO不但具備較為出色的清洗效果,清洗拖布也非常的省水,一次清洗所消耗的水量非常的少,要比人工清洗更加省水。
返回基站對拖布進(jìn)行清洗之后,地寶T10 TURBO還提供了熱風(fēng)烘干功能,自動鼓入的熱風(fēng),只需要兩個小時就能夠快速烘干拖布,有效杜絕了細(xì)菌異味的滋生。當(dāng)然,考慮到有小孩或?qū)櫸锏募彝πl(wèi)生環(huán)境有更高的要求,用戶還可以選配銀離子除菌模塊,實現(xiàn)對拖布、水箱、地面全方位99.9%的除菌,家里更潔凈,才能更安心!
小編總結(jié):
地寶T10 TURBO的出現(xiàn)將掃地機(jī)器人的體驗提升到了新的高度,不但具備更好的清潔效果,同時智能性也做到了行業(yè)天花板的水平。通過智能語音的方式來操控地寶T10 TURBO,在解放雙手完成一站式清潔的同時,也讓整個清掃過程更為高效。智能的語音交互也無須太多的學(xué)習(xí)成本,即便是不太會使用智能產(chǎn)品的老人也可以直接呼喚T10 TURBO進(jìn)行指定的清掃。
可見,科沃斯T10 TURBO已然跳脫出普通的掃地機(jī)范疇,進(jìn)化成為一個智能化的服務(wù)機(jī)器人。科沃斯在產(chǎn)品技術(shù)上的不斷研發(fā)、迭代升級解決了許多用戶在實際使用的體驗問題,更是通過智能AI功能的融合致力實現(xiàn)“機(jī)器人服務(wù)全球家庭”的愿景。相信在未來,一直潛心于鉆研服務(wù)機(jī)器人技術(shù)的科沃斯,也能給千家萬戶的消費(fèi)者帶來更多的服務(wù)機(jī)器人智能產(chǎn)品。
三、中國視覺技術(shù)指的是什么?通過視覺技術(shù),人們能了解什么?
機(jī)器視覺技術(shù)是一門涉及人工智能、神經(jīng)生物學(xué)、心理物理學(xué)、計算機(jī)科學(xué)、圖像處理、模式識別等多個領(lǐng)域的交叉學(xué)科。 機(jī)器視覺主要用于計算機(jī)模擬人的視覺功能,從客觀事物的圖像中提取信息,處理理解,最終用于實際檢測、測量、控制。 機(jī)器視覺技術(shù)的最大特點(diǎn)是速度快、信息量大、功能多。 目前手機(jī)端應(yīng)用的3D傳感器技術(shù)方案主要是3D結(jié)構(gòu)光和TOF (光飛行時間法),蘋果、OPPO Find X、小米以及華為Mate20 Pro設(shè)計中使用的3D結(jié)構(gòu)光技術(shù)、OPPO R17 Pro、華為mate。
基于3D傳感APP應(yīng)用的創(chuàng)新體驗徹底打開了人們想象的空間。 手機(jī)廠商加速布局的原因是重視賦予智能終端“看”世界的能力。 機(jī)器視覺主要使用計算機(jī)模擬人類的視覺功能,但重要的不是人眼的簡單擴(kuò)展,而是擁有人腦某些功能從客觀事物的圖像中提取信息,處理和理解,最終用于實際的檢測、測量和控制。 將機(jī)器視覺技術(shù)應(yīng)用于禽蛋質(zhì)量檢測具有人工檢測無法比擬的優(yōu)勢。 表面缺陷和大小、形狀是雞蛋質(zhì)量的重要特征,機(jī)器視覺檢測不僅可以排除人的主觀因素的干擾。
3D視覺技術(shù)在許多領(lǐng)域具有極高的戰(zhàn)略意義,國內(nèi)一些技術(shù)雄厚的企業(yè)鱗次櫛比,在此領(lǐng)域展開了深入的研究,目前我國3D人臉識別的落地應(yīng)用處于世界領(lǐng)先水平。 值得一提的是,國內(nèi)3D視覺技術(shù)獨(dú)角獸中光是唯一能夠?qū)崿F(xiàn)量產(chǎn)結(jié)構(gòu)光3D傳感相機(jī)的中國企業(yè),3D傳感器專利數(shù)量與蘋果、微軟等并列世界前三,其3D視覺模塊、算法及輔助解決方案例如,OPPO Find X、支付寶臉?biāo)⒅Ц妒且环N使用奧比中光3D視覺模組的方案。
四、先驅(qū)者(5) AI巨頭如何跨界自動駕駛?
[汽車之家 技術(shù)] 有這樣一家成立于2014年,旋即成為該領(lǐng)域“獨(dú)角獸”的高科技企業(yè),說起它的名字大部分人可能以為是歷史課本某一章節(jié)的名稱,但不夸張的說,如今我們幾乎每天都離不開它的產(chǎn)品或技術(shù)。它賦予機(jī)器超過人類的辨別能力,并且在還會創(chuàng)造出更多來自于科幻小說的未來場景,那么TA與我們的《先驅(qū)者》系列內(nèi)容又有什么聯(lián)系呢?且聽我娓娓道來。
這篇《先驅(qū)者》將要聊到:
1、如今大部分主流智能手機(jī)都裝載了TA的技術(shù);
2、這家公司匯集了計算機(jī)視覺領(lǐng)域的頂尖人才;
3、TA讓管理大型城市就像玩電子游戲一樣簡單直觀;
4、TA可能是未來自動駕駛領(lǐng)域一家頂尖的技術(shù)供應(yīng)商。
●你不知道的商湯
不知你有沒有發(fā)覺如今的機(jī)器正在變得“聰明”起來:早晨你抬起手機(jī),當(dāng)屏幕亮起的剎那就會自動解鎖,想回顧一下昨天郊游的精彩照片,手機(jī)相冊會根據(jù)不同的主角把相冊中海量的照片自動分類;在地鐵站臺旁的無人售賣機(jī)旁,可以直接刷臉支付購買飲料;在機(jī)場無需工作人員,只要用身份證和你的人臉進(jìn)行比對就可以完成值機(jī)手續(xù);特殊時期,公司入口的攝像頭就能夠自動偵測訪客的體溫……
在這些“聰明機(jī)器”的芯片內(nèi),可能都寫入了這家公司的代碼,創(chuàng)始人湯曉鷗教授將這家公司命名為“商湯”,它是中國有據(jù)可考的第一個朝代商的開國君主的名稱,也意味著這家公司將要在一片新的領(lǐng)域開疆拓土。
說到計算機(jī)視覺技術(shù),在如今大家可能耳熟能詳,但是在上世紀(jì)90年代初,大部分人還沒接觸過電腦的年代,湯曉鷗就已經(jīng)開始投身與相關(guān)領(lǐng)域的研究了。
基于多年深耕,湯曉鷗教授在計算機(jī)視覺以及人工智能領(lǐng)域成就卓著,2001年,他建立了香港中文大學(xué)多媒體實驗室,這也是最早應(yīng)用深度學(xué)習(xí)進(jìn)行計算機(jī)視覺研究的華人團(tuán)隊。在2016全球GPU技術(shù)大會(GTC)上,多媒體實驗室與來自麻省理工、斯坦福以及加州大學(xué)伯克利分校等實驗室并列為10大頂尖AI先鋒。如今,它仍然是計算機(jī)視覺以及深度學(xué)習(xí)領(lǐng)域最為活躍的實驗室,每年在該領(lǐng)域的頂級學(xué)會上發(fā)表百余篇重量級論文。實驗室吸引了諸多頂尖人才的加盟,也被業(yè)內(nèi)譽(yù)為計算機(jī)視覺界的“黃埔軍校”。
人臉識別是計算機(jī)視覺技術(shù)的一個主要應(yīng)用場景,同時也被業(yè)內(nèi)認(rèn)為是一項挑戰(zhàn)性非常高的技術(shù),因為首先不同人的面部關(guān)鍵特征位置類似,其次即便一個人,在不同時間和環(huán)境下,TA的面部特征也因光線和情緒等不同而有著不小的變化。
人臉識別技術(shù)獲得廣泛應(yīng)用的里程碑事件發(fā)生在2014年:Facebook首先發(fā)布了自己的DeepFace面部識別技術(shù),在750萬人臉數(shù)據(jù)的基礎(chǔ)上,達(dá)到了接近于人類的識別率;而僅僅幾個月后,湯曉鷗團(tuán)隊開發(fā)了一個基于高斯過程的人臉識別技術(shù)GaussianFace (高斯臉),取得了98.52%的識別率,首次超越了人類,隨后團(tuán)隊發(fā)表的DeepID系列算法,將準(zhǔn)確率逐步提升到了99.55%。這意味著計算機(jī)面部識別技術(shù)已經(jīng)可以應(yīng)用于金融以及重要的工業(yè)應(yīng)用領(lǐng)域。
2014年,湯曉鷗教授正式開始自己的創(chuàng)業(yè),獲得IDG資本數(shù)千萬美元的A輪投資之后,與徐立、王曉剛等一起創(chuàng)建了商湯科技。商湯科技成立之后,迅速“籠絡(luò)”了多媒體實驗室朋友圈的各路精英“學(xué)霸”,成為了將前沿尖端科技向產(chǎn)品落地轉(zhuǎn)化的孵化基地。
憑借著在AI領(lǐng)域強(qiáng)大的技術(shù)優(yōu)勢,商湯科技創(chuàng)立以來受到了資本市場的格外青睞,是目前全球總?cè)谫Y額及估值最高的人工智能創(chuàng)新企業(yè)。
在文章的開頭我們說過,我們幾乎每天都在接觸著商湯的技術(shù):諸如智能手機(jī)上的面部識別解鎖、手機(jī)照相美顏及AR特效、美圖軟件、直播視頻平臺,以及我們在銀行柜臺、支付軟件、火車站、機(jī)場等場合使用的面部識別身份認(rèn)證系統(tǒng)等等。在我們看不見的地方,商湯還在與各地政府合作建立智慧城市解決方案,諸如通過分析遍布城市的上百萬個攝像頭所采集的信息,可以迅速發(fā)現(xiàn)出在城市各個角落發(fā)生的異常情況,諸如共享單車違規(guī)停放、垃圾隨意堆放、突發(fā)火情等,相當(dāng)于削減了大量人力巡視成本,同時提升了城市管理效率?;谏疃葘W(xué)習(xí)技術(shù),智慧城市還會根據(jù)需求延伸出多種應(yīng)用場景。
● 跨界自動駕駛:竟源于偶然?
2017年12月,一家國際一線車企宣布與商湯合作研發(fā)L4級以上的自動駕駛技術(shù),并為商湯自動駕駛團(tuán)隊投入了一筆大額啟動資金用于后續(xù)項目的研究開發(fā)。這在業(yè)界掀起了不小的波瀾:一家蜚聲世界的大型國際車企為何要選擇與這樣一家僅僅成立3年,且之前在汽車界沒有任何聲量的企業(yè)進(jìn)行合作?
事實上這家國際車企的決定絕非草率:在前期招標(biāo)期間有十余家國際一流企業(yè)競標(biāo),最終商湯團(tuán)隊?wèi){借著其算法的高識別率、準(zhǔn)確和穩(wěn)定性一路過關(guān)斬將,憑硬實力最終贏得了甲方的信賴。在2016年,商湯便與這家車企合作推出了基于四個攝像頭的自動駕駛解決方案,并且成功完成特定場景下的自動駕駛挑戰(zhàn),并且在大雨天氣下仍然表現(xiàn)出色。這對于高度依賴感知技術(shù)的自動駕駛汽車來說,無疑是一個令人側(cè)目的突破。
說到商湯的自動駕駛團(tuán)隊,究竟聚集了多少業(yè)界的“大牛”能做到這樣的成績?在《先驅(qū)者》采訪期間,我們有幸在商湯位于北京中關(guān)村的辦公地點(diǎn)遇到了商湯自動駕駛團(tuán)隊負(fù)責(zé)人本尊,令我們沒想到的是,她竟然是一位“準(zhǔn)九零后”姑娘——初次見面說她是一名在校大學(xué)生絕對沒人懷疑,不過言行舉止間透露著當(dāng)年班中那位“學(xué)霸”的氣質(zhì)。
如同香港中文大學(xué)的其他師兄弟姐妹們一樣,石建萍有著一份令人矚目的履歷。攻讀博士期間,她專注圖像模糊評估領(lǐng)域,發(fā)表了12篇頂級會議和期刊論文。
16年商湯開始著手研究自動駕駛時,她與團(tuán)隊提出了僅依賴攝像頭實現(xiàn)特定場景下的自動駕駛技術(shù)所需的所有感知的方案。當(dāng)時這樣的想法在業(yè)內(nèi)尚無先例,在非常短的時間內(nèi),他們從零開始,快速完成了數(shù)據(jù)標(biāo)注、模型提升、數(shù)據(jù)多樣性增強(qiáng)等多個方面的快速迭代,順利實現(xiàn)了依靠攝像頭達(dá)到特定場景下自動駕駛駕駛的要求。在毫無經(jīng)驗可言的未知領(lǐng)域探索,大概也只有像她這樣天賦異稟的年輕人才能如此充滿創(chuàng)造力吧。
隨后,商湯自動駕駛團(tuán)隊迅速壯大,由10余人發(fā)展到了超過200人規(guī)模,這些都是在相關(guān)領(lǐng)域的尖端人才。憑借著人才和技術(shù)優(yōu)勢,相繼攻克了多傳感器信息融合、人車行為分析預(yù)測與決策系統(tǒng)等多重難題,建立了完整的自動駕駛/輔助駕駛解決方案,迅速實現(xiàn)了商業(yè)化落地。
說到與當(dāng)前在輔助駕駛領(lǐng)域深耕多年并且占據(jù)絕大部分份額的國際巨頭相比較,石建萍表現(xiàn)得相當(dāng)自信:“在感知的核心算法性能,我們肯定是超越他們的。”——一種被學(xué)霸支配的恐懼感油然而生。不僅如此,在與主機(jī)廠進(jìn)行合作時,商湯還有著本土化優(yōu)勢,無論溝通成本還是深度定制化能力,都是國際供應(yīng)商所不能及的。
那么做好對一座大型城市的感知之后,做自動駕駛是否是一種“降維打擊”呢?石建萍也坦言,即便是“學(xué)霸團(tuán)隊”,面對新事物仍然需要一個學(xué)習(xí)過程。相比智慧城市的相關(guān)感知,做自動駕駛對于精度和準(zhǔn)確性無疑有著更高的要求——因為這與車上成員的安全息息相關(guān),安全正是自動駕駛的第一要素。而與國際一線的汽車廠商合作,也讓商湯的自動駕駛團(tuán)隊深入了解了汽車廠商的研發(fā)流程和思維方式,從而也為今后與更多的OEM合作打下了基礎(chǔ)。
除了與國際廠商合作之外,商湯的高級駕駛輔助系統(tǒng)解決方案在國內(nèi)的落地步伐也在逐漸加速——在今年的北京車展上,搭載商湯輔助駕駛解決方案的哪吒汽車正式與公眾見面。
在上海臨港智能網(wǎng)聯(lián)測試園區(qū)以及周邊開放道路,商湯科技的L4級自動駕駛車隊正在進(jìn)行著緊鑼密鼓的路測,在這里測試車型收集的數(shù)據(jù),將要在商湯的深度學(xué)習(xí)模型中進(jìn)行積累訓(xùn)練,從而“培養(yǎng)”出更聰明的自動駕駛汽車“大腦”。
相比已經(jīng)開始項目落地的L2級駕駛輔助功能,商湯的自動駕駛技術(shù)團(tuán)隊同時也在投入相當(dāng)?shù)木τ糜贚4級多傳感器融合感知以及決策的研究。在石建萍看來,L4和L2之間并沒有天然的壁壘,兩者從技術(shù)角度來看有著一定的共通性:一方面L2的數(shù)據(jù)通過有效積累可以為L4打下基礎(chǔ);同時L4測試的數(shù)據(jù)可以積累回溯到L2的場景中。L2的視覺感知對于L4是不可或缺的部分,也是對于激光雷達(dá)一個必要的補(bǔ)充。石建萍頗有些自豪地說,對于商湯這個體量的公司而言,做自動駕駛不需要講故事來吸納風(fēng)險投資,所以可以按部就班,潛心研究技術(shù)的迭代。這無疑是讓許多自動駕駛公司眼紅的地方。
通過多傳感器感知算法的研究,目前商湯在該領(lǐng)域已經(jīng)積累了相當(dāng)?shù)慕?jīng)驗,在不久前,商湯與我們在《先驅(qū)者》第四期聊到的國內(nèi)激光雷達(dá)頭部公司禾賽共同推出了集成算法的PandarMind激光雷達(dá)產(chǎn)品,大大降低了客戶的研發(fā)成本。
2020年“新基建”是一個熱度非常高的話題,國家對于5G以及城市智能化基礎(chǔ)設(shè)施的投入,對于自動駕駛而言絕對是個利好消息。除了車端之外,石建萍團(tuán)隊也在著手進(jìn)行路端感知技術(shù)的推進(jìn)工作——將傳感器集成在路端,同時通過5G信號低時延地將海量感知數(shù)據(jù)傳輸給自動駕駛車輛,這相當(dāng)于在路上的自動駕駛車輛可以“共享”傳感器,對于自動駕駛車型而言也會降低單車成本,同時作為傳感器的冗余,也可以提升車輛自身的安全性。
除了自動駕駛之外,以感知見長的商湯科技自然還會將自己的AI技術(shù)拓展到新的用車場景:在上海商湯總部,我們體驗了商湯定義的智能車艙。通過視覺識別技術(shù),相當(dāng)于為車輛安設(shè)了雙眼——以金融級的識別準(zhǔn)確率來分辨車主,可以實現(xiàn)面部解鎖、千人千面?zhèn)€性化設(shè)置,而在車內(nèi)的攝像頭,則可以識別駕駛員各種手勢命令以及對不規(guī)范的駕駛行為進(jìn)行識別和提醒等等。得益于商湯對于視覺識別技術(shù)的深厚積累,我們在現(xiàn)場體現(xiàn)各項識別功能可謂準(zhǔn)確而流暢。據(jù)悉,商湯已經(jīng)與另外一家歐洲豪華車廠達(dá)成合作協(xié)議,不久的將來就可以看到更多車內(nèi)智能感知功能面世。配合駕駛輔助系統(tǒng),商湯可以為主機(jī)廠提供一套完整的智能汽車解決方案,不同部門之間形成良好的協(xié)同效應(yīng)。
寫在最后:
往期回顧:
先驅(qū)者(4)激光大戰(zhàn)中的中國高端玩家
先驅(qū)者(3)中國激光雷達(dá)企業(yè)逆襲記
先驅(qū)者(2)機(jī)器視覺領(lǐng)域的中國挑戰(zhàn)者
先驅(qū)者(1) 一文了解世界自動駕駛格局
以上就是關(guān)于視覺識別技術(shù)相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進(jìn)行咨詢,客服也會為您講解更多精彩的知識和內(nèi)容。
推薦閱讀:
景觀設(shè)計視覺效果圖(景觀設(shè)計視覺效果圖大全)
視覺傳達(dá)三要素是什么(視覺傳達(dá)三要素是什么內(nèi)容)
視覺傳達(dá)設(shè)計文創(chuàng)產(chǎn)品(視覺傳達(dá)設(shè)計文創(chuàng)產(chǎn)品有哪些)
城市景觀設(shè)計國內(nèi)案例研究(城市景觀設(shè)計國內(nèi)案例研究論文)