-
當(dāng)前位置:首頁(yè) > 創(chuàng)意學(xué)院 > 技術(shù) > 專題列表 > 正文
搜索推薦算法(搜索推薦算法要學(xué)什么)
大家好!今天讓創(chuàng)意嶺的小編來(lái)大家介紹下關(guān)于搜索推薦算法的問(wèn)題,以下是小編對(duì)此問(wèn)題的歸納整理,讓我們一起來(lái)看看吧。
開(kāi)始之前先推薦一個(gè)非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計(jì)劃、工作報(bào)告、論文、代碼、作文、做題和對(duì)話答疑等等
只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,越精準(zhǔn),寫(xiě)出的就越詳細(xì),有微信小程序端、在線網(wǎng)頁(yè)版、PC客戶端
官網(wǎng):https://ai.de1919.com
創(chuàng)意嶺作為行業(yè)內(nèi)優(yōu)秀企業(yè),服務(wù)客戶遍布全國(guó),網(wǎng)絡(luò)營(yíng)銷相關(guān)業(yè)務(wù)請(qǐng)撥打175-8598-2043,或微信:1454722008
本文目錄:
一、代碼合規(guī)系列Vol.1:淺談推薦算法合規(guī)
前言:
豆瓣評(píng)分曾達(dá)到9.4的科幻神劇《西部世界》,收獲了無(wú)數(shù)粉絲的膝蓋。在《西部世界》中,通過(guò)編程實(shí)現(xiàn)的人工智能,人們體驗(yàn)著由代碼打造的虛擬現(xiàn)實(shí)世界。而在 游戲 《我的世界》里,人們也可以通過(guò)編程來(lái)打造屬于自己的世界。曾有人預(yù)言,未來(lái)的世界是軟件的世界,是代碼的世界。我們無(wú)法預(yù)知未來(lái),但是活在當(dāng)下明顯感覺(jué)到代碼正在深刻改變我們的生活、改造現(xiàn)實(shí)世界。但代碼又似乎與我們的生活不直接相關(guān),它是一種由字符、符號(hào)或信號(hào)碼元以離散形式表示信息的明確的規(guī)則體系,并非自然語(yǔ)言,普通人不可直接讀懂。目前的代碼世界尚處于早期野蠻生長(zhǎng)時(shí)代,代碼難以約束,相關(guān)的 社會(huì) 規(guī)范幾乎不存在,仿佛游離于 社會(huì) 規(guī)范之外,拒絕接受法律的約束和道德的審視。但是最近幾年文明之光開(kāi)始顯現(xiàn),代碼合規(guī)開(kāi)始進(jìn)入大家的視線,大家開(kāi)始討論算法合規(guī)、開(kāi)源代碼合規(guī)等前沿話題。敲過(guò)幾年代碼、學(xué)過(guò)幾年法律、正在做企業(yè)合規(guī)的筆者,有意加入代碼合規(guī)的討論中來(lái),開(kāi)通代碼合規(guī)這個(gè)欄目,分享自己的合規(guī)心得。
我們常說(shuō)代碼的靈魂是算法,因?yàn)榇a的核心在于算法。算法是對(duì)解題方案的準(zhǔn)確而完整的描述,是一系列解決問(wèn)題的清晰指令。形象比喻,如果把算法理解為一種思路,那代碼就是算法(思路)的具體表現(xiàn)形式。所以我們常說(shuō)防止代碼泄露,實(shí)則是保護(hù)自己的核心算法思路不給他人所知。2021年8月27日,國(guó)家互聯(lián)網(wǎng)信息辦公室發(fā)布《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》(征求意見(jiàn)稿)發(fā)布,該規(guī)定旨在規(guī)范互聯(lián)網(wǎng)信息服務(wù)算法推薦活動(dòng),維護(hù)國(guó)家安全和 社會(huì) 公共利益,保護(hù)公民、法人和其他組織的合法權(quán)益,促進(jìn)互聯(lián)網(wǎng)信息服務(wù) 健康 發(fā)展。代碼合規(guī)的系列Vol.1將圍繞該算法推薦管理規(guī)定進(jìn)行解析討論。
一、推薦算法的介紹
推薦算法是指利用用戶的一些行為,通過(guò)一些算法,推測(cè)出用戶可能喜歡的東西。它作為算法中的一種,源于個(gè)性化推薦,經(jīng)過(guò)多年的理論研究和商業(yè)實(shí)踐,已經(jīng)被越來(lái)越多的互聯(lián)網(wǎng)企業(yè)所運(yùn)用到用戶推薦場(chǎng)景中。截止目前推薦算法已經(jīng)延伸出生成合成類(圖片視頻生成)、個(gè)性化推送類(推薦)、排序精選類(排名)、檢索過(guò)濾類(搜索)、調(diào)度決策類(外賣、打車)等。舉例來(lái)說(shuō),我們?cè)谔熵埳腺?gòu)物,經(jīng)常會(huì)被推送一些我們之前瀏覽過(guò)的同類型產(chǎn)品,這里面就是用到了推薦算法,屬于個(gè)性化推送類。
筆者曾在本科期間,參加過(guò)阿里舉辦的首屆天貓大數(shù)據(jù)算法競(jìng)賽,競(jìng)賽的內(nèi)容是關(guān)于推薦算法的研究開(kāi)發(fā)。基于天貓用戶的數(shù)據(jù)(匿名化處理)—數(shù)據(jù)內(nèi)容主要是一定時(shí)間內(nèi)用戶購(gòu)買產(chǎn)品的時(shí)間、次數(shù)、產(chǎn)品相似度等用戶行為—運(yùn)用基于內(nèi)容、協(xié)同過(guò)濾、關(guān)聯(lián)規(guī)則等推薦算法對(duì)用戶行為進(jìn)行分析,預(yù)測(cè)下一個(gè)時(shí)段用戶的行為,對(duì)比實(shí)際數(shù)據(jù)得出相似度,以相似度高低決定算法優(yōu)良。經(jīng)過(guò)幾年的發(fā)展,推薦算法在商業(yè)實(shí)踐中的運(yùn)用已經(jīng)變得十分廣泛,但是也因此給我們的生活帶來(lái)了許多困擾,出現(xiàn)如數(shù)據(jù)殺熟、隱私保護(hù)等問(wèn)題。這次國(guó)家推出對(duì)推薦算法的監(jiān)管規(guī)定,是十分及時(shí)和必要的。企業(yè)要想繼續(xù)進(jìn)行推薦算法的研究和實(shí)踐,就必須要滿足國(guó)家對(duì)于推薦算法的規(guī)定。因此筆者基于《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》(征求意見(jiàn)稿),多維度談?wù)勂髽I(yè)的算法合規(guī)義務(wù)和合規(guī)化建議。
二、算法服務(wù)提供者的合規(guī)義務(wù)
合規(guī),是比合法更大范圍的存在,即符合、遵守、執(zhí)行適用于企業(yè)的合規(guī)規(guī)范。這里所說(shuō)的合規(guī)規(guī)范按照國(guó)內(nèi)外出臺(tái)的標(biāo)準(zhǔn)、辦法和指引,可以總結(jié)為外部合規(guī)規(guī)范和內(nèi)部合規(guī)規(guī)范。其中外部合規(guī)規(guī)范可以理解為合規(guī)要求,包括但不限于法律規(guī)范、行業(yè)準(zhǔn)則、商業(yè)慣例、法院判決以及行政決定、強(qiáng)制性標(biāo)準(zhǔn)、道德規(guī)范等。內(nèi)部合規(guī)規(guī)范可以理解為合規(guī)承諾,主要是指合同協(xié)議、行業(yè)自律性規(guī)則、非強(qiáng)制性標(biāo)準(zhǔn)、對(duì)外承諾、章程以及內(nèi)部規(guī)章和各項(xiàng)決議等。所以對(duì)于合規(guī)工作來(lái)說(shuō),首要的就是要收集合規(guī)規(guī)范,從中識(shí)別出合規(guī)義務(wù)。本文立足于《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》(征求意見(jiàn)稿),識(shí)別出具體的合規(guī)義務(wù),分別從強(qiáng)制性義務(wù)、禁止性義務(wù)、原則性義務(wù)進(jìn)行展開(kāi),如下表所示。
上表所示,可以較為清晰的區(qū)分算法合規(guī)義務(wù)。我們發(fā)現(xiàn),強(qiáng)制性義務(wù)幾乎占據(jù)了大半,大部分的條款都是企業(yè)應(yīng)當(dāng)履行的合規(guī)義務(wù)。
三、推薦算法的合規(guī)化建議
從概念上說(shuō),合規(guī)可以理解為一種理想狀態(tài),或者說(shuō)是最終目標(biāo)。在通往合規(guī)的道路上,我們需要做的是將“外規(guī)內(nèi)化”。上述表格總結(jié)的企業(yè)合規(guī)義務(wù)更像是粗糙的條文堆砌,我們還需要將具體的合規(guī)義務(wù)進(jìn)一步內(nèi)化于企業(yè)的內(nèi)部管理行為中。結(jié)合我們團(tuán)隊(duì)在企業(yè)合規(guī)管理體系的搭建上的實(shí)踐經(jīng)驗(yàn),我認(rèn)為可以從合規(guī)管理制度、合規(guī)運(yùn)行和保障機(jī)制角度提出我們的合規(guī)化建議。
可能上述視角過(guò)于專業(yè)化,也有點(diǎn)復(fù)雜化。如果從技術(shù)人員的角度看,可以從前端和后端的視角來(lái)解析具體的合規(guī)義務(wù):
上述兩個(gè)視角,可能對(duì)合規(guī)義務(wù)有了些許的了解,但是對(duì)于企業(yè)來(lái)說(shuō),合規(guī)義務(wù)需要嵌入到公司的制度中去才算是完成了制度層面的建設(shè)工作,這是個(gè)繁瑣和專業(yè)的事情。同時(shí)制度層面完成后,要落實(shí)制度就需要讓員工懂法知規(guī),這就需要對(duì)員工進(jìn)行必要的合規(guī)培訓(xùn)工作,這里面就涉及對(duì)于治理層、經(jīng)理層、員工層不同的培訓(xùn)要求。所以對(duì)于企業(yè)合規(guī)化建設(shè),比較省力和經(jīng)濟(jì)的方式就是引入第三方專業(yè)機(jī)構(gòu),幫助企業(yè)去做合規(guī)化建設(shè),幫助組建企業(yè)內(nèi)部的合規(guī)團(tuán)隊(duì),指導(dǎo)合規(guī)團(tuán)隊(duì)去做具體的合規(guī)化建設(shè)工作,授人以漁。
二、推薦算法模型原則~運(yùn)營(yíng)推廣
網(wǎng)店運(yùn)營(yíng):推薦算法建模原理。
直通車,手淘搜索,手淘首頁(yè)推薦兩個(gè)核心原則:第一,標(biāo)簽匹配度高優(yōu)先,第二,權(quán)重高優(yōu)先。
標(biāo)簽匹配,有顧客標(biāo)簽和寶貝標(biāo)簽,顧客標(biāo)簽包括瀏覽痕跡和購(gòu)買記錄,有些顧客標(biāo)簽比較模糊。嬰兒標(biāo)簽包括成交記錄,顧客搜索你的嬰兒然后成交,顧客標(biāo)簽和搜索關(guān)鍵字給嬰兒打標(biāo)簽。
先基本加權(quán)店權(quán),再基本加權(quán)點(diǎn)擊率、轉(zhuǎn)化率、坑產(chǎn)、評(píng)價(jià)。半標(biāo)品基本是銷量權(quán)重越大越好。非標(biāo)品的熱度權(quán)重較高。
總之,算法模式在淘寶上都是為了使顧客能夠快速找到他們需要的產(chǎn)品,并獲得滿意的產(chǎn)品。還能使公司利潤(rùn)最大化。很多商店不能做到這一點(diǎn),是因?yàn)橥懈?jìng)爭(zhēng)太激烈,功夫再高也比不上菜刀。
網(wǎng)店運(yùn)營(yíng)中,如何做好主圖和直通車圖點(diǎn)擊率高。
淘寶店的運(yùn)作。
銷售不到300的寶貝(對(duì)標(biāo)同店銷售超過(guò)10000個(gè)),最好的辦法就是搞優(yōu)惠活動(dòng)。
然后是銷售300以上(對(duì)標(biāo)同店最高1萬(wàn)以上),方法二:
淘寶店的運(yùn)作。
在同類公司中研究一下銷量前10名的主圖和他們的汽車圖,看看他們的汽車圖就知道了,汽車圖很費(fèi)時(shí)找,再結(jié)合他們的優(yōu)勢(shì)做主圖和車圖。
叫客服統(tǒng)計(jì)的客戶咨問(wèn)做多了有什么問(wèn)題?把客戶關(guān)心的問(wèn)題列出來(lái),制作一個(gè)表格,統(tǒng)計(jì)15天的數(shù)據(jù),找出三個(gè)客戶最關(guān)心的問(wèn)題,然后把客戶關(guān)心的三個(gè)問(wèn)題以圖表的形式展示出來(lái),這樣就可以消除客戶關(guān)心的三個(gè)問(wèn)題。
三、搜索流量來(lái)了遞增支付買家數(shù)流量不漲反掉,為什么!
正文
在購(gòu)買者數(shù)量增加之前,首先要談?wù)労诵膯?wèn)題-流量層次。
什么是流量層次,不是流量性質(zhì)的潛在客戶,而是從流量層次上升的傾向,簡(jiǎn)單來(lái)說(shuō)就是流量層次的影響因素。
下半年進(jìn)行檢索的學(xué)生是否發(fā)現(xiàn)了檢索流量變成波浪梯式上升的現(xiàn)象,以前只要支付購(gòu)買者數(shù)量增加檢索就很難上升?
而且,有趣的規(guī)則的各級(jí)總是千人左右變動(dòng),基本上第一流量級(jí)為500-1000,第二流量級(jí)為1000-2000,第三流量級(jí)為2000-3000,第四流量級(jí)為3000-4000。的雙曲馀弦值。的雙曲馀弦值。的雙曲馀弦值。以下類推。
在搜索流量上升的通道中波形階梯形狀特別明顯,在第一流量水平上增加數(shù)十張的話,可能會(huì)得到500張以上的搜索搜索。如果再快速增加購(gòu)買者的數(shù)量,就會(huì)發(fā)現(xiàn)一點(diǎn)作用也沒(méi)有。有時(shí)流量不上升反而會(huì)下降。許多同學(xué)一定會(huì)說(shuō)是人群不允許的問(wèn)題。事實(shí)是這樣嗎?
波形階梯式流量增加背后的真相是什么?
如果之前的《關(guān)于淘寶搜索推薦算法排序機(jī)制和2021年搜索變化的方向》一文中,應(yīng)該可以看出玄機(jī)
結(jié)果是機(jī)器學(xué)習(xí)算法模型的影響。
以前統(tǒng)計(jì)算法模型還占有很大一部分權(quán)重,從2019年下半年開(kāi)始第三代推薦搜索算法,真正進(jìn)入了系統(tǒng)推薦算法時(shí)代,以前統(tǒng)計(jì)算法只要你做得好就能撬開(kāi)流量爆炸,現(xiàn)在也是暫時(shí)的
為什么現(xiàn)在的檢索流量波形階梯式上升也是機(jī)械學(xué)習(xí)算法模型的計(jì)算力和時(shí)效的原因。
另一方面,機(jī)械學(xué)習(xí)算法模型分析您的產(chǎn)品根據(jù)您的產(chǎn)品建模推薦需要一定的時(shí)間。
第二,機(jī)械學(xué)習(xí)算法模型根據(jù)用戶和商品交流產(chǎn)生的行為數(shù)據(jù),通過(guò)語(yǔ)言召回和向量召回,由于語(yǔ)言權(quán)重和向量權(quán)重的問(wèn)題,不能同時(shí)獲得權(quán)重。像玩游戲一樣,必須逐步打破一個(gè)層次的一個(gè)層次。
這是波形階梯式上升的形態(tài)。
如果你能理解我在說(shuō)什么,你必須尊重系統(tǒng),并根據(jù)系統(tǒng)算法模型進(jìn)行操作節(jié)奏調(diào)整和布局。
無(wú)法獲得檢索流量的幾個(gè)問(wèn)題:
第一,布局語(yǔ)言過(guò)大,競(jìng)爭(zhēng)環(huán)境不好,一般實(shí)戰(zhàn)中直達(dá)語(yǔ)言過(guò)大,無(wú)指向性,檢索方面的操作也是如此。
第二,人群標(biāo)簽的問(wèn)題,人群標(biāo)簽首先是購(gòu)物意圖正確,然后是定制屬性標(biāo)簽,不重視購(gòu)物意圖的測(cè)試。
第三,種子群標(biāo)簽的準(zhǔn)確性從用戶、商品和行為數(shù)據(jù)三個(gè)方面考慮。
第四,詞系布局的問(wèn)題,詞系布局是詞召回中如何提高詞語(yǔ)權(quán)重的問(wèn)題。
第五,關(guān)鍵詞和人的點(diǎn)擊率和轉(zhuǎn)化率問(wèn)題。
第六,是人群流動(dòng)帶來(lái)的問(wèn)題,直通車智能新點(diǎn)擊量過(guò)大,喜歡使用搶劫助手卡的第一屏幕,這兩點(diǎn)對(duì)搜索產(chǎn)生影響,多是因?yàn)槭褂脠?chǎng)景錯(cuò)誤。
除了上述原因外,還有一個(gè)因素不為人所知。
如何理解坑產(chǎn)因素,如果想迅速突破這個(gè)項(xiàng)目的影響,不是你增加的速度,而是核心是對(duì)方?jīng)]有給予機(jī)會(huì),對(duì)方是什么體積。
你的搜索流量比你的競(jìng)爭(zhēng)對(duì)手多,我上一篇文章說(shuō)你的強(qiáng)度來(lái)自你的對(duì)手有多弱。
詞召回和向量召回是機(jī)器學(xué)習(xí)模型的核心分析和判斷因素,所以尊重系統(tǒng),越破壞系統(tǒng)越欺騙。
詞向量和向量回調(diào)如何優(yōu)化?
語(yǔ)向量這一重疊游戲中重復(fù)的最好方法是語(yǔ)系布局,如果更準(zhǔn)確更強(qiáng)的話,從類別布局和商品向量布局開(kāi)始。
其他,例如向量召回,系統(tǒng)不僅會(huì)根據(jù)標(biāo)題中的分詞,還會(huì)根據(jù)意思進(jìn)行語(yǔ)義相似度的語(yǔ)義向量推薦,明確方向性地知道該怎么辦。
人群標(biāo)簽的判斷和確認(rèn)模型:
為什么直通車增加現(xiàn)在很難檢索,原因真的很多,在這里再明確兩點(diǎn)。
第一,直通車測(cè)試和判斷的初始人標(biāo)簽圖像和真正成交人標(biāo)簽圖像的相似性問(wèn)題。
你測(cè)試的一組標(biāo)簽組合、二組、三組、不穩(wěn)定或不能擴(kuò)大,ppc一天比一天高。
第二,直通車詞系和檢索方關(guān)鍵詞系的相似性問(wèn)題,今天要做好檢索,首先要判斷系統(tǒng),即機(jī)械學(xué)習(xí)算法模型是什么,不是計(jì)算,系統(tǒng)是計(jì)算,系統(tǒng)是如何判斷產(chǎn)品的
很多同學(xué)根據(jù)我之前在標(biāo)簽上疊加玩法4。0之前說(shuō)的測(cè)試步驟一步一步測(cè)試,之前有用,現(xiàn)在效果不好,為什么?核心是競(jìng)爭(zhēng)的問(wèn)題。
我們要測(cè)試人群標(biāo)簽,了解人群標(biāo)簽是什么,核心組合的標(biāo)簽有幾個(gè)。
這一點(diǎn)大家都不知道,基本上以性別、年齡、消費(fèi)能力、職業(yè)、城市水平等最核心的水平為中心進(jìn)行測(cè)試,很多同學(xué)問(wèn)為什么我測(cè)試的數(shù)據(jù)不好,大問(wèn)題是購(gòu)物意圖不集中。
除此之外,與品種有很大關(guān)系:
標(biāo)準(zhǔn)品和非標(biāo)準(zhǔn)品有一定的不同,但測(cè)試邏輯不變。
所謂一詞一市場(chǎng),一屬性一群的關(guān)鍵詞不同,檢索背后的人不同,測(cè)試的定制人的屬性也不同。
因?yàn)椴荒茏鏊腥说纳猓允紫日业竭m合自己產(chǎn)品的性別、年齡、消費(fèi)能力的人。
所謂的人必須有同樣的購(gòu)物意圖,但是有多少學(xué)生統(tǒng)一了購(gòu)物意圖,測(cè)試了定制的人。
有多少同學(xué)分別測(cè)試了購(gòu)物意圖語(yǔ)和成交語(yǔ)。
為什么你測(cè)試的人群標(biāo)簽是正確的,但或者你測(cè)試的人標(biāo)簽流動(dòng)性大,不能測(cè)試特別好。
基本問(wèn)題是場(chǎng)景分析不足,購(gòu)物意圖是從潛在客戶到新客戶的過(guò)程,看點(diǎn)擊率和收藏購(gòu)買率,成交詞是新客戶成為老客戶的過(guò)程看轉(zhuǎn)化率。
關(guān)鍵詞布局必須有兩個(gè)場(chǎng)景:
第一,從潛在客戶到新客戶反映購(gòu)物意圖
第二,從新客戶到老客戶反映購(gòu)物意圖的成交方向
也就是說(shuō),你布局的關(guān)鍵詞必須有兩種。
有購(gòu)物意圖的人和有購(gòu)物意圖的人,一個(gè)是收獲。
新階段看的是潛在客流轉(zhuǎn)移到新客戶的收藏購(gòu)買情況,收割看的是關(guān)鍵詞的轉(zhuǎn)化率。
只以轉(zhuǎn)化率測(cè)試人群,語(yǔ)言方面和定制人群有很大的不穩(wěn)定性,過(guò)濾數(shù)據(jù)不穩(wěn)定。
過(guò)于穩(wěn)定的語(yǔ)言和定制的人們,如何正確擴(kuò)大范圍鎖的死亡。
因此,關(guān)鍵詞布局基于兩個(gè)場(chǎng)景:
最大化有購(gòu)物意圖的人,必須仔細(xì)分析具有屬性的類別詞,找出成交屬性的方向
這兩者之間的矛盾
這里還需要關(guān)鍵詞轉(zhuǎn)換率問(wèn)題和詞系的焦點(diǎn)方向的前提。
如果詞性差異很大,即使直通車計(jì)劃的變化很好,也很難進(jìn)行檢索。因?yàn)橹蓖ㄜ囮P(guān)鍵詞和檢索關(guān)鍵詞的詞向量不在向量上。
成敗取決于細(xì)節(jié),通常問(wèn)自己是真的知道還是不知道。
尊重系統(tǒng),逐漸完成檢索的增加,檢索關(guān)鍵詞下市場(chǎng)更是戰(zhàn)場(chǎng),你是狙擊戰(zhàn)、規(guī)模戰(zhàn)、殲滅戰(zhàn)還是游擊戰(zhàn)取決于你自己的現(xiàn)狀資源和對(duì)戰(zhàn)場(chǎng)環(huán)境的判斷,進(jìn)行檢索,檢索確定店鋪的生死不是從流量的角度來(lái)考慮,而是從人群種子人群的圖像來(lái)考慮,檢索是最準(zhǔn)確的優(yōu)化種子人群標(biāo)簽圖像的端口,推薦檢索,手淘推薦是基于店鋪種子人群標(biāo)簽圖像的準(zhǔn)確性
這一切的開(kāi)始都是從購(gòu)物意圖開(kāi)始的。的雙曲馀弦值。的雙曲馀弦值。
還有一句話,現(xiàn)在的時(shí)代:有流量不等于轉(zhuǎn)換,從流量到訂單,道路還很長(zhǎng),值得研究和學(xué)習(xí)。
七掌柜-鬼哥
。四、3分鐘輕松了解個(gè)性化推薦算法
推薦這種體驗(yàn)除了電商網(wǎng)站,還有新聞推薦、電臺(tái)音樂(lè)推薦、搜索相關(guān)內(nèi)容及廣告推薦,基于數(shù)據(jù)的個(gè)性化推薦也越來(lái)越普遍了。今天就針對(duì)場(chǎng)景來(lái)說(shuō)說(shuō)這些不同的個(gè)性化推薦算法吧。
說(shuō)個(gè)性化之前,先提一下非個(gè)性化。 非個(gè)性化的推薦也是很常見(jiàn)的,畢竟人嘛都有從眾心理,總想知道大家都在看什么。非個(gè)性化推薦的方式主要就是以比較單一的維度加上半衰期去看全局排名,比如,30天內(nèi)點(diǎn)擊排名,一周熱門排名。
但是只靠非個(gè)性化推薦有個(gè)弊端,就是馬太效應(yīng),點(diǎn)的人越多的,經(jīng)過(guò)推薦點(diǎn)得人有更多。。。強(qiáng)者越強(qiáng),弱者機(jī)會(huì)越少就越弱,可能導(dǎo)致兩級(jí)分化嚴(yán)重,一些比較優(yōu)質(zhì)素材就被埋沒(méi)了。
所以,為了解決一部分馬太效應(yīng)的問(wèn)題,也主要是順應(yīng)數(shù)據(jù)化和自動(dòng)化的模式,就需要增加個(gè)性化的推薦(可算說(shuō)到正題了。。。)個(gè)性化的優(yōu)點(diǎn)是不僅體驗(yàn)好,而且也大大增加了效率,讓你更快找到你感興趣的東西。YouTube也曾做過(guò)實(shí)驗(yàn)測(cè)試個(gè)性化和非個(gè)性化的效果,最終結(jié)果顯示個(gè)性化推薦的點(diǎn)擊率是同期熱門視頻的兩倍。
1.新聞、視頻、資訊和電臺(tái)(基于內(nèi)容推薦)
一般來(lái)說(shuō),如果是推薦資訊類的都會(huì)采用基于內(nèi)容的推薦,甚至早期的郵件過(guò)濾也采用這種方式。
基于內(nèi)容的推薦方法就是根據(jù)用戶過(guò)去的行為記錄來(lái)向用戶推薦相似額推薦品。簡(jiǎn)單來(lái)說(shuō)就是你常常瀏覽科技新聞,那就更多的給你推薦科技類的新聞。
復(fù)雜來(lái)說(shuō),根據(jù)行為設(shè)計(jì)權(quán)重,根據(jù)不同維度屬性區(qū)分推薦品都是麻煩的事,常用的判斷用戶可能會(huì)喜歡推薦品程度的余弦向量公式長(zhǎng)這樣,我就不解釋了(已經(jīng)勾起了我關(guān)于高數(shù)不好的回憶)。。。
但是,這種算法缺點(diǎn)是由于內(nèi)容高度匹配,導(dǎo)致推薦結(jié)果的驚喜度較差,而且有冷啟動(dòng)的問(wèn)題,對(duì)新用戶不能提供可靠的推薦結(jié)果。并且,只有維度增加才能增加推薦的精度,但是維度一旦增加計(jì)算量也成指數(shù)型增長(zhǎng)。如果是非實(shí)體的推薦品,定義風(fēng)格也不是一件容易的事,同一個(gè)作者的文風(fēng)和曲風(fēng)也會(huì)發(fā)生改變。
2.電商零售類(協(xié)同過(guò)濾推薦和關(guān)聯(lián)規(guī)則推薦)
說(shuō)電商推薦那不可能不講到亞馬遜,傳言亞馬遜有三成的銷售額都來(lái)自個(gè)性化的商品推薦系統(tǒng)。實(shí)際上,我自己也常常在這里找到喜歡的書(shū),也愿意主動(dòng)的去看他到底給我推薦了什么。
一般,電商主流推薦算法是基于一個(gè)這樣的假設(shè),“跟你喜好相似的人喜歡的東西你也很有可能喜歡。”即協(xié)同過(guò)濾過(guò)濾算法。主要的任務(wù)就是找出和你品味最相近的用戶,從而根據(jù)最近他的喜好預(yù)測(cè)你也可能喜歡什么。
這種方法可以推薦一些內(nèi)容上差異較大但是又是用戶感興趣的物品,很好的支持用戶發(fā)現(xiàn)潛在的興趣偏好。也不需要領(lǐng)域知識(shí),并且隨著時(shí)間推移性能提高。但是也存在無(wú)法向新用戶推薦的問(wèn)題,系統(tǒng)剛剛開(kāi)始時(shí)推薦質(zhì)可能較量差。
電商行業(yè)也常常會(huì)使用到基于關(guān)聯(lián)規(guī)則的推薦。即以關(guān)聯(lián)規(guī)則為基礎(chǔ),把已購(gòu)商品作為規(guī)則頭,規(guī)則體為推薦對(duì)象。比如,你購(gòu)買了羽毛球拍,那我相應(yīng)的會(huì)向你推薦羽毛球周邊用品。關(guān)聯(lián)規(guī)則挖掘可以發(fā)現(xiàn)不同商品在銷售過(guò)程中的相關(guān)性,在零售業(yè)中已經(jīng)得到了成功的應(yīng)用。
3.廣告行業(yè)(基于知識(shí)推薦)
自從可以瀏覽器讀取cookies,甚至獲得年齡屬性等信息,廣告的個(gè)性化投放就也可以根據(jù)不同場(chǎng)景使用了。
當(dāng)用戶的行為數(shù)據(jù)較少時(shí),基于知識(shí)的推薦可以幫助我們解決這類問(wèn)題。用戶必須指定需求,然后系統(tǒng)設(shè)法給出解決方式。假設(shè),你的廣告需要指定某地區(qū)某年齡段的投放,系統(tǒng)就根據(jù)這條規(guī)則進(jìn)行計(jì)算?;谥R(shí)的推薦在某種程度是可以看成是一種推理技術(shù)。這種方法不需要用戶行為數(shù)據(jù)就能推薦,所以不存在冷啟動(dòng)問(wèn)題。推薦結(jié)果主要依賴兩種形式,基于約束推薦和基于實(shí)例推薦。
4.組合推薦
由于各種推薦方法都有優(yōu)缺點(diǎn),所以在實(shí)際中,并不像上文講的那樣采用單一的方法進(jìn)行建模和推薦(我真的只是為了解釋清楚算法)。。。
在組合方式上,也有多種思路:加權(quán)、變換、混合、特征組合、層疊、特征擴(kuò)充、元級(jí)別。 并且,為了解決冷啟動(dòng)的問(wèn)題,還會(huì)相應(yīng)的增加補(bǔ)足策略,比如根據(jù)用戶模型的數(shù)據(jù),結(jié)合挖掘的各種榜單進(jìn)行補(bǔ)足,如全局熱門、分類熱門等。 還有一些開(kāi)放性的問(wèn)題,比如,需不需要幫助用戶有品味的提升,引導(dǎo)人去更好的生活。
最后,我總想,最好的推薦效果是像一個(gè)了解你的朋友一樣跟你推薦,因?yàn)樗滥阆矚g什么,最近對(duì)什么感興趣,也總能發(fā)現(xiàn)一些有趣的新東西。這讓我想到有一些朋友總會(huì)興致勃勃的過(guò)來(lái)說(shuō),嘿,給你推薦個(gè)東西,你肯定喜歡,光是聽(tīng)到這句話我好像就開(kāi)心起來(lái),也許這就是我喜歡這個(gè)功能的原因。
以上就是關(guān)于搜索推薦算法相關(guān)問(wèn)題的回答。希望能幫到你,如有更多相關(guān)問(wèn)題,您也可以聯(lián)系我們的客服進(jìn)行咨詢,客服也會(huì)為您講解更多精彩的知識(shí)和內(nèi)容。
推薦閱讀:
搜索一直出一樣的結(jié)果(搜索一直出一樣的結(jié)果怎么回事)
搜索關(guān)鍵詞采集數(shù)據(jù)(搜索關(guān)鍵詞采集數(shù)據(jù)的軟件)
為什么百度出現(xiàn)一些沒(méi)有的搜索(為什么百度出現(xiàn)一些沒(méi)有的搜索引擎)
某個(gè)人點(diǎn)贊過(guò)的所有視頻(某個(gè)人點(diǎn)贊過(guò)的所有視頻怎么找)
猜你喜歡
關(guān)鎮(zhèn)銓裝修靠譜嗎(關(guān)鎮(zhèn)銓裝修到底怎樣)
臺(tái)式電腦可以看抖音嗎(臺(tái)式電腦可以看抖音嗎怎么看)
小紅書(shū)有辦法看瀏覽記錄嗎(小紅書(shū)有辦法看瀏覽記錄嗎怎么看)
重慶十大杰出室內(nèi)設(shè)計(jì)師(重慶十大杰出室內(nèi)設(shè)計(jì)師排名)
一分鐘短視頻文案范文(一個(gè)文案一個(gè)情感故事)
互聯(lián)網(wǎng)內(nèi)容運(yùn)營(yíng)主要做什么(互聯(lián)網(wǎng)內(nèi)容運(yùn)營(yíng)主要做什么的)