網(wǎng)購(gòu)時(shí) 為什么你總買自己本來(lái)不想買的東西?
為什么人們會(huì)買一些與自己購(gòu)物搜索預(yù)期不同的東西?這是一個(gè)值得思考的問(wèn)題。
Alexa 購(gòu)物團(tuán)隊(duì)負(fù)責(zé)搜索功能的高級(jí)經(jīng)理 Liane Lewin-Eytan 在自己的博客中解釋道:
比如,人們對(duì) Alexa 發(fā)出搜索指令,通過(guò)購(gòu)物搜索算法,Alexa 最終會(huì)羅列出一些產(chǎn)品供用戶挑選,那些能滿足用戶需求的產(chǎn)品可以理解為“相關(guān)產(chǎn)品”。而這些“相關(guān)產(chǎn)品”的最終呈現(xiàn)依賴于人工注釋員的判斷。
簡(jiǎn)而言之,人工注釋員會(huì)標(biāo)記出符合用戶預(yù)期的相關(guān)產(chǎn)品,而其他產(chǎn)品則為不相關(guān)產(chǎn)品。有趣的是,亞馬遜方面最近發(fā)現(xiàn),用戶經(jīng)常會(huì)與注釋員標(biāo)記為不相關(guān)的產(chǎn)品產(chǎn)生聯(lián)系。
舉個(gè)例子,人工注釋員會(huì)將“購(gòu)買漢堡”的詞條與漢堡產(chǎn)品聯(lián)系起來(lái),而不是將該詞條與“漢堡機(jī)”聯(lián)系起來(lái),但亞馬遜發(fā)現(xiàn),發(fā)出“購(gòu)買漢堡”這一指令的用戶可能會(huì)買看似無(wú)關(guān)的漢堡機(jī),并不會(huì)買真正的漢堡。
亞馬遜將用戶的這種行為進(jìn)行了分類,第一種是直接購(gòu)買不相關(guān)產(chǎn)品,就像前面舉的漢堡機(jī)的例子;第二種是與不相關(guān)產(chǎn)品“互動(dòng)”,例如將不相關(guān)產(chǎn)品添加到購(gòu)物車,或是分享給其他用戶。
亞馬遜的研究表明,在面對(duì)銷量高的或者是更加便宜產(chǎn)品時(shí),用戶購(gòu)買不相關(guān)產(chǎn)品的可能性更高;而且,相比起美容產(chǎn)品和雜貨產(chǎn)品類別,人們?cè)谥T如玩具和數(shù)碼產(chǎn)品等類別中購(gòu)買不相關(guān)產(chǎn)品的可能性更大。
為了進(jìn)一步了解用戶的這一行為,亞馬遜研究人員作出了許多努力。
首先,研究團(tuán)隊(duì)使用統(tǒng)計(jì)方法來(lái)識(shí)別長(zhǎng)短不一的關(guān)鍵詞的搜索結(jié)果。研究發(fā)現(xiàn),相比起中等長(zhǎng)度的搜索關(guān)鍵詞,通過(guò)簡(jiǎn)短/相對(duì)冗長(zhǎng)的關(guān)鍵詞搜索的用戶在購(gòu)買決策方面更加靈活。因此,他們認(rèn)為,短關(guān)鍵詞表示用戶的不確定性和探索的意愿,長(zhǎng)關(guān)鍵詞會(huì)降低精確匹配的可能性;這兩種方式都會(huì)讓用戶與不相關(guān)產(chǎn)品產(chǎn)生關(guān)聯(lián)的可能性增大。
另外,研究人員還考慮了搜索結(jié)果中相關(guān)產(chǎn)品和不相關(guān)產(chǎn)品之間的間接關(guān)系。例如,兩個(gè)產(chǎn)品是相同風(fēng)格、品牌或類別,或者它們經(jīng)常是配套購(gòu)買的,那么,它們之間就存在著間接關(guān)系。
研究人員使用了兩種不同的間接關(guān)系度量方法,一種基于描述性術(shù)語(yǔ)的含義,另一種基于購(gòu)買歷史。這兩個(gè)因素都會(huì)影響用戶購(gòu)買不相關(guān)產(chǎn)品的可能性。
上述大都是數(shù)據(jù)統(tǒng)計(jì)方面的分析,亞馬遜還進(jìn)行了兩次實(shí)驗(yàn),以評(píng)估搜索結(jié)果中看似不相關(guān)的產(chǎn)品的價(jià)值。
首先,研究人員進(jìn)行了 1500 次搜索查詢,每次查詢都記錄一個(gè)相關(guān)產(chǎn)品和一個(gè)不相關(guān)產(chǎn)品,并考慮了對(duì)這些產(chǎn)品應(yīng)用五種不同選擇策略的結(jié)果。
第一種策略,即“最優(yōu)策略”,始終選擇能夠帶來(lái)更高的購(gòu)買水平或參與水平的產(chǎn)品。(參與水平/購(gòu)買級(jí)別是參與行為/購(gòu)買行為與數(shù)據(jù)樣本中的所有交互的比率。)另外四種分別是“相關(guān)策略”,即選擇相關(guān)產(chǎn)品;“不相關(guān)策略”,即選擇不相關(guān)產(chǎn)品,“隨機(jī)策略”,即在兩種產(chǎn)品中隨機(jī)選擇,“最差策略”,即選擇會(huì)降低參與水平/購(gòu)買水平的產(chǎn)品。
注:pRatio 是購(gòu)買水平,eRatio 是參與度水平
從上圖的表格中可以看出,相比起通過(guò)最優(yōu)策略和相關(guān)策略選擇的商品(沒(méi)有誤差),其余策略選擇的商品在購(gòu)買水平和參與水平方面都有著不小的差距。
在另一個(gè)實(shí)驗(yàn)中,研究人員使用相同的 1500 個(gè)查詢來(lái)訓(xùn)練三種不同的機(jī)器學(xué)習(xí)模型:一種學(xué)習(xí)最大化相關(guān)性,第二種學(xué)習(xí)最大化購(gòu)買水平,第三種學(xué)習(xí)最大參與水平。在此基礎(chǔ)上,亞馬遜構(gòu)建了兩個(gè)融合模型,一個(gè)結(jié)合了關(guān)聯(lián)模型和參與模型,另一個(gè)結(jié)合了關(guān)聯(lián)模型和購(gòu)買模型,而且,還可以對(duì)每個(gè)融合模型進(jìn)行調(diào)優(yōu),為組成該模型的兩個(gè)模型的輸出分配不同的權(quán)重。
例如,在關(guān)聯(lián)購(gòu)買融合模型中,將關(guān)聯(lián)和購(gòu)買級(jí)的權(quán)值分別設(shè)置為 1 和 0,設(shè)置之后,該融合模型將只產(chǎn)生關(guān)聯(lián)模型輸出;將融合模型的權(quán)重都設(shè)置為 0.5 將會(huì)得到兩個(gè)模型輸出的均勻混合。對(duì)于這兩個(gè)融合模型,亞馬遜設(shè)置了一系列的權(quán)重并繪制了結(jié)果。
正如上圖所示,相關(guān)性和購(gòu)買水平/參與水平之間存在權(quán)衡:提高或降低關(guān)聯(lián)性將會(huì)影響購(gòu)買水平/參與水平的表現(xiàn)。
亞馬遜表示,如果搜索結(jié)果不能滿足客戶的需求,但看起來(lái)是相關(guān)的,客戶可能會(huì)理解并原諒這種不足。與此同時(shí),購(gòu)買水平/參與水平代表了一種更主觀的相關(guān)性類型,人工注釋員無(wú)法評(píng)估這種相關(guān)性,這也可能導(dǎo)致無(wú)法推薦出令人滿意的產(chǎn)品。
目前,亞馬遜用來(lái)評(píng)估相關(guān)性和購(gòu)買/參與水平之間權(quán)衡的模型還相當(dāng)粗糙,一個(gè)更復(fù)雜更強(qiáng)大的機(jī)器學(xué)習(xí)模型能夠獲得更好的結(jié)果,特別是如果它被明確地訓(xùn)練來(lái)評(píng)估一些確定的因素,例如關(guān)鍵詞長(zhǎng)度、價(jià)格和間接關(guān)系等。
雷鋒網(wǎng)了解到,在 2 月份即將舉行的 ACM Web 搜索和數(shù)據(jù)挖掘會(huì)議上,亞馬遜將進(jìn)一步展示這項(xiàng)研究的成果。