權(quán)利要求
權(quán)利要求
1.基于用戶商品二部圖的隨機(jī)游走推薦方法,包括商城數(shù)據(jù)二部圖建模方法、基于二部圖和隨機(jī)游走算法的推薦算法和冷啟動問題解決方法,其特征在于:所述商城數(shù)據(jù)二部圖建模方法如下:基于商城數(shù)據(jù),將離散信息用獨熱編碼表示,將數(shù)值信息用歸一化方法表示,將文本描述用sentence?transformer表示,最終每個用戶和商品節(jié)點都具有一個可以表示其特征的向量,該向量集合即為二部圖結(jié)構(gòu)中的節(jié)點;
所述基于二部圖和隨機(jī)游走算法的推薦算法如下:基于商城原始數(shù)據(jù)獲得二部圖后,采用隨機(jī)游走的方式進(jìn)行推薦系統(tǒng)的實現(xiàn)。
2.根據(jù)權(quán)利要求1所述的基于用戶商品二部圖的隨機(jī)游走推薦方法,其特征在于:基于商城數(shù)據(jù)二部圖建模方法中:
二部圖是一種數(shù)據(jù)結(jié)構(gòu),由節(jié)點和邊構(gòu)成,在商城場景中的用戶和商品可以抽象為兩種節(jié)點,節(jié)點之間的交互關(guān)系可以抽象為邊,最終形成一個二部圖結(jié)構(gòu)。
3.根據(jù)權(quán)利要求2所述的基于用戶商品二部圖的隨機(jī)游走推薦方法,其特征在于:基于商城數(shù)據(jù)二部圖建模方法中:
將文本描述用sentence?transformer表示,用戶和用戶之間通過購買過同一商品來定義進(jìn)行過一次交互,如果進(jìn)行過交互則在節(jié)點間連邊。
4.根據(jù)權(quán)利要求2所述的基于用戶商品二部圖的隨機(jī)游走推薦方法,其特征在于:基于商城數(shù)據(jù)二部圖建模方法中:
商品和商品之間根據(jù)向量表示通過計算余弦相似度,如果相似度超過閾值則在節(jié)點間連邊。
5.根據(jù)權(quán)利要求2所述的基于用戶商品二部圖的隨機(jī)游走推薦方法,其特征在于:基于商城數(shù)據(jù)二部圖建模方法中:
商品和用戶之間通過直接購買關(guān)系來定義交互,如果進(jìn)行過交互則在節(jié)點間連邊,至此,數(shù)據(jù)體現(xiàn)的商城場景中的所有信息都包含在了二部圖中。
6.根據(jù)權(quán)利要求1所述的基于用戶商品二部圖的隨機(jī)游走推薦方法,其特征在于:基于二部圖和隨機(jī)游走算法的推薦算法中:
隨機(jī)游走算法實現(xiàn)推薦的主要原理為:從某用戶節(jié)點出發(fā),根據(jù)轉(zhuǎn)移概率矩陣P來隨機(jī)選擇一個一階鄰居節(jié)點作為下一個游走到的節(jié)點,以上過程重復(fù)s次,稱為一次游走。
7.根據(jù)權(quán)利要求6所述的基于用戶商品二部圖的隨機(jī)游走推薦方法,其特征在于:基于二部圖和隨機(jī)游走算法的推薦算法中:
一次游走結(jié)束后,算法將再次回到起始節(jié)點進(jìn)行下一次游走,并重復(fù)r次;
在以上過程中,算法維護(hù)一個字典,字典的鍵為節(jié)點編號,值為相應(yīng)節(jié)點被游走到的次數(shù)。
8.根據(jù)權(quán)利要求6所述的基于用戶商品二部圖的隨機(jī)游走推薦方法,其特征在于:基于二部圖和隨機(jī)游走算法的推薦算法中:
由于字典中同時包含了商品節(jié)點和用戶節(jié)點,只取其中的商品節(jié)點根據(jù)游走到的次數(shù)進(jìn)行排序,取其中前10個商品進(jìn)行推薦。
9.根據(jù)權(quán)利要求1所述的基于用戶商品二部圖的隨機(jī)游走推薦方法,其特征在于:基于冷啟動問題解決方法中:
根據(jù)已經(jīng)建立的二部圖,新用戶加入后,即一個新到的用戶節(jié)點,則根據(jù)其瀏覽信息與原圖建立新連接,直接訪問過某物品則與該商品節(jié)點連邊,與某用戶交互過則與該用戶節(jié)點連邊,由此,就可以得到一個新的二部圖,再根據(jù)新的二部圖和前述的隨機(jī)游走算法進(jìn)行推薦列表的最終生成。
10.根據(jù)權(quán)利要求9所述的基于用戶商品二部圖的隨機(jī)游走推薦方法,其特征在于:基于冷啟動問題解決方法中:已經(jīng)建立的二部圖與新建立的二部圖可同時進(jìn)行隨機(jī)游走機(jī)制推薦。