《稀疏表達下社會化正則方法與低秩分解推薦模型的研究》是依託天津大學,由郁雪擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:稀疏表達下社會化正則方法與低秩分解推薦模型的研究
- 項目類別:青年科學基金項目
- 項目負責人:郁雪
- 依託單位:天津大學
項目摘要,結題摘要,
項目摘要
數據缺失下的矩陣低秩分解是協同過濾推薦領域中一個具有挑戰性的課題,本項目將用戶的社會網路信息引入矩陣低秩分解模型,在研究Web社會網路信息的關聯用戶信任度問題的基礎上,提出了新的社會化正則方法,引導模型學習關聯用戶空間的潛在低秩結構,理論上具有很好的解釋性,為個性化推薦技術研究提供新思路。內容包括:基於社會網路分析的理論挖掘用戶之間潛在聯繫,重新定義關聯用戶之間信任的描述方法,研究信任傳播算法和構建有效的信任測度模型;提出基於社會網路用戶信任關係的低秩矩陣分解模型,利用新的先驗知識來構造正則項懲罰係數,引導模型向真實評分逼近;研究大規模數據下基於聚類的局部低秩矩陣分解模型,採用遺傳聚類方法對原始空間進行劃分,在每個子空間上構造新的社會化正則項學習該子空間的潛在低秩結構;最後結合Web社會網路套用進行實證研究,將所研究的方法套用於電子市場行為預測、Web社區推薦和薦和電子商務產品推薦等領域。
結題摘要
考慮到推薦系統中的線上用戶和項目規模的快速增長,導致原始數據極度稀疏並含有大量噪聲。現有的基於矩陣分解推薦模型在學習向量特徵時極小化評分值的均方誤差會導致模型的過度擬合而無法建立用戶的真實興趣。融合隱式信息增強預測的準確性已經成為了目前的主流思想,項目組將大規模高維數據所包含的社會化信息、隱式內容特徵信息與低秩矩陣分解技術相結合,利用新的先驗知識來構造正則項懲罰係數,最佳化機器學習過程,在提升預測模型的準確性和可擴展性等方面取得了一定的進展。項目組首先構建了社會網路信任度正則因子懲罰項,新的正則項由用戶間的社會信任關係來引導,同時加強物品隱特徵的約束,提出雙重約束的矩陣分解推薦模型;為了體現了用戶之間的興趣差異性,提出一種基於用戶內容偏好隱式反饋信息的矩陣分解模型,模型首先使用改進的基於搜尋的遺傳聚類算法對物品進行內容劃分,然後在矩陣分解的目標函式中加入的新的內容偏好向量,該向量可視為用戶對某特定類型物品的偏好而產生的對原偏好的偏差值,新模型在訓練過程中體現出用戶對內容偏好的自適應變化,能夠更好的向真實評分逼近;考慮到社交信任關係的動態性對用戶真實偏好的影響,提出了基於時間感知的社會化推薦模型,在新的模型中我們把時間感知因素作為對原用戶隱向量的一個偏置向量,體現了最近時間內目標用戶偏好的變化;探索了矩陣分解的並行計算方法,提出通過遺傳聚類劃分原始矩陣,分別在子空間上進行社會化矩陣分解的推薦模型,雖然取得了初步的實驗結果,但是模型的維度約簡最佳化方法,子空間上的約束懲罰項等細節還需要進一步深入研究;以上模型分別對3個真實數據集進行了實證研究,結果表明融合社交關聯信息和物品隱式特徵的推薦技術能夠提高稀疏數據集上預測評分的準確性,而且時間感知的社會化推薦模型在可擴展性方面比目前主流的社會化推薦算法表現更加優秀,因此可以嘗試套用在實際的推薦場景中。