本篇文章給大家帶來了關于MySQL的相關知識,其中主要介紹了什么是推薦算法,這個算法能幫我們解決什么問題,又如何用MySQL來實現一個簡單的推薦算法,感興趣的朋友一起來看一下吧,希望對大家有幫助。
使用MySQL實現一個簡單的推薦算法
推薦算法是會經常遇到的技術。主要解決的是問題是:如果你喜歡書 A,那么你可能會喜歡書 B。
本文我們使用 MySQL ,基于數據統計,拆解實現了一個簡單的推薦算法。
首先,創建一個 用戶喜歡的書數據表,所表示的是 user_id 喜歡 book_id。
CREATE TABLE user_likes ( user_id INT NOT NULL, book_id VARCHAR(10) NOT NULL, PRIMARY KEY (user_id,book_id), UNIQUE KEY book_id (book_id, user_id) ); CREATE TABLE user_likes_similar ( user_id INT NOT NULL, liked_user_id INT NOT NULL, rank INT NOT NULL, KEY book_id (user_id, liked_user_id) );
插入 4 條測試數據
INSERT INTO user_likes VALUES (1, 'A'), (1, 'B'), (1, 'C'); INSERT INTO user_likes VALUES (2, 'A'), (2, 'B'), (2, 'C'), (2,'D'); INSERT INTO user_likes VALUES (3, 'X'), (3, 'Y'), (3, 'C'), (3,'Z'); INSERT INTO user_likes VALUES (4, 'W'), (4, 'Q'), (4, 'C'), (4,'Z');
代表的含義為:用戶 1 喜歡 A、B、C,用戶 2 喜歡 A、B、C、D,用戶 3 喜歡 X、Y、C、Z,用戶 4 喜歡 W、Q、C、Z。
以為用戶 1 計算推薦書籍為例,我們需要計算用戶 1 和其他用戶的相似度,然后根據相似度排序。
清空相似度數據表
DELETE FROM user_likes_similar WHERE user_id = 1;
計算用戶相似度數據表
INSERT INTO user_likes_similar SELECT 1 AS user_id, similar.user_id AS liked_user_id, COUNT(*) AS rank FROM user_likes target JOIN user_likes similar ON target.book_id= similar.book_id AND target.user_id != similar.user_id WHERE target.user_id = 1 GROUP BY similar.user_id ;
可以看到查找到的相似度結果為
user_id, liked_user_id, rank 1, 2, 2 1, 3, 1 1, 4, 1
然后根據相似度排序,取前 10 個,就是推薦的書籍了。
SELECT similar.book_id, SUM(user_likes_similar.rank) AS total_rank FROM user_likes_similar JOIN user_likes similar ON user_likes_similar.liked_user_id = similar.user_id LEFT JOIN user_likes target ON target.user_id = 1 AND target.book_id = similar.book_id WHERE user_likes_similar.user_id = 1 AND target.book_id IS NULL GROUP BY similar.book_id ORDER BY total_rank desc LIMIT 10;