章
目
录
《推荐系统实践》由项亮编写,2012年6月1日由人民邮电出版社出版,属图灵原创丛书,全书200页。作者在推荐系统领域经验丰富,毕业于知名院校,曾在相关比赛取得佳绩并创建推荐系统社区。豆瓣评分达8.1分,备受认可。本文提供《推荐系统实践》pdf免费下载,支持百度网盘和夸克网盘两种下载途径。
内容速览
(一)基础概念与应用场景
第1章点明推荐系统是依据用户特征和行为推荐信息的工具。其应用广泛,电商平台按用户浏览、购买记录推荐商品;视频网站依观影喜好推影视;音乐电台靠听歌习惯推送歌曲;社交平台借关注和互动行为推荐内容;阅读软件据阅读偏好推荐书籍等。
(二)评测要点
1.3节提到,评测推荐系统常用离线实验、用户调查、在线实验。离线实验快且成本低,但与真实场景有差距;用户调查能直接获反馈,但样本可能有限;在线实验最贴近实际,不过成本高、风险大。评测指标包括准确率、召回率、覆盖率、多样性、新颖性、信任度等,各指标从不同角度衡量推荐效果。
(三)用户行为数据挖掘
第2章指出用户行为数据是推荐系统关键,如浏览、购买、评论等行为反映兴趣偏好。经典算法有基于邻域的算法(含基于用户和物品的协同过滤算法)、隐语义模型、基于图的模型。基于用户的协同过滤找兴趣相似用户推荐,基于物品的协同过滤依据物品相似性推荐,隐语义模型挖掘潜在关系,基于图的模型用二分图展示关系并推荐。
(四)冷启动应对策略
第3章针对新用户或新物品无足够数据的冷启动问题,提出利用注册信息、热门物品、物品内容信息、专家经验等解决思路。可依用户年龄、性别初步判断兴趣,用热门物品引导兴趣,借物品内容如电影类型推荐,参考专家经验提升推荐可靠性。
(五)用户标签数据运用
第4章聚焦用户标签数据,如Delicious、豆瓣平台用户可给物品打标签反映兴趣。书中探讨标注原因、方式、类型及基于标签的推荐系统,涵盖简单算法、改进算法、基于图的推荐算法,还涉及给用户推荐标签的方法。
(六)上下文信息融合
第5章介绍时间和地点上下文信息。时间上,用户兴趣随时间变化,推荐系统要实时更新且保证时间多样性;地点方面,基于用户位置推荐能更好满足当下需求。
(七)社交网络数据挖掘
第6章说明可从电子邮件、注册信息、社交网站获取社交网络数据。基于此实现基于社交网络的推荐,如基于邻域和图的社会化推荐算法,还介绍通过内容匹配、共同兴趣、社交网络图等推荐好友的方法。
(八)推荐系统实例与评分预测
第7章借实例展示推荐系统架构,从外围到推荐引擎,包括生成用户特征向量、相关推荐、过滤、排名等模块。第8章围绕评分预测,介绍离线实验及多种算法,如平均值法、基于邻域、隐语义与矩阵分解模型,探讨加入时间信息和模型融合,还提及Netflix Prize实验结果。
三、总结
《推荐系统实践》理论与实践兼具,全面讲解推荐系统知识,若对推荐系统感兴趣,可以下载研读此书。