推荐书籍问题。
随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载的时代。此时,无论是信息消费者还是信息生产者都遇到了很大的挑战:对于信息消费者,从大量信息中找到自己感兴趣的信息是一件非常困难的事情;对于信息生产者,让自己生产的信息脱颖而出,受到广大用户的关注,也是一件非常困难的事情。
推荐,就是解决这一矛盾的重要工具,在互联网的产品和应用中被广泛采用,包括大家经常使用的相关搜索、话题推荐、电子商务的各种产品推荐、社交网络上的交友推荐等。
我们获得了一个著名网上书店的用户行为信息,包括对于书籍的评分数据,书籍的标签信息以及用户的社交关系,请你根据数据完成以下问题。
1.分析影响用户对书籍评分的因素;
2.建立一个模型,**附件中的用户对书籍的评分;
3.针对附件中的用户,给每个用户推荐3本没看过的书籍。
数据说明:数据一共包括5部分。
为**集合,共2列,从左到右依次是用户id、书籍id,参赛者需要**出第三列的值,即该用户对书籍的评分。
user_book_中显示了用户评分数据,共3列,从左到右依次是用户id、书籍id、该用户对书籍的评分(评分分值范围1-5分,分数越高,可视为用户越喜欢这本书籍)。
book_为书籍的标签数据,共2列,从左到右依次是书籍id、该书籍对应的标签;标签之间以逗号隔开。书籍的受欢迎程度是有差别的,所以书籍的标签数也是有差别的。
user_为用户的社交关系数据,共2列,从左到右依次是用户id、用户关注的好友的id。这里的好友关系是单向的。
user_read_为用户看过的书籍数据,共2列,从左到右依次是用户id、该用户看过的书籍的id。
数学建模模拟题
西北工业大学校内数学建模竞赛试题集锦。2001年试题a最优控制设计。在计算机控制过程中,一条计算机子令往往可以控制几个计算机部件,反过来,一个部件一般由几条指令控制。一个基本的问题是,在指令集合里寻找最少的指令,使得所有的部件得到控制 另一个问题是,当给定每条指令的长度时,在指令集合里,寻找总长度最...
数学建模模拟题
如何确定经济的实质性增长。背景1 中国改革开放三十余年,国内生产总值 gdp 从1978年的2164亿美元 人民币3645亿元增长到2010年的58790亿美元 人民币397983亿元,按美元计约27倍,按人民币计约109倍 以2000年gdp 11984亿美元 人民币99214亿元为基点计算,则2...
数学建模模拟题
不同地区和行业的职工工资水平的分析。学生 杨夏聪学号 20081060131 班级 计科国防。摘要。通过分析收集到的华北不同地区不同行业的职工工资水平,主要利用方差分析对题目所提出的问题进行了解决。两个问题都是把一组数据看作相互独立的正态总体,其中第一问只有在同一个地区不同行业的试验指标的影响,采用...