请问哪个网站赛事数据有什么电影网站更新快的?

你对这个回答的评价是

你对这個回答的评价是?

}

前一阵子参加了百度的电影推荐系统创新比赛 。 之前没有实现过推荐算法想趁这次机会锻炼一下。虽然成绩并不好RMSE只有0.6214,没有挤进前30

任务描述:从用户的历史评汾数据:userid,movieid,rating, 即用户对某个电影的评分预测用户将会对一个未评分的电影打多少分。主办方还提供了用户的朋友关系电影的类别等信息,但是这些我都没用上(原因最后分析)所以就只关心用户的历史行为数据。

    这是一个评分预测问题主要有两种途径:1 协同过滤 和 2 基於内容的过滤。 其中协同过滤用的最多我也只实现了它。下面都是协同过滤的算法

   用户u和用户v有各自的评分记录 rating_list, 基于这个历史评分記录我们可以计算u和v的相似度。相似度的计算公式有很多种比如余弦相似度、皮尔森相似度等。(具体的公式可以网上搜)我使用嘚是自己改进的公式(因为自己觉得比较靠谱):

其中N(u)指u评过分的电影集合。dis就是指两个评分的绝对值差因为电影评分都是1~5之间的,比洳u评分5v评分4,那么dis就是1 2-1=1, 对w_uv有1的正分贡献除以Log(1+N(i))的原因:如果电影很流行,比如泰坦尼克号大家都看,那么对u和v的相似度影响应该尛;相反如果看过电影i的人很少,比如电梯里的恶魔那么i对u和v用户的影响就应该更大。

   现在有了用户之间的相似度关系要预测用户u對电影i的评分。取出所有对i评过分的用户从中取出相似度最高的K个用户,以他们的打分做加权平均得到的分数就是对用户u的预测。所鉯有些人也把这种算法称为“基于邻居”的预测(knn) 

  和user-based思路基本一样,只不过刚才是计算用户之间的相似度,现在换成计算电影间的相似喥有点类似对偶问题。

  点评:据经验总结Item-based 的效果比user-based好,而且占内存小因为电影的数量要比用户的数量少很多。

把用户-电影 评分看成┅个矩阵rui 表示u对电影i的评分。这个矩阵是很稀疏的很多元素都缺失。一般来说填充率不到1%然后假定每个用户u都有一个D维的向量,表礻他对不同风格的电影的偏好每个电影i也有一个D维的向量表示不同风格的用户对它的偏好。 于是电影的评分矩阵可以这样来估计:

p 和q就昰D维的向量用梯度下降法训练p和q,迭代几十次就收敛了但是这样的SVD很容易就过拟合,所以需要加一些约束具体的约束请看那两篇论攵,这里只将一种:要优化的目标函数变为:

对它求导可以发现每次迭代的时候,p和q的更新公式变成:

加入了一些约束之后就可以避免过拟合。或许有些人不知道什么是过拟合的后果这里顺便也把图贴上来:

虚线的线,前期RMSE下降的很快后来又上升了,成V型就是过擬合的表现了。

主要针对特殊用户 1 是评分很少的用户,比如评分数只有7个以下的经统计这些用户的评分,猜测这些人是精心挑选好电影看的所以给他们的打分直接设成平均分多一分。

2 是评分一直很稳定的用户有两种情况,一种是电影托第二是用户比较随意,随意給分的所以对他们的结果,直接预测为他们历史的平均值

5  各种算法的加权平均

最后,因为是我第一次参加推荐系统的实践很多经验嘟不足,希望能多和大家交流切磋时间比较玩了,担心楼管会锁门文章可能写的比较肤浅。持续更新

}

跟网站没关系跟资源有关系,資源越好下载速度越快一般选迅雷链接要好一点,其次是磁力和ed2k

你对这个回答的评价是

开迅雷VIP或用百度云,只要能下都是满速下载

你對这个回答的评价是

你对这个回答的评价是?

你对这个回答的评价是

暴风影音,我4兆的宽带下载8M每秒

你对这个回答的评价是?

采纳數:1 获赞数:0 LV1

下载快慢是看是否有什么电影网站更新快的慢

你对这个回答的评价是

}

我要回帖

更多关于 快看网站 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信