矩阵分解

PCA(principal component analysis)主成分分析,原始矩阵中的每一个item可以用基向量的线性组合表示

SVD(singular value decomposition)奇异值矩阵分解,是一个矩阵及其转置矩阵的PCA, $R=M\sum U$

SVD能通过矩阵分解能同时拿到行向量与列向量的基

在电影推荐中,R的行代表某个用户,列代表某个电影,具体某个数值代表该用户对某个电影的评分,M的行代表某个用户对所有类型电影的喜好程度,U的列代表某个电影是否属于某种类型的电影,两者点乘为某个用户对某个电影的评分

该算法的目标是:基于稀疏的矩阵R,填充那些缺失的值

rui = pu * qi

我们要最小化sum(rui - pu * pi)^2,意思就是使用那些已有的矩阵R中的值去估计pu和pi,虽然不是无偏低,但是也是可以用的

具体参考:http://www.infoq.com/cn/articles/matrix-decomposition-of-recommend-system