svd简化
分类:
文章
•
2023-03-28 11:35:34
- SVD,Singular Value Decomposition奇异值分解
提取信息方法
可看成是从噪声中抽取信息
- 信息检索:
隐性语义检索LSI,Latent Semantic Indexing
隐形语义分析LSA,Latent Semantic Analysis
- 推荐系统
利用SVD从数据中构建一个主题空间
再利用其空间下构建相似度
(高维->低维,低维空间中计算相似度,提升RS效率)
矩阵分解
数据矩阵分解为多个独立的部分
易于处理的形式
两个或多个矩阵的乘积
- SVD是矩阵分解的一种类型
U,Σ,V

Σ只有对角元素,从大到小排列,称为奇异值
奇异值与特征值(PCA 数据中重要特征)是有关系的。就是矩阵 (Data∗DataT)特征值的平方根
在某个奇异值的数目(r 个=>奇异值的平方和累加到总值的90%以上)之后,其他的奇异值都置为0(近似于0)。
意味着数据集中仅有 r 个重要特征,而其余特征则都是噪声或冗余特征
- 优点:简化数据,去除噪声
- 缺点:转换难以理解
-