svd简化

  • SVD,Singular Value Decomposition奇异值分解
    提取信息方法
    可看成是从噪声中抽取信息
  • 信息检索:
    隐性语义检索LSI,Latent Semantic Indexing
    隐形语义分析LSA,Latent Semantic Analysis
    svd简化
  • 推荐系统
    利用SVD从数据中构建一个主题空间
    再利用其空间下构建相似度
    (高维->低维,低维空间中计算相似度,提升RS效率)
    矩阵分解
    数据矩阵分解为多个独立的部分
    易于处理的形式
    两个或多个矩阵的乘积
  • SVD是矩阵分解的一种类型
    U,Σ\Sigma,V
    svd简化
    Σ\Sigma只有对角元素,从大到小排列,称为奇异值
    奇异值与特征值(PCA 数据中重要特征)是有关系的。就是矩阵 (DataDataT)(Data* Data^T)特征值的平方根
    在某个奇异值的数目(r 个=>奇异值的平方和累加到总值的90%以上)之后,其他的奇异值都置为0(近似于0)。
    意味着数据集中仅有 r 个重要特征,而其余特征则都是噪声或冗余特征
  • 优点:简化数据,去除噪声
  • 缺点:转换难以理解