本校暑假训练营8_Python数据入门4-降维1
目录
机器学习导论
- 机器学习应用场景
- 机器学习算法的类型
- 本课程涵盖的机器学习内容
- 回归
- 贝叶斯
- 降维
- 基于实例
- 聚类
- 机器学习术语
- 特征----》变量、列、属性、字段
- 实例----》行、观察值、数据点、值和项目
- 目标-----》标签、预测值和因变量
- 数据----》自变量
- 机器学习测试和训练集
- 监督学习与无监督学习
- 因子分析
- 因子载荷
- 奇异值分解(SVD)
- 主成分分析(PCA)
- 案例练习
- 4-2
- 4-3
开始
- 机器学习
- 机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
- 它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。
-
机器学习应用场景
-
机器学习算法的类型
-
本课程涵盖的机器学习内容
-
机器学习术语
-
案例样本数据
-
监督学习与无监督学习
-
因子分析
- 因子分析是指研究从变量群中提取共性因子的统计技术。最早由英国心理学家C.E.斯皮尔曼提出。他发现学生的各科成绩之间存在着一定的相关性,一科成绩好的学生,往往其他各科成绩也比较好,从而推想是否存在某些潜在的共性因子,或称某些一般智力条件影响着学生的学习成绩。因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。
-
因子载荷
-
奇异值分解
- 奇异值分解(Singular Value Decomposition)是线性代数中一种重要的矩阵分解,是矩阵分析中正规矩阵酉对角化的推广。在信号处理、统计学等领域有重要应用
- 主成分分析PCA进行降维
- 主成分分析(Principal Component Analysis,PCA), 将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。 又称主分量分析。
- 在实际课题中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息。
- 主成分分析首先是由K.皮尔森对非随机变量引入的,尔后H.霍特林将此方法推广到随机向量的情形。信息的大小通常用离差平方和或方差来衡量。
- 设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上用来降维的一种方法。
- 案例练习