Scikit-learn所需支持库(numpy、scipy、matplotlib2D)的安装指南

Scikit-learn所需支持库的安装指南

背景介绍

Scikit-learn项目最早由数据科学家 David Cournapeau 在 2007 年发起,需要NumPy和SciPy等其他包的支持,是Python语言中专门针对机器学习应用而发展起来的一款开源框架。它的基本功能主要被分为六大部分:分类,回归,聚类,数据降维,模型选择和数据预处理。

功能 备注
分类 指识别给定对象的所属类别,属于监督学习的范畴,最常见的应用场景包括垃圾邮件检测和图像识别等。目前Scikit-learn已经实现的算法包括:支持向量机(SVM),最近邻,逻辑回归,随机森林,决策树以及多层感知器(MLP)神经网络等等。需要指出的是,由于Scikit-learn本身不支持深度学习,也不支持GPU加速,因此这里对于MLP的实现并不适合于处理大规模问题。有相关需求的读者可以查看同样对Python有良好支持的Keras和Theano等框架。
回归 指预测与给定对象相关联的连续值属性,最常见的应用场景包括预测药物反应和预测股票价格等。目前Scikit-learn已经实现的算法包括:支持向量回归(SVR),脊回归,Lasso回归,弹性网络(Elastic Net),最小角回归(LARS ),贝叶斯回归,以及各种不同的鲁棒回归算法等。可以看到,这里实现的回归算法几乎涵盖了所有开发者的需求范围,而且更重要的是,Scikit-learn还针对每种算法都提供了简单明了的用例参考。
聚类 指自动识别具有相似属性的给定对象,并将其分组为集合,属于无监督学习的范畴,最常见的应用场景包括顾客细分和试验结果分组。目前Scikit-learn已经实现的算法包括:K-均值聚类,谱聚类,均值偏移,分层聚类,DBSCAN聚类等。
数据降维 指使用主成分分析(PCA)、非负矩阵分解(NMF)或特征选择等降维技术来减少要考虑的随机变量的个数,其主要应用场景包括可视化处理和效率提升。
模型选择 指对于给定参数和模型的比较、验证和选择,其主要目的是通过参数调整来提升精度。目前Scikit-learn实现的模块包括:格点搜索,交叉验证和各种针对预测误差评估的度量函数。
数据预处理 指数据的特征提取和归一化,是机器学习过程中的第一个也是最重要的一个环节。这里归一化是指将输入数据转换为具有零均值和单位权方差的新变量,但因为大多数时候都做不到精确等于零,因此会设置一个可接受的范围,一般都要求落在0-1之间。而特征提取是指将文本或图像数据转换为可用于机器学习的数字变量。需要特别注意的是,这里的特征提取与上文在数据降维中提到的特征选择非常不同。特征选择是指通过去除不变、协变或其他统计上不重要的特征量来改进机器学习的一种方法。
总结 Scikit-learn实现了一整套用于数据降维,模型选择,特征提取和归一化的完整算法/模块,虽然缺少按步骤操作的参考教程,但Scikit-learn针对每个算法和模块都提供了丰富的参考样例和详细的说明文档。

素材准备


资源名称 地址 备注
numpy处理数组库 https://pypi.org/project/numpy/#files 根据自己的电脑系统选择(如图1)
scipy科学计算库 https://pypi.org/project/scipy/#files 同上,与python和系统配套(如图4)
matplotlib2D绘图库 https://pypi.org/project/matplotlib/#files 同上
备用地址1 https://pypi.org/ python用到的其他库可以在官网搜索
备用地址2 http://www.lfd.uci.edu/~gohlke/pythonlibs 也可以在这里下载

安装步骤

  • 1.1 numpy 安装包下载地址及选择

Scikit-learn所需支持库(numpy、scipy、matplotlib2D)的安装指南

  • 1.2 numpy安装路径及指令:pip3.6 install numpy-1.15.1-cp36-none-win_amd64.whl

Scikit-learn所需支持库(numpy、scipy、matplotlib2D)的安装指南

  • 1.3 numpy安装成功后检测

Scikit-learn所需支持库(numpy、scipy、matplotlib2D)的安装指南


  • 2.1 scipy 安装包下载地址及选择

Scikit-learn所需支持库(numpy、scipy、matplotlib2D)的安装指南


    • 2.2 scipy 安装路径及指令:pip install scipy-1.1.0-cp36-none-win_amd64.whl

Scikit-learn所需支持库(numpy、scipy、matplotlib2D)的安装指南

2.3 scipy 安装成功后检测

Scikit-learn所需支持库(numpy、scipy、matplotlib2D)的安装指南


  • 3.1 matplotlib安装方法(同上,pip install matplotlib-2.2.3-cp36-cp36m-win_amd64.whl)

Scikit-learn所需支持库(numpy、scipy、matplotlib2D)的安装指南


  • 至此,需要的库已安装完成,不足之处请大家留言指正!谢谢!