Python 数据分析 数据挖掘 学习路径图

转载:自己学习使用

Python 数据分析 数据挖掘 学习路径图

 

一  学好工具

python语言

推荐看廖雪峰的python3教程

数据分析python基础

如list,tuple,dic,set等。我之后的博客会写到。

 

二  获取数据

python爬虫

推荐一本书:《Python网络数据采集》(web Scraping with Python)   Ryan Mitchell 写的,非常好。读完这本书+实战几次爬虫你就算熟练了。我之后写的爬虫博客也会以读这本书时的读书笔记来写。

实战推荐崔庆才的博客,也可以看我之后写的爬虫实战博客,我是按照他大框架来进行学习的。

 

三 数据的存储与读取

数据的IO,EXCEL,CSV,JSON,SQL数据库。HDF5等。

 

四 NUMPY PANDAS SCIPY MATPLOTLIB

Numpy数组

Pandas 数据分析

Scipy 矩阵

Matplotlib 数据可视化

这一部分推荐看《Python数据分析》(Python Data Analysis)Lvan Idris写的。

 

五 数据预处理

对采集来或现成的数据进行预处理,数据清洗(推荐看《干净的数据=Clean data:数据清洗入门与实践》作者:Megan Squire),数据集成,数据变换,数据规约等。这一部分有兴趣可以看一本书 《Python数据分析与挖掘实战》。这本书看个框架就行。其实写的不咋的。浪费了我好久时间。

 

六 建模 机器学习

学习各种机器学习,数据分析算法。

算法原理推荐看《数据挖掘十大算法》作者:Xindong Wu,Vipin Kumar

python实现推荐看《Python数据分析与挖掘实战》+《Python数据分析》+《机器学习实战》

 

七 神经网络

再往深就是深度学习,神经网络。

 

寄语:

学习每一个都需要付出很大量时间,精力与努力。希望你是真的对数据挖掘,数据分析有兴趣。