Python机器学习实战----第一章

机器学习实战第一章

良/恶性乳腺癌肿瘤预测

Python机器学习实战----第一章
首先,使用pandas导入数据,并且将测试集中的样本分类。将Type为0的数据归为negative。
注意:文件目录中不要有中文,最好使用/,因为\有时候会出现转义!
Python机器学习实战----第一章
第二步,导入绘图工具包。scatter设置散点图。前两个是数据的坐标。marker是形状,s是大小,c是颜色。
注:拼写一定要正确
Python机器学习实战----第一章
第一个图片完成。
下一步,绘制一条随机曲线,ax+by+c=0,截距、斜率等都是随机的。因为是随机取值,所以斜率和截距会不一样。
Python机器学习实战----第一章
点图的绘制和图一一样。
注:直线的绘制是plt.plot().lx,ly是x,y的取值。
Python机器学习实战----第一章
下一步,导入逻辑斯蒂回归
Python机器学习实战----第一章
Python机器学习实战----第一章
注:可以看到拟合不是很好
最后一步,使用全部训练集数据进行训练。
Python机器学习实战----第一章
Python机器学习实战----第一章
如上图,可以得到很好的拟合直线。

过程中遇到的问题:
1.写错label,导致调用不了,,还换了subplots调用,才发现是拼写错误。
注意 loc plot scatter的用法