机器学习之逻辑回归(分类问题)
任务
输入:电子邮件
输出:此为垃圾邮件/普通邮件
流程
标注样本邮件为垃圾/普通邮件(人)
获取批量的样本邮件及标签,学习其特征(计算机)
针对新的邮件,自动判断其类别(计算机)
特征
用于帮助判断是否为垃圾邮件的属性
发件人包含字符:%&*等
正文包含:现金、领取等等
图像分类
数字识别
考试通过预测
pass通过
分类
分类:根据已知样本的某些特征,判断一个新的样本属于哪些已知的样本类
基本框架:
邮件分类
发件人包含字符:%¥*
正文包含:现金、领取等 ->-> y=0->-> 判断为垃圾邮件
其他特征
分类方法
逻辑回归
KNN近邻模型
决策树
神经网络
分类任务与回归任务的明显区别
分类目标:判断类别
模型输出:非连续型标签
(passed/failed;0/1/2)
知识巩固
问题:以下应用哪些属于分类、哪些属于回归?
A.根据房屋信息预测房屋价格
B.根据房屋信息预测其是否是欢迎
C.猫狗图像识别
D.股价预测
E.股价涨跌预测