机器学习基本概念
一. 不同类型的问题
监督学习(特征 + 标签)
分类问题:根据数据样本上抽取出的特征,判断其属于有限个类别中的哪一个
eg: 垃圾邮件识别(结果类别:1 垃圾邮件 2 正常邮件)
文本情感褒贬分析(结果类别:1 褒 2 贬)
图像内容识别(结果类别:1 喵星人 2 汪星人 3 人类 4 曹尼玛 5 都不是)
回归问题:
根据数据样本上抽取出的特征,预测连续值结果
eg: 《芳华》票房值
魔都房价具体值
刘德华和吴彦祖的具体颜值得分
聚类问题(无监督学习)(特征):根据数据样本上抽取出的特征,挖掘数据的关联模式
eg: 相似用户挖掘/社区发现
新闻聚类
强化问题:研究如何基于环境而行动,以取得最大化的预期利益
eg: 游戏(‘吃鸡’)最高得分
机器人完成任务
二. 基本术语与概念
样本/示例/样例
特征/属性
训练集 测试集
三. 实际应用场景
自然语言处理,计算机视觉,电商推荐系统等。。。