机器学习基本概念

一. 不同类型的问题

监督学习(特征 + 标签)

分类问题:根据数据样本上抽取出的特征,判断其属于有限个类别中的哪一个

eg: 垃圾邮件识别(结果类别:1 垃圾邮件 2 正常邮件)

      文本情感褒贬分析(结果类别:1 褒  2 贬)

      图像内容识别(结果类别:1 喵星人  2  汪星人  3  人类  4  曹尼玛  5 都不是)

回归问题:

根据数据样本上抽取出的特征,预测连续值结果

eg: 《芳华》票房值

       魔都房价具体值

       刘德华和吴彦祖的具体颜值得分

聚类问题(无监督学习)(特征):根据数据样本上抽取出的特征,挖掘数据的关联模式

eg: 相似用户挖掘/社区发现

      新闻聚类

强化问题:研究如何基于环境而行动,以取得最大化的预期利益

eg: 游戏(‘吃鸡’)最高得分

      机器人完成任务

二. 基本术语与概念

机器学习基本概念

样本/示例/样例

特征/属性

训练集  测试集

三.  实际应用场景

机器学习基本概念

自然语言处理,计算机视觉,电商推荐系统等。。。