AutoML简介——一个Github仓库的README,精选了很多AutoML相关文章
前言
因为最近想找一下AutoML的文章看看,正好看到了这个仓库,有兴趣的小伙伴可以去打个星追踪一下,顺便支持一下作者。这个仓库是关于AutoML一些最新研究成果的整理,README前面也有一些关于AutoML的介绍,正好可以做个翻译,方便理解AutoML。
这个账号定位是中国,不过仓库竟然没有中文翻译,如果翻译有什么不足欢迎指出。
Awesome-AutoML-Papers
Awesome-AutoML-Papers是一个自动化机器学习相关论文、文章、教程、幻灯片和项目的精选列表。给这个仓库打上星,你就能了解这个正在飞速发展的研究领域的最新动态。
什么是AutoML
自动化机器学习(Automated Machine Learning,AutoML)提供了一些能使机器学习被非机器学习专家所掌握方法和过程,以此来提高机器学习的开发效率并加速机器学习领域的研究进程。
机器学习(Machine Learning,ML)在近些年取得了巨大的成功,越来越多的学科依赖于它。但是成功关键取决于人类机器学习专家执行以下几个任务:
- 预处理数据
- 选取合适的特征
- 选择一个合适的模型
- 优化模型超参数
- 后期处理机器学习模型
- 严格分析获取的结果
通常来说这些任务的复杂度超出了非机器学习专家的能力范围,而机器学习应用程序的快速增长产生了对现成、可轻松使用且无需专家知识的机器学习方法的需求。我们将最终的这个研究领域称为针对于机器学习的渐进式自动化,即AutoML。作为机器学习的一个新子领域,不仅仅在机器学习领域,在计算机视觉、自然语言处理、图计算领域,AutoML也获得了关注。
AutoML没有一个正式的定义。从众多文章的描述来看,AutoML的基本流程展示如下:
AutoML方法已经足够成熟,可以和人类机器专家相媲美,甚至有时能够超越。简而言之,因为机器学习专家又贵又难找,AutoML可以在提升性能的同时节约大量的时间金钱。因此,近年来对AutoML的商业兴趣急剧增长,几家大型的科技公司和初创企业都在研发自己的AutoML系统。下面表格是一份关于他们系统的概述对比:
Company | AutoFE | HPO | NAS |
---|---|---|---|
4paradigm | √ | √ | × |
Alibaba | × | √ | × |
Baidu | × | × | √ |
√ | √ | √ | |
H2O.ai | √ | √ | × |
Microsoft | × | √ | √ |
RapidMiner | √ | √ | × |
Tencent | × | √ | × |
Transwarp | √ | √ | √ |
Awesome-AutoML-Paper包含了我们在AutoML中所需基本技术的最新概述,包括:
- 自动数据清洗(Auto Clean)
- 自动特征工程(Auto FE)
- 超参数优化(HPO)
- 元学习(Meta-Learning)
- 神经网络架构搜索(NAS)
后记
原文后面就是各个分支的相关资料了,可以说整理得很详细了,推荐去看一下。
感谢作者。