AutoML简介——一个Github仓库的README,精选了很多AutoML相关文章

前言

因为最近想找一下AutoML的文章看看,正好看到了这个仓库,有兴趣的小伙伴可以去打个星追踪一下,顺便支持一下作者。这个仓库是关于AutoML一些最新研究成果的整理,README前面也有一些关于AutoML的介绍,正好可以做个翻译,方便理解AutoML。

这个账号定位是中国,不过仓库竟然没有中文翻译,如果翻译有什么不足欢迎指出。

Awesome-AutoML-Papers

Awesome-AutoML-Papers是一个自动化机器学习相关论文、文章、教程、幻灯片和项目的精选列表。给这个仓库打上星,你就能了解这个正在飞速发展的研究领域的最新动态。

什么是AutoML

自动化机器学习(Automated Machine Learning,AutoML)提供了一些能使机器学习被非机器学习专家所掌握方法和过程,以此来提高机器学习的开发效率并加速机器学习领域的研究进程。

机器学习(Machine Learning,ML)在近些年取得了巨大的成功,越来越多的学科依赖于它。但是成功关键取决于人类机器学习专家执行以下几个任务:

  1. 预处理数据
  2. 选取合适的特征
  3. 选择一个合适的模型
  4. 优化模型超参数
  5. 后期处理机器学习模型
  6. 严格分析获取的结果

通常来说这些任务的复杂度超出了非机器学习专家的能力范围,而机器学习应用程序的快速增长产生了对现成、可轻松使用且无需专家知识的机器学习方法的需求。我们将最终的这个研究领域称为针对于机器学习的渐进式自动化,即AutoML。作为机器学习的一个新子领域,不仅仅在机器学习领域,在计算机视觉、自然语言处理、图计算领域,AutoML也获得了关注。

AutoML没有一个正式的定义。从众多文章的描述来看,AutoML的基本流程展示如下:

AutoML简介——一个Github仓库的README,精选了很多AutoML相关文章

AutoML方法已经足够成熟,可以和人类机器专家相媲美,甚至有时能够超越。简而言之,因为机器学习专家又贵又难找,AutoML可以在提升性能的同时节约大量的时间金钱。因此,近年来对AutoML的商业兴趣急剧增长,几家大型的科技公司和初创企业都在研发自己的AutoML系统。下面表格是一份关于他们系统的概述对比:

Company AutoFE HPO NAS
4paradigm ×
Alibaba × ×
Baidu × ×
Google
H2O.ai ×
Microsoft ×
RapidMiner ×
Tencent × ×
Transwarp

Awesome-AutoML-Paper包含了我们在AutoML中所需基本技术的最新概述,包括:

  1. 自动数据清洗(Auto Clean)
  2. 自动特征工程(Auto FE)
  3. 超参数优化(HPO)
  4. 元学习(Meta-Learning)
  5. 神经网络架构搜索(NAS)

AutoML简介——一个Github仓库的README,精选了很多AutoML相关文章

后记

原文后面就是各个分支的相关资料了,可以说整理得很详细了,推荐去看一下。
感谢作者。