资料分享:Andrew Ng的机器学习训练秘籍来啦(附下载)

背景

人工智能,机器学习和深度学习正在改变众多行业。吴恩达(Andrew Ng)教授历时两年,根据自己多年实践经验整理了一本机器学习、深度学习实践经验宝典《机器学习训练秘籍》。

资料分享:Andrew Ng的机器学习训练秘籍来啦(附下载)

该书的重点不在于教授传统的机器学习算法,而在于教你如何使机器学习算法发挥作用。一些AI的技术课程会给你一个工具,而这本书将教会你如何使用这些工具。如果你渴望成为AI的技术领导者,并想要学习如何为团队设定一个方向,本书将有所帮助。

秘籍网站:https://deeplearning-ai.github.io/machine-learning-yearning-cn/

为了方便读者朋友们 本地查看,帮大家打包好了一份《机器学习训练秘籍》PDF版本


目录

Getting Started

  • 机器学习为什么需要策略?
  • 如何使用此书来帮助你的团队
  • 先修知识与符号说明
  • 规模驱动机器学习发展

Setting up development and test sets

  • 开发集和测试集的定义
  • 开发集和测试集应该服从同一分布
  • 开发集和测试集应该有多大??
  • 使用单值评估指标进行优化
  • 优化指标和满意度指标
  • 通过开发集和度量指标加速迭代
  • 何时修改开发集、测试集和指标
  • 小结:建立开发集和测试集

Basic Error Analysis

  • 快速构建并迭代你的第一个系统
  • 误差分析:根据开发集样本评估想法
  • 在误差分析时并行评估多个想法
  • 清洗误标注的开发集和测试集样本
  • 将大型开发集拆分为两个子集,专注其一
  • Eyeball 和 Blackbox 开发集该设置多大?
  • 小结:基础误差分析

Bias and Variance

  • 偏差和方差:误差的两大来源
  • 偏差和方差举例
  • 与最优错误率比较
  • 处理偏差和方差
  • 偏差和方差间的权衡
  • 减少可避免偏差的技术
  • 训练集误差分析
  • 减少方差的技术

Learning curves

  • 诊断偏差与方差:学习曲线
  • 绘制训练误差曲线
  • 解读学习曲线:高偏差
  • 解读学习曲线:其它情况
  • 绘制学习曲线

Comparing to human-level performance

  • 为何与人类表现水平进行对比
  • 如何定义人类表现水平
  • 超越人类表现水平

Training and testing on different distributions

  • 何时在不同的分布上训练与测试
  • 如何决定是否使用你所有的数据
  • 如何决定是否添加不一致的数据
  • 给数据添加权重
  • 从训练集泛化到开发集
  • 辨别偏差、方差和数据不匹配误差
  • 解决数据不匹配问题
  • 人工合成数据

Debugging inference algorithms

  • 优化验证测试
  • 优化验证测试的一般形式
  • 强化学习举例

End-to-end deep learning

  • 端到端学习的兴起
  • 端到端学习的更多例子
  • 端到端学习的优缺点
  • 流水线组件的选择:数据可用性
  • 流水线组件的选择:任务简单性
  • 直接学习更为丰富的输出

Error analysis by parts

  • 根据组件进行误差分析
  • 误差归因至某个组件
  • 误差归因的一般情况
  • 组件误差分析与人类水平对比
  • 发现有缺陷的机器学习流水线

Conclusion

  • 建立超级英雄团队 - 让你的队友阅读这本书吧!

PDF资源获取

下载《机器学习训练秘籍》

关注公众号,后台回复

20200228


往期活动

LSGO软件技术团队会定期开展提升编程技能的刻意练习活动,希望大家能够参与进来一起刻意练习,一起学习进步!


我是 终身学习者“老马”,一个长期践行“结伴式学习”理念的 中年大叔

我崇尚分享,渴望成长,于2010年创立了“LSGO软件技术团队”,并加入了国内著名的开源组织“Datawhale”,也是“[email protected]”、“智能机器人研究中心”和“大数据与哲学社会科学实验室”的一员。

愿我们一起学习,一起进步,相互陪伴,共同成长。

后台回复「搜搜搜」,随机获取电子资源!
欢迎关注,请扫描二维码:
资料分享:Andrew Ng的机器学习训练秘籍来啦(附下载)