资料分享:Andrew Ng的机器学习训练秘籍来啦(附下载)
背景
人工智能,机器学习和深度学习正在改变众多行业。吴恩达(Andrew Ng)教授历时两年,根据自己多年实践经验整理了一本机器学习、深度学习实践经验宝典《机器学习训练秘籍》。
该书的重点不在于教授传统的机器学习算法,而在于教你如何使机器学习算法发挥作用。一些AI的技术课程会给你一个工具,而这本书将教会你如何使用这些工具。如果你渴望成为AI的技术领导者,并想要学习如何为团队设定一个方向,本书将有所帮助。
秘籍网站:https://deeplearning-ai.github.io/machine-learning-yearning-cn/
为了方便读者朋友们 本地查看,帮大家打包好了一份《机器学习训练秘籍》PDF版本。
目录
Getting Started
- 机器学习为什么需要策略?
- 如何使用此书来帮助你的团队
- 先修知识与符号说明
- 规模驱动机器学习发展
Setting up development and test sets
- 开发集和测试集的定义
- 开发集和测试集应该服从同一分布
- 开发集和测试集应该有多大??
- 使用单值评估指标进行优化
- 优化指标和满意度指标
- 通过开发集和度量指标加速迭代
- 何时修改开发集、测试集和指标
- 小结:建立开发集和测试集
Basic Error Analysis
- 快速构建并迭代你的第一个系统
- 误差分析:根据开发集样本评估想法
- 在误差分析时并行评估多个想法
- 清洗误标注的开发集和测试集样本
- 将大型开发集拆分为两个子集,专注其一
- Eyeball 和 Blackbox 开发集该设置多大?
- 小结:基础误差分析
Bias and Variance
- 偏差和方差:误差的两大来源
- 偏差和方差举例
- 与最优错误率比较
- 处理偏差和方差
- 偏差和方差间的权衡
- 减少可避免偏差的技术
- 训练集误差分析
- 减少方差的技术
Learning curves
- 诊断偏差与方差:学习曲线
- 绘制训练误差曲线
- 解读学习曲线:高偏差
- 解读学习曲线:其它情况
- 绘制学习曲线
Comparing to human-level performance
- 为何与人类表现水平进行对比
- 如何定义人类表现水平
- 超越人类表现水平
Training and testing on different distributions
- 何时在不同的分布上训练与测试
- 如何决定是否使用你所有的数据
- 如何决定是否添加不一致的数据
- 给数据添加权重
- 从训练集泛化到开发集
- 辨别偏差、方差和数据不匹配误差
- 解决数据不匹配问题
- 人工合成数据
Debugging inference algorithms
- 优化验证测试
- 优化验证测试的一般形式
- 强化学习举例
End-to-end deep learning
- 端到端学习的兴起
- 端到端学习的更多例子
- 端到端学习的优缺点
- 流水线组件的选择:数据可用性
- 流水线组件的选择:任务简单性
- 直接学习更为丰富的输出
Error analysis by parts
- 根据组件进行误差分析
- 误差归因至某个组件
- 误差归因的一般情况
- 组件误差分析与人类水平对比
- 发现有缺陷的机器学习流水线
Conclusion
- 建立超级英雄团队 - 让你的队友阅读这本书吧!
PDF资源获取
下载《机器学习训练秘籍》
关注公众号,后台回复
20200228
往期活动
LSGO软件技术团队会定期开展提升编程技能的刻意练习活动,希望大家能够参与进来一起刻意练习,一起学习进步!
- 我是如何组织“算法刻意练习活动”的?
- Day01 两数相加
- Day02 寻找两个有序数组的中位数
- Day03 最长回文子串
- Day04 整数反转
- Day05 字符串转换整数 (atoi)
- Day06 回文数
- Day07 盛最多水的容器
- Day08 最长公共前缀
- Day09 三数之和
- Day10 最接近的三数之和
- Day11 有效的括号
- Day12 合并两个有序链表
- Day13 合并K个排序链表
- Day14 删除排序数组中的重复项
- Day15 搜索旋转排序数组
- Day16 字符串相乘
- Day17 全排列
- Day18 最大子序和
- Day19 螺旋矩阵
- Day20 螺旋矩阵 II
- Day21 旋转链表
- Day22 不同路径
- Day23 爬楼梯
- Day24 子集
- Day25 合并两个有序数组
- Day26 格雷编码
- Day27 二叉树的最大深度
- Day28 买卖股票的最佳时机
- Day29 买卖股票的最佳时机 II
- Day30 二叉树中的最大路径和
- Day31 只出现一次的数字
- Day32 环形链表
- Day33 环形链表 II
- Day34 LRU缓存机制
- Day35 排序链表
- Day36 最小栈
- Day37 相交链表
- Day38 求众数
- Day39 反转链表
- Day40 数组中的第K个最大元素
- Day41 存在重复元素
- Day42 二叉搜索树中第K小的元素
- Day43 2的幂
- Day44 二叉搜索树的最近公共祖先
- Day45 二叉树的最近公共祖先
- Day46 删除链表中的节点
- Day47 除自身以外数组的乘积
- Day48 Nim 游戏
- Day49 反转字符串
- Day50 反转字符串中的单词 III
我是 终身学习者“老马”,一个长期践行“结伴式学习”理念的 中年大叔。
我崇尚分享,渴望成长,于2010年创立了“LSGO软件技术团队”,并加入了国内著名的开源组织“Datawhale”,也是“[email protected]”、“智能机器人研究中心”和“大数据与哲学社会科学实验室”的一员。
愿我们一起学习,一起进步,相互陪伴,共同成长。
后台回复「搜搜搜」,随机获取电子资源!
欢迎关注,请扫描二维码: