Microsoft Azure - 机器学习全流程平台搭建 - 创建workspace 到 模型训练详解
创建workspace
在登录进 Azure portal 以后,点击All services. 在All sevices 后面的搜索栏输入Log Analytics. 选择 Log Analytics.
点击常见,选择你想要设置关于workspace的各种属性
- 点击OK 完成创建。
上传数据
Azure 提供了需要sample data 和 实例模型,可以对Azure提供的数据做一些自己喜欢的操作。
如果你需要上传自己的数据。
1. 在最左边的工具栏里,选择 Datasets
2. 在最左下方,点击 +NEW
3. 点击 从本地文件 from local file
4. 选择你需要的文件,编辑dataset的名字
新建实验,搭建机器学习全流程
想要完成一套完整的机器学习流程,我们需要新建一个实验,并在里面选择各个阶段我们所需的模型和技术。
1. 同样的,在最左下方选择 +NEW
2. 因为我们是使用自己的数据搭建,所以我们选择 Blank Experiment. 当然你也可以选在样例实验来熟悉Azure
3. 首先我们导入自己的数据, 在saved datasets 中选择my datasets 拖动你要的数据集到流程图的最上端
4. 右击小 1, 点击visualize 可以看到数据的分布情况。
5. 可以选择其他的数据初步处理, 比如将你的数据转化成其他格式
6. 分隔数据。将全部data set分隔成 训练数据和测试数据。 在Data Transformation 中选择 Sample and Split, 选择 Split Data。 输入0.75,那么数据将分成 75%用于训练,25%用于测试
7. 选择一个模型作为训练你的数据的模型。选择 machine learning -> Initialize model 选择你想要的模型,拖拽到高亮的位置
8. 接下来,训练模型。选择Train ->Train model 将训练数据和模型分别连接到 Train model 两端。
9. 训练模型评分,在machine learning 标签下选择 Score 选择score 模型拖拽到高亮位置,将模型训练输出 连接到score model的一端,将未用于训练的25%测试数据连接到 score model的另一端。
10. 模型评估,在machine learning 标签下选择 Evaluate, 拖拽到高亮位置,将score model的输出连接到evaluate model 一端。模型将给出一个比对矩阵
11. 一切准备好后,点击最下端的 Run 就完成训练了。你可以像最开始的,右键每个流程块,visualize 图形化的查看模型结果。