蔚蓝的机器学习Web服务培训输出
问题描述:
我最近安装一个蓝色的机器学习实验重新培训,更新和使用蔚蓝的数据工厂下面的示例文件蔚蓝的机器学习Web服务培训输出
和我的管道是类似的设置以下
{
"name": "RetrainAndExecutePipeline",
"properties": {
"activities": [{
"type": "AzureMLBatchExecution",
"typeProperties": {
"webServiceOutputs": {
"Output-TrainedModel": "TrainedModel"
},
"webServiceInputs": {},
"globalParameters": {}
},
"outputs": [{
"name": "TrainedModel"
}
],
"policy": {
"timeout": "01:00:00",
"concurrency": 1,
"executionPriorityOrder": "NewestFirst",
"retry": 3
},
"scheduler": {
"frequency": "Day",
"interval": 1,
"offset": "22:00:00",
"style": "StartOfInterval"
},
"name": "Retrain ML Model",
"linkedServiceName": "TrainingService"
}],
"start": "2017-08-20T22:00:00Z",
"end": "9999-09-09T00:00:00Z",
"isPaused": false,
"hubName": "autdatafactoryml_hub",
"pipelineMode": "Scheduled"
}
}
及以下
{
"name": "TrainedModel",
"properties": {
"published": false,
"type": "AzureBlob",
"linkedServiceName": "AzureStorageLinkedService",
"typeProperties": {
"fileName": "trainedModel.ilearner",
"folderPath": "trainingoutput",
"format": {
"type": "TextFormat"
}
},
"availability": {
"frequency": "Day",
"interval": 1,
"offset": "22:00:00",
"style": "StartOfInterval"
}
}
}
的TrainedModel数据集我注意到,在完成训练后,我进入从连接到“火车模型”节点上的Web服务输出的蔚蓝Blob存储的输出是ilearner文件和两个随机命名的文件,没有扩展名,即使我没有指定它们。 一个XML格式化与内容
<?xml version="1.0" encoding="utf-8"?>
<RuntimeInfo>
<Language>DotNet</Language>
<Version>4.5.0</Version>
</RuntimeInfo>
和其他与信息文件,当你想象JSON格式蔚蓝ML实验中输出如下
{
"visualizationType": "learner",
"learner": {
"name": "LogisticRegressionClassifier",
"isTrained": true,
"settings": {
"records": [
...
],
"features": [
{
"name": "Setting",
"index": 0,
"elementType": "System.String",
"featureType": "String Feature"
},
{
"name": "Value",
"index": 1,
"elementType": "System.String",
"featureType": "String Feature"
}
],
"name": null,
"numberOfRows": 8,
"numberOfColumns": 2
},
"weights": {
"records": [
...
],
"features": [
{
"name": "Feature",
"index": 0,
"elementType": "System.String",
"featureType": "String Feature"
},
{
"name": "Weight",
"index": 1,
"elementType": "System.Double",
"featureType": "Numeric Feature"
}
],
"name": null,
"numberOfRows": 92,
"numberOfColumns": 2
}
}
}
此JSON文件,你可以看到一个我感兴趣的,因为我认为这是显示系数值的数据,我想追踪个体系数值如何随着我更新训练模型而改变,而我一直无法找到捕获这个输出的方法。
我的问题是,有没有办法在Azure ML实验中使用天青数据工厂从单个Web服务输出捕获多个输出? 还是有一种完全不同的方式来解决这个问题吗?
我明白每个人的反馈和感谢你提前
答
在Azure的ML Studio中,您可以创建一个通过附加多个Web服务的输出模块具有多路输出的Web服务。当调用Web服务时,这些模块的输出将以JSON格式返回。例如,您也可以使用多个导出数据模块将多个结果写入Azure存储。
嗨,你可以请进一步解释你想通过获取JSON文件来实现什么?使用ADF重新训练ML实验的一般过程如下: 训练数据 - >输入ML模型重新训练结束点 - > iLearner - >使用它更新评分终点。 一旦更新了评分终点,您就可以使用评分终点来评分您的新输入 – DataGeek
@DataGeek感谢您的建议,我更新了我的问题。总结我的更新,我想这个文件,因为我认为这是一个包含系数值。这会改变我的训练数据,我想跟踪它。 – Glasody