蔚蓝的机器学习Web服务培训输出

问题描述:

我最近安装一个蓝色的机器学习实验重新培训,更新和使用蔚蓝的数据工厂下面的示例文件蔚蓝的机器学习Web服务培训输出

和我的管道是类似的设置以下

{ 
    "name": "RetrainAndExecutePipeline", 
    "properties": { 
    "activities": [{ 
     "type": "AzureMLBatchExecution", 
     "typeProperties": { 
     "webServiceOutputs": { 
      "Output-TrainedModel": "TrainedModel" 
     }, 
     "webServiceInputs": {}, 
     "globalParameters": {} 
     }, 
     "outputs": [{ 
      "name": "TrainedModel" 
     } 
     ], 
     "policy": { 
     "timeout": "01:00:00", 
     "concurrency": 1, 
     "executionPriorityOrder": "NewestFirst", 
     "retry": 3 
     }, 
     "scheduler": { 
     "frequency": "Day", 
     "interval": 1, 
     "offset": "22:00:00", 
     "style": "StartOfInterval" 
     }, 
     "name": "Retrain ML Model", 
     "linkedServiceName": "TrainingService" 
    }], 
    "start": "2017-08-20T22:00:00Z", 
    "end": "9999-09-09T00:00:00Z", 
    "isPaused": false, 
    "hubName": "autdatafactoryml_hub", 
    "pipelineMode": "Scheduled" 
    } 
} 

及以下

{ 
    "name": "TrainedModel", 
    "properties": { 
     "published": false, 
     "type": "AzureBlob", 
     "linkedServiceName": "AzureStorageLinkedService", 
     "typeProperties": { 
      "fileName": "trainedModel.ilearner", 
      "folderPath": "trainingoutput", 
      "format": { 
       "type": "TextFormat" 
      } 
     }, 
     "availability": { 
      "frequency": "Day", 
      "interval": 1, 
      "offset": "22:00:00", 
      "style": "StartOfInterval" 
     } 
    } 
} 

的TrainedModel数据集我注意到,在完成训练后,我进入从连接到“火车模型”节点上的Web服务输出的蔚蓝Blob存储的输出是ilearner文件和两个随机命名的文件,没有扩展名,即使我没有指定它们。 一个XML格式化与内容

<?xml version="1.0" encoding="utf-8"?> 
<RuntimeInfo> 
    <Language>DotNet</Language> 
    <Version>4.5.0</Version> 
</RuntimeInfo> 

和其他与信息文件,当你想象JSON格式蔚蓝ML实验中输出如下

{ 
    "visualizationType": "learner", 
    "learner": { 
    "name": "LogisticRegressionClassifier", 
    "isTrained": true, 
    "settings": { 
     "records": [ 
     ... 
     ], 
     "features": [ 
     { 
      "name": "Setting", 
      "index": 0, 
      "elementType": "System.String", 
      "featureType": "String Feature" 
     }, 
     { 
      "name": "Value", 
      "index": 1, 
      "elementType": "System.String", 
      "featureType": "String Feature" 
     } 
     ], 
     "name": null, 
     "numberOfRows": 8, 
     "numberOfColumns": 2 
    }, 
    "weights": { 
     "records": [ 
     ... 
     ], 
     "features": [ 
     { 
      "name": "Feature", 
      "index": 0, 
      "elementType": "System.String", 
      "featureType": "String Feature" 
     }, 
     { 
      "name": "Weight", 
      "index": 1, 
      "elementType": "System.Double", 
      "featureType": "Numeric Feature" 
     } 
     ], 
     "name": null, 
     "numberOfRows": 92, 
     "numberOfColumns": 2 
    } 
    } 
} 

此JSON文件,你可以看到一个我感兴趣的,因为我认为这是显示系数值的数据,我想追踪个体系数值如何随着我更新训练模型而改变,而我一直无法找到捕获这个输出的方法。

我的问题是,有没有办法在Azure ML实验中使用天青数据工厂从单个Web服务输出捕获多个输出? 还是有一种完全不同的方式来解决这个问题吗?

我明白每个人的反馈和感谢你提前

+0

嗨,你可以请进一步解释你想通过获取JSON文件来实现什么?使用ADF重新训练ML实验的一般过程如下: 训练数据 - >输入ML模型重新训练结束点 - > iLearner - >使用它更新评分终点。 一旦更新了评分终点,您就可以使用评分终点来评分您的新输入 – DataGeek

+0

@DataGeek感谢您的建议,我更新了我的问题。总结我的更新,我想这个文件,因为我认为这是一个包含系数值。这会改变我的训练数据,我想跟踪它。 – Glasody

在Azure的ML Studio中,您可以创建一个通过附加多个Web服务的输出模块具有多路输出的Web服务。当调用Web服务时,这些模块的输出将以JSON格式返回。例如,您也可以使用多个导出数据模块将多个结果写入Azure存储。