如何使用Orange3从CSV文件中的列中提取频繁项目集?

问题描述:

Oragne3中频繁的项目集小部件需要来自File小部件的输入。包含“交易”的文件被认为是一个像例如:如何使用Orange3从CSV文件中的列中提取频繁项目集?

Bread, Milk 
Bread, Diapers, Beer, Eggs 
Milk, Diapers, Beer, Cola 
Bread, Milk, Diapers, Beer 
Bread, Milk, Diapers, Cola 

但我的文件实际上有一个用户ID的列,并与实际交易中的第二列,这样的事情:

XYZ001, "Bread, Milk" 
XYZ002, "Bread, Diapers, Beer, Eggs" 
XYZ003, "Milk, Diapers, Beer, Cola" 
XYZ004, "Bread, Milk, Diapers, Beer" 
XYZ005, "Bread, Milk, Diapers, Cola" 

如何将事务(第二列)传递给频繁的项目集小部件?

变换你的篮子文件是这样的:

user=1, Bread, Milk 
user=2, Bread, Diapers, Beer, Eggs 
user=3, Milk, Diapers, Beer, Cola 
user=4, Bread, Milk, Diapers, Beer 
user=5, Bread, Milk, Diapers, Cola 

然后做任何你想做的(即带)的user列?

+1

好点!使用数据选项卡下的Excel“文本到列”命令可以更轻松地完成此操作,您可以在其中选择逗号作为分隔符。 – brbtsl