如何使用Orange3从CSV文件中的列中提取频繁项目集?
问题描述:
Oragne3中频繁的项目集小部件需要来自File小部件的输入。包含“交易”的文件被认为是一个篮像例如:如何使用Orange3从CSV文件中的列中提取频繁项目集?
Bread, Milk
Bread, Diapers, Beer, Eggs
Milk, Diapers, Beer, Cola
Bread, Milk, Diapers, Beer
Bread, Milk, Diapers, Cola
但我的文件实际上有一个用户ID的列,并与实际交易中的第二列,这样的事情:
XYZ001, "Bread, Milk"
XYZ002, "Bread, Diapers, Beer, Eggs"
XYZ003, "Milk, Diapers, Beer, Cola"
XYZ004, "Bread, Milk, Diapers, Beer"
XYZ005, "Bread, Milk, Diapers, Cola"
如何将事务(第二列)传递给频繁的项目集小部件?
答
变换你的篮子文件是这样的:
user=1, Bread, Milk
user=2, Bread, Diapers, Beer, Eggs
user=3, Milk, Diapers, Beer, Cola
user=4, Bread, Milk, Diapers, Beer
user=5, Bread, Milk, Diapers, Cola
然后做任何你想做的(即带)的user
列?
好点!使用数据选项卡下的Excel“文本到列”命令可以更轻松地完成此操作,您可以在其中选择逗号作为分隔符。 – brbtsl