python抽取特征值
from sklearn.feature_extraction import DictVectorizer
from sklearn.feature_extraction.text import CountVectorizer, TfidfVectorizer
from sklearn.preprocessing import MinMaxScaler,StandardScaler
import jieba
def dictVec():
dict=DictVectorizer() #实例化某个类
data=dict.fit_transform([{'city': '北京', 'temperature': 100},
{'city': '上海', 'temperature': 60},
{'city': '深圳', 'temperature': 30}]) #此方法很重要,该方法用来抽取特征值
print(data)
print(type(data))
print("---------------------------")
print(dict.get_feature_names()) #返回类别名称
print(dict.inverse_transform(data)) #转换之前的数据格式
#print(dict.transform(data)) #按照原先的标准转换
return None
运行结果:
我们可以看到结果中
(0,1) 1.0
(0,3) 100
那么是怎么来的呢?
这个结果和下面的东西有关系
上海 北京 深圳 temperature
0 1 0 100