#Data is Cool#密密麻麻的数据是怎么变成画像的?

友盟全域数据

Data is Cool是“友盟全域数据”全新增加的板块,用简短的语音+文字等多种形式为你解答数据的知识。让你感受到数据并非是冷冷的数字,他更也可以产生“Cool”效应!

“讲真的,用户画像天天挂在嘴边,他到底是如何从密密麻麻的数据中变成可见的画像呢?”

友萌君请来了【友盟+】首席数据架构师、数据委员会会长张金,第1期#Data is Cool# 他会用1分34秒的语音为你讲解用户画像的流程概览。

点击收听

#Data is Cool#密密麻麻的数据是怎么变成画像的?

(戳图片,查看清晰图哦!)

文字版:结合上图,用户画像生产流程概览,我们将用户画像的生产比喻成一个流水线,就如同将矿石加工成成品的过程。用户浏览网页、使用APP、线下行为,这些数据都是矿石,需要提炼、加工成为产品,最后还要通过质检。

这个过程通常有几个步骤。首先获得原始行为数据,基于这些数据做特征抽取,相当于清洗、加工的工作;在机器学习环节,会与外部知识库有一些交互。实际上机器算法对人的理解,一定要基于知识体系,就好像我们说的概念。比如,机器给用户打汽车相关的标签,一定要首先知道汽车体系有什么样的分类,有什么车型,有这样的知识系统我们才能把人做很好的标识归类。

最后,质量检验。这一步也很重要,一个标签的质量决定了后期的应用效果,如果前期对人的分析偏了,后期结果就很难做对。

下一期,为你带来!

#Data is Cool#第2期:用户画像生产流程框架

#Data is Cool#密密麻麻的数据是怎么变成画像的?