基概率论的分类方法--贝叶斯公式04
-
朴素贝叶斯概述
朴素贝叶斯算法就是利用我们在概率论中学习的条件概率公式来处理一些分类问题。朴素贝叶斯 优点:在数据较少的情况下仍然有效,可以处理多类别问题 缺点:对于输入数据的准备方式较为敏感 适用数据类型:标称型数据 -
朴素贝叶斯算法原理
概率论中有一个大名鼎鼎的概率公式,贝叶斯公式:
公式的推导过程:
举一个例子来阐述贝叶斯公式,据统计百分之八十的女孩会留长发,百分之四十的男孩也留长发,通过观察发现大街上的人留长发的比例是0.6,而且男女比例为6:4,某个雨夜交加的夜晚,一个人被抢了,警察询问罪犯性别时,这个人不知道罪犯是男是女,只知道罪犯留着一头飘逸的长发,请问警察怎么判断罪犯的性别?
根据贝叶斯公式我们大致可以判断,罪犯为女性。有一个疑问,为什么男人和女人的概率相加为0.93而不是1呢,剩下的那0.7是什么人,双性人?
问题出在了我们的观察上,由于女人天性喜欢逛街,所以总会在大街上出没,我们在大街上观察的时候当然看到的美女就更多一些,没有做到完全随机,所以0.6的概率和理论值有误差,我只能这么解释了。。。