Learning Journey3.2 - Naive Bayes 实例2(find locally by words) -1
Learning Journey3.2
第三周DAY2
趣谈
书中举到几个运用bayes的例子,开拓了我的想象。
- 现象表明,一个人越老,他使用的词汇量就越大。那么是否可以通过一个人使用的词汇,来推测年龄呢?
- 同样,能不能通过一个人使用的词汇来推测个性呢?
本文将寻找,是否不同城市的人会使用不同风格的词汇? 如果是的话,他们使用的是怎样的词汇?这又蕴藏着什么现象呢?
Naive Bayes
- Collect:From RSS feeds;
- Prepare: 把文章转为词汇容器;
- Analyze:检查。看是否出错;
-
Train:使用 trainNB0();
(之前用过好几次,就是计算概率的) - Test:查看错误率,并降低错误率;
- Use:编一个程序,展示最常用的词汇。
Collect
由于本次要使用feedparser,一个Python的Feed解析库,来处理RSS,所以我的spyder要先安装。
我先是使用Anaconda navigator,但好像没有反应。于是使用Anaconda prompt。
打开后,输入conda install feedparser, 就好啦!
测试:
成功!