Learning Journey3.2 - Naive Bayes 实例2(find locally by words) -1

Learning Journey3.2

第三周DAY2

趣谈

书中举到几个运用bayes的例子,开拓了我的想象。

  1. 现象表明,一个人越老,他使用的词汇量就越大。那么是否可以通过一个人使用的词汇,来推测年龄呢?
  2. 同样,能不能通过一个人使用的词汇来推测个性呢?

本文将寻找,是否不同城市的人会使用不同风格的词汇? 如果是的话,他们使用的是怎样的词汇?这又蕴藏着什么现象呢?

Naive Bayes

  1. Collect:From RSS feeds;
  2. Prepare: 把文章转为词汇容器;
  3. Analyze:检查。看是否出错;
  4. Train:使用 trainNB0();
    (之前用过好几次,就是计算概率的)
  5. Test:查看错误率,并降低错误率;
  6. Use:编一个程序,展示最常用的词汇。

Collect

由于本次要使用feedparser,一个Python的Feed解析库,来处理RSS,所以我的spyder要先安装。
我先是使用Anaconda navigator,但好像没有反应。于是使用Anaconda prompt。
打开后,输入conda install feedparser, 就好啦!
Learning Journey3.2 - Naive Bayes 实例2(find locally by words) -1

测试:Learning Journey3.2 - Naive Bayes 实例2(find locally by words) -1
成功!