自然语言处理课程总结_CodingPark编程公园
文章介绍
自然语言处理课程 主要讲解 词法->句法->语义->语用 四个方面
本文只介绍笔者学习过程中觉得重要的部分
第一章 绪论
大体了解自然语言处理是什么
第二章 数学知识
-
概率论
统计语言模型本质就是概率计算 -
信息论
熵的概念与计算
第三章 词法分析
- 构词法(语言学知识)
-
汉语分词
-> 基于字符串匹配的分词方法
-> -> 1 正向最大匹配分词算法; 2 逆向最大匹配分词算法; 3 双向最大匹配分词算法; 4 N-最短路径分词方法 - 命名实体识别
- 词性标注
第四章 句法分析
-
短语结构语法理论 与 Chomsky 语法体系
->规则语言
->基于规则【自顶向下的分析算法、自底向上的分析算法】判断是否合法 -
基于依存语法的分析方法
-
基于格语法的分析方法
含有语义
第五章 语法分析
-
纵向 - 语义场
同义词 - 横向 - 语义搭配
第六章 语料库
-
HotNet
第七章 统计语言模型
PASS
第八章 文本表示模型
PASS
第九章 文本自动分类与聚类
PASS