自然语言处理课程总结_CodingPark编程公园

文章介绍

自然语言处理课程 主要讲解 词法->句法->语义->语用 四个方面
本文只介绍笔者学习过程中觉得重要的部分
自然语言处理课程总结_CodingPark编程公园

第一章 绪论

大体了解自然语言处理是什么

第二章 数学知识

  • 概率论
    统计语言模型本质就是概率计算
  • 信息论
    熵的概念与计算
    自然语言处理课程总结_CodingPark编程公园

第三章 词法分析

  • 构词法(语言学知识)
  • 汉语分词
    -> 基于字符串匹配的分词方法
    -> -> 1 正向最大匹配分词算法; 2 逆向最大匹配分词算法; 3 双向最大匹配分词算法; 4 N-最短路径分词方法
  • 命名实体识别
  • 词性标注

第四章 句法分析

  • 短语结构语法理论 与 Chomsky 语法体系
    ->规则语言
    ->基于规则【自顶向下的分析算法、自底向上的分析算法】判断是否合法

  • 基于依存语法的分析方法

  • 基于格语法的分析方法
    含有语义
    自然语言处理课程总结_CodingPark编程公园

第五章 语法分析

  • 纵向 - 语义场
    同义词
  • 横向 - 语义搭配

第六章 语料库

  • HotNet
    自然语言处理课程总结_CodingPark编程公园
    自然语言处理课程总结_CodingPark编程公园

第七章 统计语言模型

PASS

第八章 文本表示模型

PASS

第九章 文本自动分类与聚类

PASS

自然语言处理课程总结_CodingPark编程公园