自然语言的语句几种表示方法

(1)Phrase structure

(2)Dependency structure

Syntactic Dependency Parsing:树,可以是交叉也可以不交叉projrctivity,non-projectivity

Semantic Dependency Parsing

(3)Frame semantics(SRL)

1.Phrase structure(句法结构):

这套理论是由乔姆斯基提出的,在句法结构中,一个非终结符只能生成小于等于两个非终结符,或者生成一个终结符。

自然语言的语句几种表示方法

非终结符就是这张图里面,像“S、NP、VP”等这些没有实词的标签,在我们构成树状节点的结构中,它下面还会有子节点,有子节点的节点,我们都称之为非终结符。

终结符就是这张图里面,像“she、bought、car”等这些具体的实词,是树状结构中的叶子节点。

我们从句子层面看,一句话可以根据语义的层次性,即它们之间的紧密型,被表达成一个二叉树,如上图所示。

 

那这个句法结构有什么缺陷呢?我们看下图,首先它是一个强序列要求的结构。其次,它不是各种语言通用的框架,依赖于特定语言规则,普适性很差。最后,它反映的语义信息比较有限。

自然语言的语句几种表示方法

2.Dependency structure(依存句法):

它通过用词与词之间的有效边来表示语法关系,因此在形式上会更简单、直观。

自然语言的语句几种表示方法

在上图这个例子里面,我们可以看到一条边SBJ,也就是指句子的主语,OBJ就是指句子的宾语,NMOD就是指名词的修饰词,它通过边的类型来定义词与词之间的关系。而边的类型比较多,目前有三十几种。

自然语言的语句几种表示方法

 

3.Frame semantics(框架语义):

它相比于之前的两个理论,更偏重于语义及知识表达,这套理论认为一个完整的表达是要结合背景知识的。比如“吃”这个词,不能独立于知识来讨论这个词应该怎么用,而要把它放在完整的语义结构中。“转”这个词也是如此。

自然语言的语句几种表示方法


https://juejin.im/post/5ab4b8b0f265da23830ad2c3