为给定单词输入与语义相关的关键字

问题描述:

是否有任何开源/免费软件可用于给定单词的语义相关关键字。例如狗这个词:它应该给出的关键字如:动物,哺乳动物,... 或单词法国它应该给你的关键字像:国家,欧洲...。 基本上是一组与给定单词相关的关键字。为给定单词输入与语义相关的关键字

,或者如果没有,有没有人对如何实现这一点的一个想法,多么复杂,这将是。

最好的问候

是的。瑞典的一家名为Saplo的公司专注于此。我相信你可以使用他们的API,如果你问得很好,你可能可以免费使用它(如果它不是用于商业目的的话)。

Saplo

+0

不,我不在那里工作,但我确实有一个朋友。 – Phil 2010-10-20 15:50:08

+0

但这是为了从文章生成关键字。没有找到给定单词的语义相关单词。如果存在,某种自由/开源解决方案会更好。 – 2010-10-20 15:54:22

+0

啊对,我的坏,他们还没有实现。他们可能很快就会有一天。 – Phil 2010-10-20 17:18:26

Saplo有这种支持。虽然它尚未在Saplo API中公开访问,但现在我们将考虑您的用例。

弗雷德里克Hörte - Saplo

更新:

(取得联系伴我走过Saplo homepage或@horte)

是。你所寻找的是类似于搜索矢量空间模型的东西,它是最有效的方法。有一些开源库可用于潜在语义索引/搜索(向量空间模型的特例)。 Apache Lucene是最渺小的之一。或从谷歌code

Wordnet可能是你所需要的。 Wordnet将英语单词分为多组同义词并提供一般定义,并记录这些组之间的各种语义关系。

有有使用WORDNET万吨的项目,在这里你有一个清单: http://wordnet.princeton.edu/wordnet/related-projects/

看这一个,你会发现它特别有用(http://kylescholz.comhttp://kylescholz.com/projects/wordnet/?text=dog

可以看到现场演示在这里: http://kylescholz.com/projects/wordnet/?text=dog

我希望这可以帮助。

如果您正在寻找网上资源,有几个考虑(至少在2017年,在OP的日期是2010)。

语义链接(http://www.semantic-link.com):语义链接的创建者提供了一个界面,用于计算所有英语维基百科上的单词对“互信息”度量的结果。只有维基百科中出现1000次以上的单词才可用。

“狗” 让你,例如:纯种,品种,犬,宠物,小狗。

看来,然而,你真的找一个在线工具,使上下义词和上位词。从维基百科页面“上下义关系和hypernymy”:

在语言学,下位词(希腊HUPO,“下”和ónoma,“名”)是一个单词或短语,其语义场包括内的另一个词,它的超音名词或上位词(来自希腊语hupér,“over”和ónoma,“name”)。简而言之,下位词与其上位词共有一种类型关系。例如,鸽子,乌鸦,鹰和海鸥都是鸟类的下位词(他们的同义词);而这又是一个动物的下位词。

WordNet(https://wordnet.princeton.edu)拥有此信息并具有在线搜索工具。有了这个工具,如果你输入一个单词,你会得到一个或多个在他们旁边带有“S”的条目。如果单击“S”,则可以浏览带有该含义或用法的单词的“同义词(语义)关系”,并且此包括直接超级和下位词。它非常丰富!例如:“狗”(如在“家养狗”中) - >“犬科动物” - >“食肉动物” - >“胎盘哺乳动物” - >“脊椎动物” - >“脊索动物” - - >“等”或“狗” - >“家畜” - >“动物” - >“有机体” - >“生物” - >

还有WordNik列出了上位词和反向字典单词(在定义中给定单词的单词)。 “法国”的上位词包括“欧洲国家/国家”和反向词典,包括法国的地区和城市,某些统治者的名字等。“狗”获得上位词“家养动物”(和其他人)。