比较PHP中两个字符串中的单词使用情况
问题描述:
如何比较句子中单词的相似性而不是句子中的字符。比较PHP中两个字符串中的单词使用情况
我知道
similar_text($strA, $strB, $percentage);
返回两个字符串之间的相似率,但我怎么能做到这一点的单词。因此,不是查看字符串中字符之间的相似性,而是比较不同单词的内容。
我想到的唯一方法就是将每个单词(位之间的空格)与一个数字进行比较,然后比较所用的数字,但这不是解决此问题的最佳方法。据我所知,这只是简单的过于复杂。
任何帮助,将不胜感激。
答
计数(常用词)/计数(一个阵列中的总词数)* 100. 例如,你的数组有20和30个字,而你的交点产生5个。所以5/20 = 25%与一个数组共用,5/30 = 16.7%与另一个共同。
由Marc乙
提交请提一些可能aproaches来解决问题,你尝试过什么 –
用文字爆炸字符串到数组,array_intersect(),然后看看有多少话是在两者之间常见。 –
@MarcB好吧,这很有用,但我可以把这些数字转换成百分比,这样我可以发现这些字符串是否超过n%相似? (或者相同的效果 – jamesbaber