Logistic回归Varimp总是与其他模型不同; Text Analytics R

问题描述:

我一直在我的推文数据集上运行逻辑回归,神经网络,朴素贝叶斯和支持向量机模型。我正在做一个情绪分析,其中R预测文本是否是来自训练数据的正面,中性或负面。Logistic回归Varimp总是与其他模型不同; Text Analytics R

我注意到,对于神经网络,朴素贝叶斯和SVM,varImp总是相同的。然而,逻辑回归具有非常不同的变量重要性的变量。我只是好奇,为什么呢?逻辑回归不是用于文本分析的好模型吗?还是有时适合使用?

+1

我会建议发布您的问题到[交叉验证](http://stats.stackexchange.com/)。 –

由于结果变量(即情感类)中有树类(正面,中性和负面),因此不能直接使用仅适用于二元结果的逻辑回归模型。其他模型,如神经网络,朴素贝叶斯和SVM可以直接处理超过2类的结果变量。由于模型规范在逻辑回归和其他模型之间存在根本差异,因此变量重要性不同也就不足为奇了。