绘制Logistic回归非比例值

问题描述：

我是新来的Python和一般编程。我正在上一堂关于Logistic回归的课。下面的代码是正确的，情节比较不错的（不是很漂亮，但是OK）：绘制Logistic回归非比例值

# ------ LOGISTIC REGRESSION ------ # 

# --- Importing the Libraries --- # 

import numpy as np 
import matplotlib.pyplot as plt 
import pandas as pd 

from sklearn.model_selection import train_test_split 
from sklearn.preprocessing import StandardScaler 
from sklearn.linear_model import LogisticRegression 
from sklearn.metrics import confusion_matrix 
from matplotlib.colors import ListedColormap 

# --- Importing the Dataset --- # 

path = '/home/bohrz/Desktop/Programação/Machine Learning/Part 3 - ' \ 
     'Classification/Section 14 - Logistic Regression/Social_Network_Ads.csv' 
dataset = pd.read_csv(path) 
X = dataset.iloc[:, 2:4].values 
y = dataset.iloc[:, -1].values 

# --- Splitting the Dataset into Training and Test set --- # 

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, 
                random_state=0) 

# --- Feature Scaling --- # 

sc_X = StandardScaler() 
X_train = sc_X.fit_transform(X_train) 
X_test = sc_X.transform(X_test) 

# --- Fitting the Logistic Regression Model to the Dataset --- # 

classifier = LogisticRegression(random_state=0) 
classifier.fit(X_train, y_train) 

# --- Predicting the Test set results --- # 

y_pred = classifier.predict(X_test) 

# --- Making the Confusion Matrix --- # 

cm = confusion_matrix(y_test, y_pred) 

# --- Visualizing Logistic Regression results --- # 

# --- Visualizing the Training set results --- # 

X_set_train, y_set_train = X_train, y_train 
X1, X2 = np.meshgrid(np.arange(start=X_set_train[:, 0].min(), 
           stop=X_set_train[:, 0].max(), step=0.01), 
        np.arange(start=X_set_train[:, 1].min(), 
           stop=X_set_train[:, 1].max(), step=0.01)) 

# Building the graph contour based on classification method 
Z_train = np.array([X1.ravel(), X2.ravel()]).T 
plt.contourf(X1, X2, classifier.predict(Z_train).reshape(X1.shape), alpha=0.75, 
                 cmap=ListedColormap(
                  ('red', 'green'))) 

# Apply limits when outliers are present 
plt.xlim(X1.min(), X1.max()) 
plt.ylim(X2.min(), X2.max()) 

# Creating the scatter plot of the Training set results 
for i, j in enumerate(np.unique(y_set_train)): 
    plt.scatter(X_set_train[y_set_train == j, 0], X_set_train[y_set_train == j, 
                   1], 
       c=ListedColormap(('red', 'green'))(i), label=j) 

plt.title('Logistic Regression (Trainning set results)') 
plt.xlabel('Age') 
plt.ylabel('Estimated Salary') 
plt.legend() 
plt.show()

我的问题是：我怎么绘制，没有规模的结果？我在代码的几个地方尝试使用invert_transform（）方法，但它没有帮助。

预先感谢您。

''我试着在代码中的几处使用invert_transform（）方法，但它没有帮助''不是很有帮助，而且这个代码不可重现，因为我们没有你的数据。也许你想改变这一点，虽然在正确的地方invert_transform应该是正确的（但不知道你在做什么）。 – sascha

“绘制结果”太模糊，无法给出明确的答案，但无论您做什么，都需要分别存储预缩放数据。例如，不要覆盖'X_train'和'X_test'，而是创建像'X_train_sc'和'X_test_sc'这样的新变量，然后将其输入到分类器中。 –

@BrendenPetersen他可以覆盖它们，因为逆向变换所需的所有东西都存储在'''sc_X'''中（但这样的覆盖可能会使代码更不直观）。 – sascha

答

你的任务只是跟踪缩放数据和非缩放数据。

虽然没有详细分析您的代码，但基本思路是：查看使用了缩放/非缩放值以及是否需要调整！

答：训练结束后，我们不需要缩放X了，所以让我们改变一切恢复
B：但是那种情节是使用一些np.mesh分类，这本身就是创建通过非标定数据，所以我们需要再次使用变压器
C：小心：基于网格的方法创建密集网格，如果边界在保持步长的情况下发生变化，则会导致计算机崩溃到内存消耗
- 这一个实际上可以调整（不知道原始值来自哪里）作为剧情会得到微妙的变化

所以需要的变化是：

答：

y_pred = classifier.predict(X_test) # YOUR CODE 
X_train = sc_X.inverse_transform(X_train) # transform back 
X_test = sc_X.inverse_transform(X_test) # """

C：

X1, X2 = np.meshgrid(np.arange(start=X_set_train[:, 0].min(), 
           stop=X_set_train[:, 0].max(), step=10.), #!!! 0.01), 
        np.arange(start=X_set_train[:, 1].min(), 
           stop=X_set_train[:, 1].max(), step=0.1)) #!!! 0.01))

B：

Z_train = np.array([X1.ravel(), X2.ravel()]).T 
plt.contourf(X1, X2, classifier.predict(sc_X.transform(Z_train)).reshape(X1.shape), # TRANFORM Z 
            alpha=0.75, 
            cmap=ListedColormap(
            ('red', 'green')))

而原来的情节显示走样直线（精细模式楼梯），现在我们看到不同的东西。我将把这个开放给感兴趣的读者（它与缩放相关联！）。

感谢您的见解和解释。我会尽量遵循您的建议和提醒。我真的不希望看起来很懒惰和苛刻。 – Miguel

@Miguel好的。我将删除第一部分。继续学习，祝你好运！ – sascha

绘制Logistic回归非比例值

相关推荐