变量间的关系分析_R语言
文章目录
1 变量间的关系分析
1.1 变量间的关系
- 函数关系(确定性关系)数学模型
- 相关关系(非确定性关系)统计学
- 平行关系(相关关系)
- 一元相关分析
- 多元相关分析
- 依存关系(回归分析)
- 一元回归分析
- 多元回归分析
- 平行关系(相关关系)
1.2 案例分析①_单变量一元回归分析
1. 读取数据
x = c(171, 175, 159, 155, 152, 158, 154, 164, 168, 166, 159, 164)
y = c(57, 64, 41, 38, 35, 44, 41, 51, 57, 49, 47, 46)
2. 直观图示
#散点图看x,y关系
plot(x, y)
3. 两变量间统计量分析:
总体线性相关系数
样本线性相关系数:
样本化:样本矩代替总体矩(协方差与标准差)
4.建立一个离均差积和函数
5.R语言中计算相关系数函数
***cor(x, y=NULL, method=c("pearson", "kendall", "spearman"))***
x: 数值向量、矩阵或数据框
y:空或数值向量、矩阵或数据框
method: 计算方法,默认:pearson
计算pearson相关系数
cor(x, y)
6.建立假设检验
假设检验思想
n = length(x)
tr = r/sqrt((1-r^2)/(n-2));tr
7.计算t值和p值,作结论
cor.test(x,y)
Pearson's product-moment correlation
data: x and y
t = 10.743, df = 10, p-value = 8.21e-07
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.8574875 0.9888163
sample estimates:
cor
0.9593031
**分析:
**
**p < 5
**
**95%区间估计为[0.8574875 0.9888163]
**
拒绝
8. 一元线性回归模型的额参数估计
直线方程的模型:
@
b = lxy(x, y) / lxy(x, x)
a = mean(y) - b*mean(x)
c(a=a, b=b)
#自定义函数
lxy <- function(x, y){
n = length(x);
sum(x * y) - sum(x) * sum(y) / n
}
#散点图:
plot(x, y)
lines(x,a+b*x)
9.检验:方差分析与t检验:
1.3 案例分析②_单变量一元回归分析
1.数据读取,拷贝读取
d4.3 = read.table("clipboard",header=T);d4.3
2.拟合模型
#建立模型
m4.3 = lm(y~x, data = d4.3);m4.3
Call:
lm(formula = y ~ x, data = d4.3)
Coefficients:
(Intercept) x
-1.197 1.116
3.得到模型:
#做散点图
plot(y~x, data = d4.3)
abline(m4.3)
4.模型检验_方差分析
#回归系数方差检验
anova(m4.3)Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
x 1 712077 712077 27428 < 2.2e-16 ***
Residuals 29 753 26
---
Signif. codes:
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
分析由于,拒绝
x与y间存在直线回归关系
5.模型检验_t检验
#回归系数t检验
summary(m4.3)Call:
lm(formula = y ~ x, data = d4.3)
Residuals:
Min 1Q Median 3Q Max
-6.630 -3.692 -1.535 5.338 11.432
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.19656 1.16125 -1.03 0.311
x 1.11623 0.00674 165.61 <2e-16 ***
---
Signif. codes:
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 5.095 on 29 degrees of freedom
Multiple R-squared: 0.9989, Adjusted R-squared: 0.9989
F-statistic: 2.743e+04 on 1 and 29 DF, p-value: < 2.2e-16
分析由于,拒绝
x与y间存在直线回归关系
- Author
-
lance
-
2018·10·14