典型相关分析(Canonical correlation analysis)(三): 职业满意度典型相关分析案例
典型相关分析系列博文:
典型相关分析(Canonical correlation analysis)(一):基本思想 、复相关系数、偏相关系数
典型相关分析(Canonical correlation analysis)(二):原始变量与典型变量之间的相关性 、典型相关系数的检验
典型相关分析(Canonical correlation analysis)(三): 职业满意度典型相关分析案例
典型相关分析(Canonical correlation analysis)(四): 中国城市竞争力与基础设施的相关分析
某调查公司从一个大型零售公司随机调查了 784 人,测量了 5 个职业特性指标和 7 个职业满意变量,有关的变量见表 19。讨论两组指标之间是否相联系。
一些计算结果的数据见下面的表格。
计算的MATLAB程序如下
clc,clear
load da.txt %原始的相关系数矩阵保存在纯文本文件da.txt中
%r为相关系数矩阵
r=da;
n1=5;n2=7;num=min(n1,n2);
s1=r(1:n1,1:n1);
s12=r(1:n1,n1+1:end);
s21=s12';
s2=r(n1+1:end,n1+1:end);
m1=inv(s1)*s12*inv(s2)*s21;
m2=inv(s2)*s21*inv(s1)*s12;
[x1,y1]=eig(m1);
%以下是特征向量归一化,满足a's1a=1
gu1=x1'*s1*x1;
gu1=sqrt(diag(gu1)); %求典型相关系数
gu1=gu1'.*sign(sum(x1)); %每个特征向量的最大分量为正
gu1=repmat(gu1,length(gu1),1);
a=x1./gu1;
y1=diag(y1); %取出特征值
[y1,ind1]=sort(y1,'descend'); %特征值按照从大到小排列
a=a(:,ind1(1:num)) %取出X组的系数阵
y1=sqrt(y1(1:num)) %计算典型相关系数
flag=1;
xlswrite('bk1.xls',a,'Sheet1','A1') %把计算结果写到Excel文件中去
flag=n1+2;
str=char(['A',int2str(flag)]);
xlswrite('bk1.xls',y1','Sheet1',str)
[x2,y2]=eig(m2);
%以下是特征向量归一化,满足b's2b=1
gu2=x2'*s2*x2;
gu2=sqrt(diag(gu2));
gu2=gu2'.*sign(sum(x2));
gu2=repmat(gu2,length(gu2),1);
b=x2./gu2;
y2=diag(y2);
[y2,ind2]=sort(y2,'descend');
b=b(:,ind2(1:num))
y2=sqrt(y2(1:num)) %计算典型相关系数
flag=flag+2;
str=char(['A',int2str(flag)]);
xlswrite('bk1.xls',b,'Sheet1',str)
flag=flag+n2+1;
str=char(['A',int2str(flag)]);
xlswrite('bk1.xls',y2','Sheet1',str)
x_u_r=s1*a; %x,u的相关系数
x_u_r=x_u_r(:,1:num)
flag=flag+2;
str=char(['A',int2str(flag)]);
xlswrite('bk1.xls',x_u_r,'Sheet1',str)
y_v_r=s2*b; %y,v的相关系数
y_v_r=y_v_r(:,1:num)
flag=flag+n1+1;
str=char(['A',int2str(flag)]);
xlswrite('bk1.xls',y_v_r,'Sheet1',str)
x_v_r=s12*b; %x,v的相关系数
x_v_r=x_v_r(:,1:num)
flag=flag+n2+1;
str=char(['A',int2str(flag)]);
xlswrite('bk1.xls',x_v_r,'Sheet1',str)
y_u_r=s21*a; %y,u的相关系数
y_u_r=y_u_r(:,1:num)
flag=flag+n1+1;
str=char(['A',int2str(flag)]);
xlswrite('bk1.xls',y_u_r,'Sheet1',str)
mu=sum(x_u_r.^2)/n1 %x组原始变量被u_i解释的方差比例
mv=sum(x_v_r.^2)/n1 %x组原始变量被v_i解释的方差比例
nu=sum(y_u_r.^2)/n2 %y组原始变量被u_i解释的方差比例
nv=sum(y_v_r.^2)/n2 %y组原始变量被v_i解释的方差比例
习题
1.表 33 是 1999 年中国省、自治区的城市规模结构特征的一些数据,试通过聚类 分析将这些省、自治区进行分类。
2. 表 34 是我国 1984—2000 年宏观投资的一些数据,试利用主成分分析对投资效 益进行分析和排序。
4.为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变 量:
已知相关系数矩阵见表36,试对两组变量之间的相关性进行典型相关分析。
5.近年来我国淡水湖水质富营养化的污染日趋严重,如何对湖泊水质的富营养化 进行综合评价与治理是摆在我们面前的一项重要任务。表 37 和表 38 分别为我国 5 个湖 泊的实测数据和湖泊水质评价标准。
(1)试利用以上数据,分析总磷、耗氧量、透明度和总氮这 4 种指标对湖泊水质 富营养化所起作用。
(2)对上述 5 个湖泊的水质进行综合评估,确定水质等级。
典型相关分析系列博文:
典型相关分析(Canonical correlation analysis)(一):基本思想 、复相关系数、偏相关系数
典型相关分析(Canonical correlation analysis)(二):原始变量与典型变量之间的相关性 、典型相关系数的检验
典型相关分析(Canonical correlation analysis)(三): 职业满意度典型相关分析案例
典型相关分析(Canonical correlation analysis)(四): 中国城市竞争力与基础设施的相关分析