主题:求教!!急!!
通径分析与偏相关的程序设计
一、通径分析
标准化多元线性回归模型为
用最小二乘估计的回归方程为
求的正则方程组为
或
与一般回归系数的关系为
由于标准化多元回归分析使各变量都变为无量纲且变化范围一样,因而可用的大小及正负表示对的作用大小及方向。
标准化多元回归的总变差为,回归平方和为决定系数,即
剩余平方和为剩余因子的决定系数,即
因而,回归方程的检验就是复相关系数的检验:
设,则的检验用
的标准差为,的的置信区间为.
正则方程组描述分解为对Y的直接作用及通过其它对Y的间接作用原理,它可以直观地表示为一个通径图。
在图中,及剩余因子为因,Y为果,这种因果关系用单箭头“”表示,称为通径,称为通径系数(标准化偏回归系数),它表示这条通径的重要性。各间为平行关系(互为因果或有共同的因)。与间的平行关系可以用双箭头“”表示,称它为相关路,其路径系数为.这样Y与间就形成了一个封闭的通径图.通径图完全把正则方程组的意义直观化了:
如第一个方程表示了对Y的作用机理:对Y的总作用的大小和方向为.其中对Y的直接作用大小和方向为,由通径“”达到;通过对的间接作用为,由“”达到,这条路由两段组成,其路径系数等于两个路径系数之积 ;…;通过对Y的间接作用为通过“”达到. 总起来,对Y的作用是通过一条直接路和条间接路而实现的,总作用等于各路径系数之和,即
同样地,第2,3,…,个方程分别表示了对Y的作用机理,它们都是通过一条直接路和条间接路而实现的.这种作用的本质是对实现了各种原因的剖分,通过这种剖分的研究,可以使我们理解因各变化而形成的机理并可选择适宜的路径较好地实现对Y的控制.
剩余因子,假定它与各独立,其通径系数为
这是因为各与相互独立并完全决定了Y,即.
对Y的直接决定系数为
与通过相关对Y的相关决定系数为
而决定系数等于各直接与相关决定系数之和,事实上,
从上面的分析可以看出:通径分析不是一般的标准化多元线性回归分析,它不是用来预测或控制的,亦不是相关分析,因为通径系数是有向量,如和互换,则.通径系数的取值在实数范围内,可以大于1,也可以小于-1,它的分析目的是要把每一个自变量与因变量的相关系数剖分成对的直接作用和通过其它自变量对的间接影响的一种统计方法,它能告诉我们以下几点:⑴能反映对的本质作用的大小,没有其它自变量掺合进来;⑵在多个变量的相关分析中,不能全面的反应与的关系,因为它里面含有通过其它自变量对的间接影响;⑶在间的复杂相关关系中,可经从某个自变量与其它自变量的“协调”关系中得到对最佳影响的路径信息,即从复杂的自变量相关网中,得到某个自变量决定的最佳路径,具有决策的意义.作者长期在通径分析和选择指数通径分析化模型研究中提出了一个综合指标,可将对的重要性进行排序,这个指标是
称它为对的决策系数.它既反映了对的直接决定作用,又反映了与有关的相关路对的决定作用,这个指标的统计意义是很明显的:把对的直接作用和通过其它各种变量对的相关决定作用综合在一起,表现了对的综合决定能力.因此,的值可能为正,亦可能为负.将值由大到小排序,这个顺序就反映了对的综合决定作用大小的顺序.中最大的值对应的可能它对的直接作用并不最大,但它对的综合决定作用最大,因而可以把它称作为主要决策因素.中最小者若为负,把它对应的可称为主要限制性因素.
二、偏相关
由标准化多元线性回归的正则方程组可以看出,与可以形成一个封闭通径关系.在这个封闭关系中一般不能表示与的本质关系,因为之间的相关使中含有各的影响;而却能反映与的本质关系,因为此时各保持常量.能否在,,,…,这个封闭关系中,建立任两个变量间的相关,使其它变量保持常量而不干扰它们的关系呢?这种相关在统计中叫偏相关或净相关.在关系中,任两个变量间的偏相关系数记为,后面的点表示其它变量保持常量。在实际中很难直接考察,只能通过理论推导来计算它. 估计的方法是先求
则 ,
亦可以是
中的元素.
试利用MATLAB语言编写以上通径分析与偏相关分析程序,并利用下表中的数据对你所编写的程序进行验证。要求:利用MATLAB的GUI图形界面设计来设计程序界面,要求写出编写程序的流程图、程序设计文档和函数使用说明,程序中必须有必要的程序注释及程序功能说明,程序要有通用性。
为了分析四川绵阳地区1983年生中山柏逐日生长量(cm)与4个气候因素:平均气温、月降雨量、月平均日照时数和月平均湿度的关系,对如下原始数据,进行通径分析与偏相关分析.
月份
1 4.2 17.0 54.5 81.0 0.01
2 7.4 10.8 73.8 79.0 0.50
3 10.0 17.4 84.7 75.0 1.50
4 16.1 19.7 137.0 75.0 10.80
5 21.1 248.7 149.6 77.0 13.00
6 23.9 72.2 109.5 79.0 16.30
7 24.7 96.9 101.6 83.0 18.00
8 24.5 269.5 164.6 86.0 19.30
9 22.0 194.8 81.6 83.0 14.80
10 18.0 58.1 84.0 82.0 10.30
11 13.1 4.9 79.3 81.0 8.00
12 6.8 12.6 66.5 82.0 1.00
一、通径分析
标准化多元线性回归模型为
用最小二乘估计的回归方程为
求的正则方程组为
或
与一般回归系数的关系为
由于标准化多元回归分析使各变量都变为无量纲且变化范围一样,因而可用的大小及正负表示对的作用大小及方向。
标准化多元回归的总变差为,回归平方和为决定系数,即
剩余平方和为剩余因子的决定系数,即
因而,回归方程的检验就是复相关系数的检验:
设,则的检验用
的标准差为,的的置信区间为.
正则方程组描述分解为对Y的直接作用及通过其它对Y的间接作用原理,它可以直观地表示为一个通径图。
在图中,及剩余因子为因,Y为果,这种因果关系用单箭头“”表示,称为通径,称为通径系数(标准化偏回归系数),它表示这条通径的重要性。各间为平行关系(互为因果或有共同的因)。与间的平行关系可以用双箭头“”表示,称它为相关路,其路径系数为.这样Y与间就形成了一个封闭的通径图.通径图完全把正则方程组的意义直观化了:
如第一个方程表示了对Y的作用机理:对Y的总作用的大小和方向为.其中对Y的直接作用大小和方向为,由通径“”达到;通过对的间接作用为,由“”达到,这条路由两段组成,其路径系数等于两个路径系数之积 ;…;通过对Y的间接作用为通过“”达到. 总起来,对Y的作用是通过一条直接路和条间接路而实现的,总作用等于各路径系数之和,即
同样地,第2,3,…,个方程分别表示了对Y的作用机理,它们都是通过一条直接路和条间接路而实现的.这种作用的本质是对实现了各种原因的剖分,通过这种剖分的研究,可以使我们理解因各变化而形成的机理并可选择适宜的路径较好地实现对Y的控制.
剩余因子,假定它与各独立,其通径系数为
这是因为各与相互独立并完全决定了Y,即.
对Y的直接决定系数为
与通过相关对Y的相关决定系数为
而决定系数等于各直接与相关决定系数之和,事实上,
从上面的分析可以看出:通径分析不是一般的标准化多元线性回归分析,它不是用来预测或控制的,亦不是相关分析,因为通径系数是有向量,如和互换,则.通径系数的取值在实数范围内,可以大于1,也可以小于-1,它的分析目的是要把每一个自变量与因变量的相关系数剖分成对的直接作用和通过其它自变量对的间接影响的一种统计方法,它能告诉我们以下几点:⑴能反映对的本质作用的大小,没有其它自变量掺合进来;⑵在多个变量的相关分析中,不能全面的反应与的关系,因为它里面含有通过其它自变量对的间接影响;⑶在间的复杂相关关系中,可经从某个自变量与其它自变量的“协调”关系中得到对最佳影响的路径信息,即从复杂的自变量相关网中,得到某个自变量决定的最佳路径,具有决策的意义.作者长期在通径分析和选择指数通径分析化模型研究中提出了一个综合指标,可将对的重要性进行排序,这个指标是
称它为对的决策系数.它既反映了对的直接决定作用,又反映了与有关的相关路对的决定作用,这个指标的统计意义是很明显的:把对的直接作用和通过其它各种变量对的相关决定作用综合在一起,表现了对的综合决定能力.因此,的值可能为正,亦可能为负.将值由大到小排序,这个顺序就反映了对的综合决定作用大小的顺序.中最大的值对应的可能它对的直接作用并不最大,但它对的综合决定作用最大,因而可以把它称作为主要决策因素.中最小者若为负,把它对应的可称为主要限制性因素.
二、偏相关
由标准化多元线性回归的正则方程组可以看出,与可以形成一个封闭通径关系.在这个封闭关系中一般不能表示与的本质关系,因为之间的相关使中含有各的影响;而却能反映与的本质关系,因为此时各保持常量.能否在,,,…,这个封闭关系中,建立任两个变量间的相关,使其它变量保持常量而不干扰它们的关系呢?这种相关在统计中叫偏相关或净相关.在关系中,任两个变量间的偏相关系数记为,后面的点表示其它变量保持常量。在实际中很难直接考察,只能通过理论推导来计算它. 估计的方法是先求
则 ,
亦可以是
中的元素.
试利用MATLAB语言编写以上通径分析与偏相关分析程序,并利用下表中的数据对你所编写的程序进行验证。要求:利用MATLAB的GUI图形界面设计来设计程序界面,要求写出编写程序的流程图、程序设计文档和函数使用说明,程序中必须有必要的程序注释及程序功能说明,程序要有通用性。
为了分析四川绵阳地区1983年生中山柏逐日生长量(cm)与4个气候因素:平均气温、月降雨量、月平均日照时数和月平均湿度的关系,对如下原始数据,进行通径分析与偏相关分析.
月份
1 4.2 17.0 54.5 81.0 0.01
2 7.4 10.8 73.8 79.0 0.50
3 10.0 17.4 84.7 75.0 1.50
4 16.1 19.7 137.0 75.0 10.80
5 21.1 248.7 149.6 77.0 13.00
6 23.9 72.2 109.5 79.0 16.30
7 24.7 96.9 101.6 83.0 18.00
8 24.5 269.5 164.6 86.0 19.30
9 22.0 194.8 81.6 83.0 14.80
10 18.0 58.1 84.0 82.0 10.30
11 13.1 4.9 79.3 81.0 8.00
12 6.8 12.6 66.5 82.0 1.00