线性相关分析
对于二元连续型总体(X,Y),人们研究其两个分量之间的关系,途径之一是采用(随机)自变量X的如下线性函数作为(随机)因变量Y的模拟:
=β+βX (48.3.1)
线性模拟,在每一个观测单元上的取值,即总体Y的线性模拟值
,与总体X在同一个观测单元上的取值X之间具有与(48.3.1)式同样的线性关系:
=β+βx (48.3.1)
x—y平面上用(48.3.1)式表示的直线称为总体Y关于总体X的一元回归直线。
为了由总体()的样本观测值(
)=(
)用最小二乘法求得截距β和斜率β的估计值b和b,从而求得线性模拟
的估计值
=b+bx,需要首先定义样本观测值
与
的相关矩l,协方差S和相关系数r:
最小二乘法是求得满足下式的b0和b的方法:=min,其中:对i=1—n(48.3.3)
i=b0+bx,是线性模拟
=β+βx的估计值
首先由=0推出b=
,将其代入1=0,解出
。下列简单的推导表明,这样求得Q的驻点是Q的最小值点:
以上推导过程最后一步“≥”的等号当且仅当用求得的驻点
(b,b)=()代入Q(b,b)时成立。可以把(*)式最左端与最后一个等式右端改写如下:令
=b+
上式表明,Q=Q()在
-Q空间的图形是以(
,lyy-
)为顶点,开口向上的椭圆抛物面,其顶点是最低点,即Q的最小值点,如图48—1所示。
图48—1
这样,就得到了(48.3.1)式的最小二乘估计:
,其中:
(48.3.1)2直线(48.3.1)2式通过点(
)。又由(*)式可知:minQ=l-
lyy(1-r) (48.3.5)由上式可知相关系数具有如下性质:
(1)|r|≤1,这是因为minQ≥0。
(2)如果r=±1,则与
完全线性相关:
由于minQ=Q(±
X,±
)=0,所以对i=1—n,y=
=
±
(x-X),n个点(xi,y),i=1—n完全位于回归直线上。
(3)如果r=0,则与
线性无关:
由于minQ=Q(,0)=l,所以对i=1—n,
≡
,不随x改变。回归直线
=
不能表达
与
之间或者存在某种非线性关系或者没有关系。
(4)|r|越大,与
线性相关越密切:
minQ越小,表示n个点(x,y1),i=1-—n越接近回归直线。
(5)r>0称为正相关;r<0称为负相关:
b>0,随x增大而增大,表示y随x增大有增大的趋势;b<0,
随x增大而减小,表示y随xi增大有减小的趋势。
样本观测值的相关系数r表示样本观测值]线性相关的密切程度以及正、负相关,这跟总体相关系数ρ对于总体Y与X所表示的概念是一样的。推断ρ
0并且用r作为它的估计值,是以|r|>r(n-2)为前提。只有在这种情形,(48.3.1)1式中的斜率
,才有必要用(48.3.1)式作为β、β以及(48.3.1)式的最小二乘估计。r(n-2)可以查“检验相关系数ρ=0的临界值(r)表”得到,n-2是自由度。相关分析的步骤如表48—1所示。
表48—1
可以使用SHARP-5002计算器的如下程序求得r与b、b以及ρ的置信度为1—α的置信区间:
(1)—→STAT
在上例中,r=0.87,u=1.96,n=30,算得ρ的95%置信区间是(0.7424,0.9367)。置信度1-α表示可靠性。u可以查“标准正态分布的双侧分位数(u)表”得到,一般常用u=1.96。
对于三元连续型总体(X,X,Y),如果研究工作需要以X1和X为(随机)自变量,而以Y为(随机)因变量,则类似于(48.3.1)式和(48.3.1)式,有:
=β0+βX+βX(48.3.7)
x=β0+βx+βx(48.3.7)1
xx-y立体空间中的平面(48.3.7)1式称为总体Y关于总体X、X的二元回归平面。它的最小二乘估计是:
x=b+bX+bX,其中:b=
-b
1—b2X2(48.3.7)2
以上求b1和b2的公式右端各量的足码1与2分别是总体X的取值x1与总体X2的取值x2的代号。这里假设行列式=ll-l
>0。计算
,
,
;l,l=l,l;l,l是使用总体
的样本观测值
=
。
线性相关的密切程度用下列复相关系数表示:
上式中的b和b是β1和β2的最小二乘估计值,由(48.3.7)式求出。r和r.1称为偏相关系数:r从r中消除了的影响;r从r中消除了
的影响。上述的“影响”来自
与
的(线性)相关系数r。
(编者:刘长安 审者:孙尽善)
-
- 秦穆公:羊皮换贤
- 秦穆公(?─前621),名任好,春秋时期秦国国君。自幼便胸怀大志,于公元前659年即位,他在位期间,内修国政,外图霸业,任人唯贤,使国势逐渐强大起来
-
- 晋文侯威胁最大的不是其弟“成师”,而是殇叔
- 周宣王的时候,晋国国君是晋穆公,穆公的太子叫仇,后来又生了个小儿子成师。《左传》和《史记》都记录说,当时就有个叫师服的贤大夫发表
-
- 晋文公为何杀介之推,还采取极端行动—放火烧山?
- 当介之推隐居绵山以后,晋文公放火烧山,实在让人有些想不通。即使是善意的目的,这种暴力性的行为也有一种不和谐之感。究其原因,晋文公
-
- 孟子为何被荀子所“非”?
- “非”带有否定、批判的意思,孟子为何被荀子所“非”呢?且让我们一探究竟。荀子把孔子当做圣人看待,从政治主张、学术思想,到道德情操
-
- 孟子为什么“出尔反尔”?
- 身为亚圣的孟子为什么”出尔反尔”呢?其中流传着这么个故事。战国时代,有七个较为强大的诸侯国家,叫做“战国七雄”。但是您可不要认
-
- 张仪连横
- 战国末期,秦惠王任用张仪做国相,用连横政策对付诸侯的合纵政策,取得巨大成功。张仪先后去魏国四次,终于劝说魏哀王尊秦王为帝。接着,张