CRM试用热线:400-600-7912
>>>

分类回归树技术

设随机向量尤=(■Y,,…,的协方差阵为X, …英Ap>0为Z的特征根,e,,…,e,为对应的标准正交化特征向

m,根据线性代数的知识,:!可分解为:

A,     0

I

0

(yx7e, ’…’

上式列出的;£的表达式是精确的,但实际中总希望公共 因子个数小于变个数,即m<p,当最后个特征根较小时, 通常是略去最后项,于是得到:

(3. I)

 

\/^T^

 

 

Z = AA^ + ^ ^ ( yA7ei

(3.2)

—般设A, 各…為又p为样本相关阵尺的特征根,相应 的标淮正交化特征向泣为

、,…人,设爪<尸,则因子载荷阵的估计义=(‘)即

“((3.3) 第三,因子旋转。为了使公共因子的含义淸晰,需要使每 个变量仅在一个公共因子上有较大载荷,而在其余因子上的载 荷较小。根据因子载荷矩阵的不唯一性,可对因子载荷矩阵实 行旋转,即用一个正交阵右乘A,这里我们采用方差最大正交 旋转。

经过旋转后,可以清晰地看出,每个因子只有少数几个指 标的因子载荷较大,据此可将所有指标按高载荷分为几类,对 每一类进行命名。

有时根据实际情况,还需要计算每个样本的公共因子得分, 这是一个估算值,这里只给出计算因子得分的估算公式。

P = A^R~’X        (3.4)

其中,为变觉的相关系数阵。

3.3.2分类回归树技术

3.3.2.1 基本含义

分类回归树(Classification and Regression Tree,CART)是越于统计理论的非参数识别技术,具苟非常强大的统计解析功 能,输人数据和预测数据可以逛不完整的,或者是紅杂的浮点 数运灯。数据处理后的结梁包含的规则明白易俺。