|
VARCLUS过程的一般使用格式如下:- PROC VARCLUS <选项列表>;
- VAR 变量列表;
- SEED 变量列表;
- FREQ 变量;
- WEIGHT 变量;
- BY 变量列表;
- RUN;
复制代码 PROC VARCLUS语句后的主要控制选项有:控制输入、输出数据集的选项,控制聚类方法的选项,控制输出打印的选项等。
控制输入、输出数据集的选项 | 选项 | 意义 | DATA=SAS数据集 | 指定分析数据集,可为原始数据或TYPE =CORR、UCORR、COV、UCOR、SSCP或FACTOR类型的数据集 | OUTSTAT=SAS数据集 | 新建一个包含如下统计量的SAS数据集:存储均值、标准差、相关系数、类得分系数和聚类结构 | OUTTREE=SAS数据集 | 新建包含聚类过程的树状结构信息的数据集,供TREE过程调用 | MINC =N | 定义最小聚类个数 | MAXC=N | 定义最大聚类个数 | MAXEIGEN=N | 规定每一类中第二特征值所允许的最大值 | PERCENT=N | 指定类分量必须解释的方差百分比 | | | 控制聚类方法的选项 | 选项 | 意义 | CENTROID | 使用重心成分法聚类 | MAXITER= N | 规定在交替最小二乘法阶段中的最大迭代次数 | MAXSEARCH= N | 指定在搜索阶段最大迭代次数 | COV | 用协方差矩阵聚类 | HI | 要求在不同层次的类构成谱系聚类结构 | INITIAL= | 规定初始化类的方法,可选项有GROUP、INPUT、RANDOM、SEED | | | 控制输出打印的选项 | 选项 | 意义 | CORR | 打印相关系数矩阵 | SIMPLE | 打印均值和标准差 | SHORT | 不打印类结构、得分系数和类间相关矩阵 | TRACE | 列出在迭代过程中每个变量所归入的类 | SUMMARY | 只打印最后的汇总表 | CANDISC过程中使用的其他语句含义如下:
VAR语句——指定进行聚类分析的变量。
FREQ语句——指定频数变量。
WEIGHT语句——指定加权变量。
BY语句——指定分组变量。
|
|