设为首页收藏本站

EPS数据狗论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 1911|回复: 0

SAS--DISCRIM过程进行判别分析

[复制链接]

4

主题

81

金钱

105

积分

入门用户

发表于 2018-9-25 14:37:49 | 显示全部楼层 |阅读模式
  1. PROC DISCRIM  <选项列表> ;
  2. CLASS       变量名;
  3. BY         变量列表;
  4. FREQ       变量名;
  5. ID         变量名;
  6. PRIORS      概率列表;
  7. TESTCLASS    变量名;
  8. TESTFREQ    变量名;
  9. TESTID      变量名;
  10. VAR       变量列表;
  11. WEIGHT    变量名;
  12. RUN;
复制代码

PROC DISCRIM语句后主要的控制选项分成三类:控制输入、输出数据集选项、控制判别分析的类型和规则的选项、指定非参数法的选项。
控制输入、输出数据集选项
选项意义
DATA=SAS数据集指定进行分析的数据集,可为一般SAS数据集或几种特殊结构的数据集(协方差矩阵、相关系数矩阵等)
TESTDATA=SAS数据集指定欲分类观测的一般SAS数据集。注意该数据集中定量变量的变量名必须与DATA语句指定的数据集中的变量名匹配。当指定TESTDATA选项时,TESTCLASS、TESTFREQ和TESTID语句可用。当采用TESTDATA时,输出数据集选项TESTOUT和TESTOUTD可用来产生检验数据集中观测的分类结果和组密度估计
OUT=SAS数据集生成一个包括输入数据、后验概率和每个观测通过重替换被分入的类等信息的输出数据集
OUTSTAT=SAS数据集生成一个包含均值、标准偏差、相关系数和判别统计量等统计量的输出数据集
OUTCROSS=SAS数据集生成一个包括来自DATA指定数据集的所有数据、后验概率和每个观测通过交叉确认被分入的类的输出SAS数据集
OUTD=SAS数据集生成一个包含输入数据和每一观测的组密度估计的输出SAS数据集
TESTOUT=SAS数据集生成一个包含来自TESTDATA指定数据集的所有数据、后验概率和每个观测被分入的类的输出SAS数据集
TESTOUTD=数据集名生成一个包含来自TESTDATA指定数据集的所有数据和对每一观测的组密度估计的输出SAS数据集
控制判别分析的类型和规则的选项
选项意义
METHOD=确定导出分类准则的方法,默认值为METHOD=NORMAL。当指定METHOD=NORMAL时,基于类别内服从多元正态分布,并导出线性或二次判别函数;当指定METHOD=NPAR时,采用非参数方法
POOL=确定广义平方距离的计算是以合并协方差阵还是组内协方差阵为基础。当POOL=YES时,采用合并协方差阵得出线性判别函数;当POOL=NO时,采用组内协方差阵得出二次判别函数;当METHOD=NORMAL时,POOL=TEST要求对组内协方差阵的齐性的似然比检验进行BARTLETT修正。默认值为POOL=  YES
SLPOOL= P当使用控制项POOL=TEST时,指定齐性检验的显著性水平。若POOL=TEST而SLPOOL=未指定,系统默认显著性水平为0.1
THRESHOLD= P指定分类中可以接受的最小后验概率P 值。若某观察样品归属于某一组的最大后验概率值小于此P  值,那么这个观察样品归入OTHER组(已知组以外的组)。系统默认P =0
ANOVA对各类的单个变量均值之间一元方差分析以此检验判别函数的判别效果
MANOVA要求对各类的多个变量的均值向量之间进行多元方差分析
LISTERR要求仅输出由后验概率产生错误分类的样品点相关信息
CROSSLISTERR要求以交叉表的形式输出实际类别与分类结果之间一致和不一致的信息
指定非参数法的选项
选项意义
K=数值为K最近邻规则指定一个K值。基于X的K个最近邻得到的信息将观测X分入一个组
R=数值为核密度估计指定一个半径R值(K=和R=不能同时设置)
KERNEL为估计组密度指定一个核密度,默认值为UNI,此选项与R=同时设置。可选项有BIW、EPA、NOR、TRI、UNI
METRIC=为平方距离的计算指定量度,可选项有DIAGONAL、FULL、IDENTITY
DISCRIM过程中使用的其他主要语句含义如下:

VAR语句——指定进行判别分析的变量子集,并建立关于此变量子集的判别函数。 PRIORS语句——指定先验概率,它有以下3种指定方法:

PRIORS EQUAL——表示各类先验概率相等,默认值。
PRIORS PROPORTIONAL——表示各类先验概率等于各类样品频率。
PRIORS A=P1 B=P2 C=P3——其中A、B和C是分类标志,P1、P2和P3是先验概率,且P1+P2+P3=1。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

客服中心
关闭
在线时间:
周一~周五
8:30-17:30
QQ群:
653541906
联系电话:
010-85786021-8017
在线咨询
客服中心

意见反馈|网站地图|手机版|小黑屋|EPS数据狗论坛 ( 京ICP备09019565号-3 )   

Powered by BFIT! X3.4

© 2008-2028 BFIT Inc.

快速回复 返回顶部 返回列表