第一范文网 - 专业文章范例文档资料分享平台

Sas学习笔记

来源:用户分享 时间:2025/6/9 23:12:46 本文由loading 分享 下载这篇文档手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xxxxxxx或QQ:xxxxxx 处理(尽可能给您提供完整文档),感谢您的支持与谅解。

PROC GCHART DATA=数据集;

VBAR|HBAR|PIE|STAR|BLOCK

/*垂直柱状图/水平柱状图/圆饼图/星形图/立体柱状图*/ 分类变量名列/选项;

/*DISCRET/*指定分类方式*/MIDPOINT=列举值/*指定分组中点*/ SUMVAR=变量名/*指定分析变量*/TYPE=FREQ|SUM|MEAN|PCT /*指定统计量(无SUMVAR时缺省为FREQ,否则为SUM )*/GROUP=变量名/*指定分组作图*/SUBGROUP=变量名/*指定柱内分组*/FILL=S(SOLID)|X(CROSS)/*设定饼图的花纹*/*/ LABEL ; 变量1= ‘label(标*签)’ ……;

/*控制表头显示,可使用起始中split=定义的方式美化表格*/ TITLE C=颜色 H=高度及单位 F=字体;

/*使用该语句控制表头显示可以最多有十个标注*/ FOOTNOTE C=颜色 H=高度及单位 F=字体;

RUN;

5:使用proc univariate、means、freq语句进行定量资料的统计描述

PROC UNIVARIATE DATA= 数据集名 options;

/*NOPRINT禁止统计报告在OUTPUT视窗中输出 PLOT 绘出茎叶图、箱式图和正态概率图FREQ 给出频数表 NORMAL 对变量进行正态性检验*/ VAR 变量名列 ;

BY 变量名列; /*排序*/ FREQ 变量名; WEIGHT 变量名; ID 变量名;

OUTPUT OUT= 数据集名

关键字= 新变量名列...

/*常用关键字有:基本统计量:N MEAN STD(标准差)CV(变异系数)SUM VAR(方差)RANG 百分位数描述: MIN P1 P5 P10 Q1 MEDIAN Q3 P90 P95 P99 MAX与假设检验有关的统计量有: STDMEAN(标准误) T */ pctlpts=百分位数, ... pctlpre=新变量名列; Run;

PROC MEANS [ DATA= 数据集名 选项 统计量关键字列表;

/*选项有:NOPRINT 禁止统计在OUTPUT视窗中输出 MAXDEC=n 给出列表输出的最大小数位数,缺省值为2*/ VAR 变量名列; BY 变量名列; CLASS 变量名列; FREQ 变量名; WEIGHT 变量名; ID 变量名列;

OUTPUT OUT= 数据集名 关键字= 新变量名列... ;

/*关键字有:基本统计量有: N MEAN STD(标准差)CV(变异系数)SUM VAR(方差)RANG MIN MAX;与假设检验有关的统计量有: STDERR(标准误) T PRT(与t对应的p值) LCLM(可信区间下限) UCLM(可信区间上限)*/ Run;

PROC FREQ data+;

TABLES 请求式/ 选项;

/* 常用选项有 ORDER=FREQ 按频数递减顺序排列 ORDER=DATA 按数据集中出现的顺序排列 ORDER=INTERNAL 按内部值排列(缺省) ORDER=FORMATTED 按外部格式值排列*/ WEIGHT 变量名; BY 变量名列; Run;

6:使用proc corr过程进行相关系数计算(相关关系散点图可以参照gplot语句)

PROC CORR DATA=数据集 OPTIONS;

/*PEARSON 计算皮尔逊相关系数(缺省值);SPEARMAN 计算斯皮尔曼等级相关系数;NOSIMPLE 不打印输出各变量的描述性统计量;NOPROB 省略检验统计量p-值;COV(COVARIANCE) 打印协方差矩阵;NOCCORR 储存时省略相关系数;OUTP=指定皮尔逊相关系数存储的数据集;OUTS= 指定斯皮尔曼相关系数存储的数据集*/ VAR 变量名列;

WITH 变量名列;/*计算with指定变量与var指定变量之间的相关系数*/ PARTIAL 变量名列; RUN;

7:使用proc reg过程进行回归分析

PROC REG DATA= 数据集名 OPTIONS;

/*SIMPLE 计算并打印各变量的基本描述性统计量;SXORR 打印各变量的相关行列式;NOPRINT不打印输出;OUTEST=数据集名 指定回归值输出的数据集;COVOUT=数据集名 将所估计的协方差阵存入数据集;OUTSSCP=数据集名 指定相关矩阵输出的数据集*/ VAR 变量名列; BY 变量名列; FREQ 变量名列;

MODEL 因变量=自变量/OPTIONS;

/*model语句的作用可分为以下四个方面:1.关于报表打印的选项NOPRINT不打印MODEL语句所界定的分析结果;ALL 打印MODEL语句所有分析结果*/

/*2.界定参数估计值的选项STB 打印标准化回归系数;COVB 输出估计值的协方差阵;VIF 输出方差膨胀因子;COLLIN 进行多元共线性分析*/

/*3.关于预测值、预测误差的选项P计算每一个观测值y的期望值及其标准误;R 在P选项的基础上对预测误差做进一步分析;CLI 输出单个预测值95﹪的置信区间;

CLM 输出预测值均值95﹪的置信区间;INFLUENCE 分析观测值对参数估计和模型预测值的影响*/

/*4.关于界定回归模型的选项SELECTION=none|forward|backward|stepwise|cp |rsquare|adjrsq 指定自动进行变量选择的方法;NOINT 规定回归模型中不包含截距项.*/

OUTPUT OUT=数据集名 关键字=新变量名列; RUN;

PROC GPLOT DATA=数据集 ; /*做回归图*/ PLOT 纵轴变量名*横轴变量名;

SYMBOL V=符号 C=颜色 I=none|rl|rq|rc 其他选项; RUN;

/*不加线 线性 二次 三次*/

搜索更多关于: Sas学习笔记 的文档
Sas学习笔记.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.diyifanwen.net/c0dp9g14eze35m4y30uxo_2.html(转载请注明文章来源)
热门推荐
Copyright © 2012-2023 第一范文网 版权所有 免责声明 | 联系我们
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:xxxxxx 邮箱:xxxxxx@qq.com
渝ICP备2023013149号
Top