设为首页收藏本站

EPS数据狗论坛

搜索
快捷导航
查看: 103|回复: 0

Stata基本功能及其函数实现

[复制链接]

18

主题

137

金钱

229

积分

入门用户

发表于 2019-6-14 14:44:46 | 显示全部楼层 |阅读模式

1 Stata基本描述
1.1主窗口
1.jpg
如图所示,Stata大致可以分为五个部分。
  最上面是菜单栏,或者成为工具栏,功能栏,包括file,Edit,Data,Graphics,Statistics,User,Window,Help八个主要菜单,其中每个菜单下又有新的菜单。
  左边是历史命令区,历史命令会在这里显示。
  中间最大的区域是结果窗口,显示执行Stata命令之后的结果。
  结果窗口下面的Command是命令窗口,在这里输入 。
  最右边是变量窗口和属性窗口,显示当前变量和属性。
  左下角显示当前路径。

1.2 数据编辑器
2.jpg
可以通过菜单栏Data->Data Editor->Data Editor打开数据编辑器,导入数据的方法有两种,第一种最简单粗暴,直接通过Excel复制粘贴过来,另外一种方式是File->Impot->spreadsheet(*xls;*xlsx)。

1.3 变量管理(Variables Manager)
3.jpg
可以通过Window->Variables Manager打开变量管理器,可以编辑变量名,标签,变量类型,格式等;


2 Stata基本命令
2.1 数据审视(describe)
2.1.1数据描述
  1. .describe[varlist] [, memory_options],可以查看变量的类型,显示格式,变量标签和变量值的标签。
复制代码

4.jpg
2.1.2数据列表
  1. .list [varlist] [if] [in] [, options],查看变量的具体数据。
复制代码

5.jpg
当结果太长,会以more的方式显示,如果关闭more分页显示,可以用set more off,这样就不会分页显示了,如果想要打开,set more on。
6.jpg
.list [varlist] [if] [in] [, options],中if 和in是条件控制,如查看1-5个r变量,可以 .list r in 1/5。
7.jpg
如果要查看r>5000的r值,可以 .list r if r>5000。
8.jpg
2.1.3 数据删除
  1. .drop [varlist][if],用该命令来删除数据。
复制代码

9.jpg
2.1.4 数据排序
  1. .sort varlist [in] [, stable],对数据进行升序排列,降序排列使用命令,.gsort -varlist [in] [, stable]
复制代码

如按s从小到大升序排序:
10.jpg
如果要按照降序排列,可以.gsort -s。
11.jpg


3 画图
3.1 直方图
  1. .histogram varname [if] [in] [weight] [, [continuous_opts |discrete_opts] options],直方图。
复制代码

比如想要画变量support的直方图,可以.histogram s。
12.jpg

3.2 散点图
  1. [twoway] scatter varlist [if] [in] [weight] [, options],散点图。
复制代码

如想要画变量r的散点图,,可以scatter r。
13.jpg
其中,如果想要在散点图上标注是哪个观测值,可以
.gen n=_n
.scatter r,mlable(n),
_n表示第n个观测值,mlable表示以n作为标签。
14.jpg

3.3 连线图
  1. [twoway]line varlist [if] [in] [, options]
复制代码

通过line可以画连线图,如要画x与y之间的折线图
line y x:
15.jpg

3.4 阴影图
2.png
如要画x和y的阴影图,输入命令:
twoway area y x
16.jpg


4 统计分析
4.1 summarize
summarize [varlist] [if] [in] [weight] [, options]
  1. options           Description
  2. -----------------------------------------------------------
  3. Main
  4.   detail          display additional statistics
  5.   meanonly        suppress the display; calculate only the mean;
  6.                     programmer's option
  7.   format          use variable's display format
  8.   separator(#)    draw separator line after every # variables; default is
  9.                     separator(5)
复制代码

例如要统计s变量,则输入命令:
summarize s
17.jpg
su:
18.jpg
此结果显示所有变量的统计项,包括样本容量,均值,标准差,最小值和最大值。

4.2 tabulate 经验累积分布函数
  1. tabulate varname1 [varname2] [if] [in] [weight] [, options]
复制代码

.ta y
19.jpg
显示y变量频数,百分比和累积百分比。

4.3 generate 生成新变量
  1. generate [type] newvar[:lblname] =exp [if] [in] [, before(varname) | after(varname)]
复制代码


4.4 display 计算功能
display

例如 dispaly 2^2
结果为:4
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

客服中心
关闭
在线时间:
周一~周五
9:00-18:00
QQ群:
542280196
联系电话:
010-85786021-8014
在线咨询
客服中心

Powered by BFIT! X3.2© 2008-2018 BFIT Inc.

快速回复 返回顶部 返回列表
082 840 819 796