1. 前言
在目前工作中,用stata清洗及分析数据,感觉很顺滑。无奈不少同学因为help文件里的英文望而却步。
带着学习和分享的目的,根据工作经验,给大家整理一些常用以及不太常用但很有用的命令,并对该命令的help文件进行有侧重的详解。
2. 命令及获取
save:保存stata数据,系统自带命令
3. 描述
save : 以filename为名存储stata数据。如果不写filename就以当前文件名存储。文件名可以不加.dta,默认为.dta文件。注意,如果文件名有空格,需要加双引号将文件名括起来。
stata15和14版本的数据格式相同(只要数据集的变量数在32767及以下)。stata/MP15版本支持32767个以上的变量,因此,如果变量数超过32767,则数据格式会有些不同。
因此,如果stata14版本要打开stata 15版本用save命令存储的数据,当变量数低于32767的数据,可以用stata 14版本直接打开。
save old:以filename为名存储更早版本(13,12,11)的数据。也就是,stata13/12/11版本的软件可以打开stata15版本用save old命令存储的数据。
4. 语法
*保存数据,save最短可以缩写成sa
save [filename] [, save_options]
*保存13,12,11版本的数据
saveold filename [, saveold_options]
[,]:中括号里的为额外选项命令,按需求添加,而添加选项记得加英文逗号,
filename(文件名):如果语法中只有文件名,则默认文件格式为.dta;如果文件名中有空格,记得用双引号""将该目录名字括起来。
5. 选项
save的选项:
nolabel: 不保存数据集中的值标签,但值标签名称和变量之间的关系依然存在。最短可缩写成nol。
replace: 替换现有的数据集。
all: 可以保存e(sample)。当进行了回归分析后,添加该选项进行保存数据,再打开数据时,可以直接使用predict进行回归。
orphans: 保存所有的值标签,即使那些没有赋给任何变量的值标签。最短可缩写成o。
emptyok: 即使没有观察值或者没有变量,依然进行保存。最短可缩写成empty。
save old的选项:
version(#): 指定保存的stata数据版本,#值范围是[11,14]。默认是version(13),即stata13版本。如果要用stata14版本打开的话,直接使用save就行。最短可缩写成v()。
replace:不保存数据集中的值标签。最短可缩写成nol。
all:可以保存e(sample)。当进行了回归分析后,添加该选项进行保存数据,再打开数据时,可以直接使用predict进行回归。
6. 举例
*以mydata为名保存数据
save mydata
*以mydata为名保存数据,并替换现有数据
save mydata,replace
save,replace
*以mydata2为名保存13版本的数据
saveold mydata2
*以mydata3为名保存12版本的数据
saveold mydata3,version(12)
7. 菜单
File > Save as...
文件>另存为
8. 存储的结果
无
9. 补充
saveold可以用于和其他用不同版本stata软件进行转换。
问题1:低版本的stata会出现变量标签太长无法保存的情况,需要先将变量标签改短,再进行saveold;
问题2:可能存在中文乱码的情况。