ImageVerifierCode 换一换
格式:PDF , 页数:58 ,大小:9.11MB ,
资源ID:3209667      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/3209667.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(Stata操作入门中文.pdf)为本站会员(b****1)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

Stata操作入门中文.pdf

1、第一讲 Stata操作入门第一节 概况 Stata最初由美国计算机资源中心(Computer Resource Center)研制,现在为Stata公司的产品,其最新版本为7.0 版。它操作灵活、简单、易学易用,是一个非常有特色的统计分析软件,现在已越来越受到人们的重视和欢迎,并且和SAS、SPSS一起,被称为新的三大权威统计软件。Stata 最为突出的特点是短小精悍、功能强大,其最新的7.0 版整个系统只有10M 左右,但已经包含了全部的统计分析、数据管理和绘图等功能,尤其是他的统计分析功能极为全面,比起1G 以上大小的 SAS 系统也毫不逊色。另外,由于Stata在分析时是将数据全部读入内

2、存,在计算全部完成后才和磁盘交换数据,因此运算速度极快。由于 Stata的用户群始终定位于专业统计分析人员,因此他的操作方式也别具一格,在Windows 席卷天下的时代,他一直坚持使用命令行程序操作方式,拒不推出菜单操作系统。但是,Stata的命令语句极为简洁明快,而且在统计分析命令的设置上又非常有条理,它将相同类型的统计模型均归在同一个命令族下,而不同命令族又可以使用相同功能的选项,这使得用户学习时极易上手。更为令人叹服的是,Stata语句在简洁的同时又拥有着极高的灵活性,用户可以充分发挥自己的聪明才智,熟练应用各种技巧,真正做到随心所欲。除了操作方式简洁外,Stata的用户接口在其他方面也

3、做得非常简洁,数据格式简单,分析结果输出简洁明快,易于阅读,这一切都使得Stata成为非常适合于进行统计教学的统计软件。Stata 的另一个特点是他的许多高级统计模块均是编程人员用其宏语言写成的程序文件(ADO 文件),这些文件可以自行修改、添加和下载。用户可随时到Stata 网站寻找并下载最新的升级文件。事实上,Stata的这一特点使得他始终处于统计分析方法发展的最前沿,用户几乎总是能很快找到最新统计算法的Stata程序版本,而这也使得Stata自身成了几大统计软件中升级最多、最频繁的一个。由于以上特点,Stata 已经在科研、教育领域得到了广泛应用,WHO 的研究人员现在也把Stata 作

4、为主要的统计分析工作软件。第二节 Stata操作入门一、Stata的界面图 1 即为 Stata 7.0启动后的界面,除了Windows 版本的软件都有的菜单栏、工具栏,状态栏等外,Stata的界面主要是由四个窗口构成,分述如下:1结果窗口位于界面右上部,软件运行中的所有信息,如所执行的命令、执行结果和出错信息等均在这里列出。窗口中会使用不同的颜色区分不同的文本,如白色表示命令,红色表示错误信息。2命令窗口位于结果窗口下方,相当于DOS 软件中的命令行,此处用于键入需要执行的命令,回车后即开始执行,相应的结果则会在结果窗口中显示出来。3命令回顾窗口即 review 窗口,位于界面左上方,所有执

5、行过的命令会依次在该窗口中列出,单击后命令即被自动拷贝到命令窗口中;如果需要重复执行,用鼠标双击相应的命令即可。4变量名窗口位于界面左下方,列出当前数据及中的所有变量名称。除以上四个默认打开的窗口外,在Stata 中还有数据编辑窗口、程序文件编辑窗口、帮助窗口、绘图窗口、Log 窗口等,如果需要使用,可以用Window 或 Help 菜单将其打开。二、数据的录入与储存 Stata为用户提供了简捷,但是非常完善的数据接口,熟悉它的用法是使用Stata的第一步,在Stata中读入数据可以有三种方式:直接从键盘输入、打开已有数据文件和拷贝、粘贴方式交互数据。(1)从键盘输入数据在 Stata中可以使

6、用命令行方式直接建立数据集,首先使用input 命令制定相应的变量名称,然后一次录入数据,最后使用end语句表明数据录入结束。例 1 在某实验中得到如下数据,请在Stata中建立数据集。观测数据:X 1 3 5 7 9,Y 2 4 6 8 10解:此处需要建立两个变量X、Y,分别录入相应数值,Stata 中的操作如下,其中划线部分为操作者输入部分。(2)用 Stata的数据编辑工具数据编辑 Stata 数据编辑器界面:此时进入了数据全屏幕编辑状态。图 3在第一列输入数据后,Stata第一列自动命名为var1;在第二列输入数据后,第二列自动命名为var2 依次类推。在输入数据后,双击纵格顶端的变

7、量名栏(如:Var1 或 Var2 处),可以更改变量名,并可以在label栏中注释变量名的含义,点击确认(如图4 所示)。仍沿用上例,双击观察值所在列顶端的变量名栏,更改变量名为x,并在 label 栏中注明“7 岁男童身高/cm”。数据输入完毕后,单击键确认所输数据,按关闭键即可退出编辑器。数据输入完毕后,单击认所输数据,按关闭键即可退出编辑器。(3)拷贝、粘贴方式交互数据 Stata的数据编辑窗口是一个简单的电子表格,可以使用拷贝、粘贴方式直接和EXCEL 等软件交互数据,在数据量不大时,这种方式操作极为方便。例 2 现在 EXCEL 中已录入了三个变量,共五条记录,格式见下图,请将数据

8、读入Stata。解:首先将 EXCEL 中的 A1C6 全部 18 个单元格选中,选择菜单编辑 复制,将数据拷贝到剪贴板上;然后切换到Stata,选择菜单Window-Data Editor,打开数据编辑窗口;再选择 Edit-Paste,相应的数据就会被直接粘贴如数据编辑窗口中,并且变量名、记录数、变量格式等均会被自动正确设置,见图6 和图 7。(4)打开已有的数据文件 Stata能够直接打开的数据文件只能是自身专用格式或者以符号分隔的纯文本格式,后者第一行可以是变量名,分述如下:点击图标,然后选择路径和文件名,可以打开Stata专用格式的数据文件,并且扩展名为.dta。打开 Dta 数据文

9、件:该格式文件是Stata的专用格式数据文件,也使用 use命令即可打开,例如要打开数据文件“C:data1.dta”,则命令为:.use c:data1即扩展名可以省略,如果Stata中已经修改或者建立了数据集,则需要使用clear 选项清除原有数据,命令为:.use c:data1,clear读入文本格式数据:需要使用insheet 命令实现,例如需要读入已建立好的文本格式数据文件“C:data1.txt”,则命令为:.insheet using c:data1.txt该命令会自动识别第一行是否为变量名,以及变量列间的分隔符是tab、逗号还是其他字符。如果Stata中已经修改或者建立了数据

10、集,则需要使用clear 选项清除原有数据,命令为:.insheet using c:data1.txt,clear(5)数据文件的保存为了方便以后重复使用,输入 Stata的数据应存盘。Stata实际上只能将数据存为自身专用的数据格式或者纯文本格式,分述如下:点击图标,然后选择路径和文件名,点击。存为dta 格式:可以直接使用文件菜单,也可以使用save 命令操作,如欲将上面建立的数据文件存入“C:”中,文件名为Data1.dta,则命令为:.save c:data1file c:data1.dta saved该指令将在C 盘根目录建立一个名为“data1.dta”的 Stata数据文件,后

11、缀dta 可以在命令中省略,会被自动添加。该文件只能在Stata中用 use命令打开。如所指定的文件已经存在,则该命令将给出如下信息:file c:data1.dta already exists,告诉用户在该目标盘及子目录中已有相同的文件名存在。如欲覆盖已有文件,则加选择项replace。命令及结果如下:.save c:data1.dta,replace file c:data1.dta saved 3存为文本格式:需要使用outsheet 命令实现,该命令的基本格式如下。outsheet 变量名列表 using 文件名,nonames replace 其中变量名列表如果省略,则将全部变量存

12、入指定文件。如欲将上面建立的数据文件存入文本文件“C:data1.txt”中,则命令为:.outsheet using c:data1.txt此时建立的文件data1.txt 第一行为变量名,第2-6 行为变量值。变量列间用Tab 键分隔。如果不希望在第一行存储变量名,则可以使用nonames选项。如果文件已经存在,则需要使用replace 选项。第二讲 统计描述入门例 调查某市 1998 年 110 名 19 岁男性青年的身高/cm资料如下,计算均数、标准差、中位数、百分位数和频数表。Stata 数据结构(读者可以把数据直接粘贴到Stata的 Edit 窗口)在介绍统计分析命令之前,先介绍打

13、开一个保存统计分析结果的文件操作:计算样本的均数、标准差、最大值和最小值命令 1:su 变量名(可以多个变量:即:su 变量名 1 变量名 2 变量名 m)命令 2:su 变量名,d(可以多个变量:即:su 变量名 1 变量名 2 变量名 m,d)本例命令su x本例命令.su x,d 计算百分位数还可以用专用命令centile。centile 变量名(可以多个变量),centile(要计算的百分位数)例如计算P2.5,P97.5等centile 变量名,centile(2.5 97.5)本例计算 P2.5,P97.5,P50,P25,P75。本例命令.centile x,centile(2.

14、5 25 50 75 97.5)制作频数表,组距为2,从 164 开始,gen f=int(x-164)/2)*2+164 其中 int()表示取整数 tab f 频数汇总和频率计算作频数图命令 graph 变量,bin(#)norm 其中#表示频数图的组数;norm 表示画一条相应的正态曲线(可以不要)本例命令为graph x,bin(8)norm为了使坐标更清楚地在图上显示,可以输入下列命令 graph x,bin(8)xlabel norm ylabel图形可以从Stata中复制到 word 中来,操作如下:然后到 Word 中粘贴和编辑,便可以得到所需要的图形。计算几何均数可以用mea

15、ns 变量名(可以多个变量:即:means 变量 1 变量 m)means x Arithmetic(算术均数)Geometric(几何均数)调和均数(Harmonic)作 Pie 图描述构成比:每一类的频数用一个变量表示,命令:graph 各类频数变量名,pie 例:下列有2 个地区的血型频数分布数据,请用Pie 描述:第 1 地区血型构成比的Pie 图的命令和图 graph a b o ab if area=1,pie注意逻辑表达式中if area=1 是两个等号。第 2 地区血型构成比的Pie 图的命令和图 graph a b o ab if area=2,pie两个地区合并后的血型构成

16、比的Pie 图的命令和图正态性检验.swilk 变量名 1 变量名 2 变量名 m在上例中的110 名 19 岁男性青年的身高资料正态性检验如下:.swilk x无效假设 H0:资料服从正态分布备选假设 H1:资料不服从正态分布设 =0.05(样本比较大时,取 0.05,样本很小时,取 0.1)因此可以认为资料近似服从正态分布。计量资料统计描述的主要策略小结若资料近似正态分布,则用均数 标准差描述若资料偏态分布(频数图明显不对称),则用中位数(P25P75)描述P25P75称为四分位数范围(Inter-quartile range,IQR)但在一些临床试验资料统计分析时,往往给出样本均数、标准差、中位数、四分位数范围、最小值和最大值,但对结果的主要解释按照上述策略进行进行。第三讲 概率分布和抽样分布概率分布累积函数 1.标准正态分布累积函数norm(X)2.t 分布右侧累积函数ttail(df,X),其中 df 是自由度 3.2分布累积函数chi2(df,X),其中 df 是自由度 4.2分布右侧累积函数chi2tail(df,X),其中 df 是自由度 5.F 分布累积函数F(df1

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1