admin 管理员组

文章数量: 1087139


2024年4月20日发(作者:preprocessing翻译)

Stata统计分析软件

Stata是一套完整的、集成的统计分析软件包,可以满足您用于数据分析、数据管理和

图形的所有需要,尤其是面板数据的处理。

功能概述:

数据管理

数据转换、匹配-合并、ODBC、XML、分组处理、追加文件、排序、行列转置和标注

等。

基础统计

汇总、列联表、相关、t检验、等方差检验、比例检验和置信区间等。

线性模型

回归、bootstrap、jackknife和稳健Huber/White/sandwich方差评估;工具变量

(instrumental variable);三阶段最小平方;约束;分位数回归;GLS等。

多层混合效应模型

连续、二元和计数结果、2-、3-和多因子随机intercepts和随机系数模型;交叉随机

效应;ML和REML估计;效应和拟合值的BLUPs;分层模型等。

二元,计数,和受限的因变量

Logistic,probit,tobit;Poisson和负二项式;条件,多项式,排序的,秩排序,和stereotype

logistic;多项式probit;零堆积和零截尾计数模型;selection模型;边际效应等。

面板数据/横截面时间序列

带稳健标准误差的随机和混合效应;线性混合模型,随机效应probit,GEE,随机和

混合效应Poisson,Arellano–Bond,和工具变量回归, AR(1) disturbances等。

广义线性模型(GLMs)

10个链接函数、用户定义链接、7种分布、ML和IRLS评估、9种方差评估和7种残

差等。

非参数方法

Wilcoxon–Mann–Whitney、Wilcoxon符号秩和Kruskal–Wallis检验;Spearman和Kendall

相关;Kolmogorov–Smirnov检验;精确二项式CIs等。

ANOVA/MANOVA

平衡和非平衡设计、因子、嵌套设计;重复测量等。

多元方法

因子分析;首要成分;旋转;多维排列; Procrustean分析;相关分析;biplot;系统

树图;用户可扩展分析等。

聚集分析

分层聚类;kmeans和kmedian非分层聚类;系统树图;停止规则;用户可扩展分析等。

重采样和仿真方法

bootstrapping,jackknife和蒙特卡罗模拟;permutation检验等。

模型检验和postestimation支持

Wald检验;LR检验;线性和非线性组合,检验和预测;边际效应;调整均值;Hausman

检验等。

图形

线条图、散点图、条状图、饼图、hi-lo图表、回归诊断图形、幸存图、非参数smoothers

和分布Q-Q图等。

调查方法

采样权重、多阶段设计;分层、poststratification;deff、均值、比例、比率、总数;汇

总表格;bootstrap、jackknife和基于线性化方差评估;回归、工具变量和probit等。

幸存分析

Kaplan–Meier 和 Nelson–Aalen评估;Cox回归(frailty);参数模型(frailty);hazard;

时间变异协方差;左和右删失;Weibull,指数和Gompertz分析等。

流行病学工具

比率标准化、病例对照、匹配病例对照、Mantel–Haenszel、代谢动力学、ROC分析和

ICD-9-CM等。

时间序列

ARIMA、 ARCH/GARCH、VAR、 VECM、相关图、周期图、white-noise检验、单

元根检验、Holt–Winters smoothers、Haver Analytics数据、旋转和递归估计等。

极大似然

用户自定义函数;NR、 DFP、 BFGS、 BHHH; OIM、OPG、robust、 bootstrap和

jackknife矩阵;Wald检验;调查数据;数值或分析衍生等。

转换和正态性检验

Box-Cox转换;能力值转换、Shapiro–Wilk 和 Shapiro–Francia检验等。

其它统计方法

样本大小和能力值、非线性回归、归因、逐步回归、统计和算术函数等。

编程语言

添加新的命令、命令脚本、if、while、命令分析、调试、菜单和对话框编程、标注和

控制语言等。

矩阵编程-Mata

交互式对话、大型开发项目、矩阵倒置、分解、特征值和特征向量、LAPACK engine、

真实和复杂数值、string矩阵、Stata数据集和矩阵之间的接口等。

Internet功能

安装新的命令、网络更新、网络文件共享和最新Stata新闻等。

Stata各版本区别:

Stata/SE, Stata/IC和Small Stata主要的区别在于每个版本能够分析的数据集大小。

Stata/MP是一个拥有并行处理能力的Stata/SE。

Stata/MP: 适合双核、多核、多处理器计算机的Stata版本

Stata/SE: 适合大数据集的Stata版本

Stata/IC: Stata标准版本

Small Stata: 小型的、Stata学生版本

Stata/MP:运行最快和处理数据集最大的Stata版本。它通过并发运行多处理器或内核

来加快运算速度。Stata/SE和Stata/MP允许数据集最多可达32,767个变量。观测值的

数量仅受您计算机内存大小的限制。Stata/SE和Stata/MP在计算机内存大小足够的情

况下允许最大11,000 x 11,000维矩阵。相关的是Stata/SE和Stata/MP能够拟合带有更

多的自变量(最多10,998)的模型。

Stata/IC允许多达2,047个变量的数据集。观测值的数量仅受您计算机内存大小的限制。

Stata/IC能够在一个模型中最多有798个右手边(right-hand-side)变量。

Small Stata限制能分析的数据集最多为99个变量并带有接近1,000观测值。Small Stata

最多能在一个模型中有38个右手边(right-hand-side)变量。

功能比较

是否兼是否支

最大变量最大右手最大观最大矩

容64位持并行

数 边变量数 测值数 阵大小

系统? 处理?

32,767 10,998

无限*

11,000

是 是

版本 平台

Windows,

Macintosh或

Unix

Windows,

Macintosh或

Unix

Windows,

Macintosh或

Unix

Stata/MP

Stata/SE 32,767 10,998

无限*

11,000

是 否

Stata/IC 2,047 798

无限*

800

是 否

Small Stata 99 39 1,000 40

否 否

Windows 或

Macintosh

*最大观测值数仅受可使用的内存大小限制


本文标签: 数据 分析 检验 模型 回归