1. 基础描述统计量
summarize
(简写:sum
):计算均值、标准差、最小值、最大值、中位数等基本统计量。
summarize var1 var2 var3 // 分析多个变量
summarize var1 var2, detail // 显示更详细的统计量(包括分位数)
2. 分类变量分析
tabulate
(简写:tab
):生成频数表和比例。
tabulate var1 // 单变量频数表
tabulate var1 var2 // 交叉表(列联表)
tabulate var1 var2, row col chi2 // 显示行百分比、列百分比和卡方检验
bysort
:按分组变量计算统计量。
bysort group_var: summarize var1 // 按 group_var 分组计算 var1 的统计量
3. 图形展示
直方图:展示连续变量的分布。
histogram var1, normal // 带正态曲线的直方图
箱线图:显示数据的分布和异常值。
boxplot var1, over(group_var) // 按组绘制箱线图
散点图:展示两个变量的关系。
scatter var1 var2 // 散点图
4. 其他实用命令
xtile
:创建分位数分组(如四分位数)。
xtile income_quartile = income, nq(4) // 将 income 分为四个四分位数组
mdesc
:计算缺失值的描述性统计。
mdesc var1 var2 // 显示变量的缺失值情况
pwcorr
:计算变量间的相关系数。
pwcorr var1 var2 var3, sig star(0.05) // 显示 p 值和显著性标记
引用请注明出处:学研数据网www.xueyandata.com。会员每天最多下载1次,每月最多下载3次。任何形式的转售、代下行为将被封号,特此说明
评论0