重磅！Stata 18正式发布！_北京友万信息科技有限公司

重磅！Stata 18正式发布！

2023-04-26 浏览次数：398次

2023年4月25日，StataCorp LLC 正式宣布 Stata 18 上线啦！或许各位老师、Stata 爱好者们还没把 Stata 17 捂热，StataCorp LLC 就地推出了Stata 18。工欲善其事，必先利其器。StataCorp LLC 正如“有匪君子，如切如磋，如琢如磨”，将 Stata 这一利器打造得日良与强大。Stata中国授权经销商及合作伙伴友万科技联合山东大学陈强教授团队，**时间为大家总结了此次发布的**功能亮点，帮助大家快速了解Stata 18 强大的新功能！

Stata之所以能成为较流行的计量经济学软件，根本原因在于Stata十分贴近计量经济学的实践应用。此次Stata 18的全新升级，一如既往地切中了时下实证研究的热点与痛点。总结起来，主要有以下**方面，下面将分别介绍：

1、异质性DID
2、中介效应
3、多向聚类标准误
4、野聚类自助法
5、工具变量分位数回归
6、贝叶斯模型平均
7、描述性统计制表
8、数据编辑器的改进
9、Do文件编辑器的改进
10、全新的画图风格

异质性DID

双重差分法(DID)是较常用的计量方法，近年来发展迅速，尤其在“交叠DID”(staggered DID)的领域。对于多期DID模型，若个体受到处理的初始时间不尽相同，且处理状态不可逆(irreversible treatment)，则称为“交叠DID”(staggered DID)。传统的双向效应估计量(TWFE)及事件分析法(event study)均依赖于处理效应的同质性设。然而，对于交叠DID，若处理效应存在异质性(即处理效应随个体或时间而变)，则无论TWFE或事件分析法均存在偏差。为此，Stata 18推出了在异质性处理效应的情况下也成立的异质性DID新命令hdidregress与xthdidregress，其中前者适用于重复截面数据，而后者适用于面板数据。

中介效应

中介效应分析是常见的机制分析方法，用于考察因果效应通过何种渠道而产生。例如，若研究发现“锻炼”(exercise)可提升“身心健康”(well-being)，我们想进一步知道，此效应是否(部分地)通过改变“水平”(hormone level)这一中介(mediator)而起作用，参见下图。

为此，Stata 18推出了新命令mediate，可自动进行中介效应分析，并将总效应(total effect)分解为直接效应(direct effects)与间接效应(indirect effects)。

多向聚类标准误

统计推断是实证分析的核心之一，而正确的标准误则是统计推断的核心。针对线性回归模型(例如使用regress, areg或xtreg,fe估计的模型)，Stata 18提供了适用于更多场景的稳健标准误。例如，面板模型传统上使用以个体为聚类变量的聚类稳健标准误。然而，面板数据的聚类可能发生在多个维度，包括个体维度(同一个体不同期的扰动项存在自相关)与时间维度(同一时期不同个体的扰动项存在自相关)。Stata 18提供了估计“多向聚类标准误”(multi-way cluster standard errors)的方便选项。例如，使用选择项“vce(cluster clustvar1 clustvar2)”即可估计“双向聚类标准误”(two-way cluster standard errors)，而选择项“vce(cluster clustvar1 clustvar2 clustvar3)”则可提供在三个维度聚类的聚类标准误，以此类推。

野聚类自助法

在使用聚类稳健标准时，通常要求聚类数目较大，才能保证所估标准误为真实标准误的较好近似。然而，现实数据的聚类数目可能较小，而每个聚类内部的观测值也不均衡。此时，使用渐近理论计算的聚类标准误可能存在较大偏差，而“野聚类自助法”(wild cluster bootstrap)则可提供计算标准误的更优方法。所谓“野自助法”就是一种“残差自助法”(residual bootstrap)，即对残差进行自助抽样；而“聚类自助法”则意味着以聚类为单位进行自助抽样。为此，Stata 18推出了新命令wildbootstrap，可方便地估计线性模型的野聚类标准误，例如

. wildbootstrap regress y x1 x2

. wildbootstrap areg y x1 x2, absorb(x3)

. xtset id

. wildbootstrap regress y x1 x2

工具变量分位数回归

常见的均值回归仅考察解释变量如何影响被解释变量的均值；而分位数回归则可度量对被解释变量各分位数的影响，从而全面刻画对被解释变量条件分布的作用。但原有的Stata分位数回归命令qreg定所有解释变量均为外生。然而，内生变量在实证研究中很常见。为此，Stata 18推出了新命令ivqregress，可对分位数回归模型进行工具变量法的估计，并进行内生性检验(endogeneity test)，以及提供在弱工具变量下也成立的稳健置信区间(confidence intervals that are robust to weak instruments)。

贝叶斯模型平均

实证研究的一个基本问题是模型选择(model selection)。传统做法是通过信息准则等方法，选择一的较优模型。但我们依然可能选错模型，从而导致偏差。面对模型的不确定性(model uncertainty)，更稳健的做法可能是，同时估计多个模型，并通过贝叶斯原理评估每个模型的发生的概率。然后，以此概率为权重，对所有模型进行加权平均，即所谓“贝叶斯模型平均”(Bayesian model averaging，简记BMA)。为此，Stata 18推出了新命令bmaregress，可对线性回归模型自动进行BMA估计与预测。

描述性统计制表

实证论文的“Table 1”通常都是描述性统计(descriptive statistics)。Stata 18新推出了dtable命令，可方便地将连续变量与离散变量的统计特征制表。用户可选择汇报何种统计量，或根据离散变量的取值将数据分为若干子样本，并比较相应的统计量。用户还可定制表格的具体形式，并将其输出到Word，Excel, HTML, Markdown, PDF, LaTex, SMCL或文本文件。

数据编辑器的改进

Stata 18 对数据编辑器作了诸多方便用户的改进，这包括

●可固定的行与列 (pinnable rows and columns)。在使用数据编辑器翻看数据时，已固定的行或列(pinned rows or columns)并不会随之滚动。这使得察看与比较数据更为方便；例如，可固定表示ID的变量。

●调整字符串的显示格子 (resizable cell editor for string data)。在编辑字符串数据时，可通过调整显示格子，以展示更多字符串，而不至于被隐藏。

●截断文本的提示框 (tooltips for truncated text)。在显示格子中，若文本因太长而被截断，只要将鼠标放于格子上，即会弹出包含完整文本的提示框。

●支持比例宽度字体 (proportional-width font support)。这将有助于提高数据的可读性，并允许同时展示更多变量，而无须滚动。

●在列标题显示变量标签 (show variable labels in column header)。变量标签将直接在变量名之下展示，这将有助于察看变量名不够直观的数据。

●通过新的键盘快捷键隐藏或显示变量的取值标签 (new keyboard shortcut for hiding or showing value labels)。这将便于用户在显示数值(numeric values)与标签(labels)之间快捷地切换。

Do文件编辑器的改进

Stata 18对于Do文件编辑器做了进一步的改进，包括

●自动备份 (automatic backup)。以Do文件编辑器打开的所有文件都将周期性地自动存盘备份，以防止因意外关机而丢失程序。

●用户指定关键词的语法高亮 (syntax-highlight for user-defined keywords)。用户可以自行*对哪些关键词进行语法高亮显示，并选择高亮的颜色与字体(粗体或斜体)。

全新的画图风格

Stata 18带来了全新的画图风格。新的默认画图风格将包括许多用户渴望的如下特征：

●白色背景 (white background)

●带有亮色的更新调色板 (updated color palette with bright colors)

●y轴标签的水平展示 (horizontal y-axis labels)

●更宽的宽高比 (wider aspect ratio)

●某些图可实现图例的动态放置 (dynamic legend placement for certain graphs)

●其他更多特征

事实上，Stata 18 引入了四个新的画图风格，即 stcolor, stcolor_alt, stgcolor与stgcolor_alt。其中，stcolor 为默认风格，而其余风格为提供了对于图片宽度与图例放置的不同选择。

（版权申明：本文章为原创，转载请说明出处）

uonetech.b2b168.com/m/