admin 管理员组文章数量: 1086019
2024年4月15日发(作者:如何自学it)
二元选择摸型
如果回归模型的解释变量中含有定性变量,那么可以用虚拟变量处理之。在实际经济问
题中,被解释变量也可能是定性变量。如通过一系列解释变量的观测值观察人们对某项动议
的态度,某件事情的成功和失败等。当被解释变量为定性变量时怎样建立模型呢?这就是要
介绍的二元选择模型或多元选择模型,统称离散选择模型。这里主要介绍Tobit〔线性概率〕
模型,Probit〔概率单位〕模型和Logit模型。
1.Tobit〔线性概率〕模型
Tobit模型的形式如下,
y
i
=
+
x
i
+ u
i
(1)
其中u
i
为随机误差项,x
i
为定量解释变量。y
i
为二元选择变量。此模型由James Tobin 1958
年提出,因此得名。如利息税、机动车的费改税问题等。设
1 〔假设是第一种选择〕
y
i
=
0 〔假设是第二种选择〕
1.2
Y
1.0
0.8
0.6
0.4
0.2
0.0
X
-0.2
330380
对y
i
取期望,
E(y
i
) =
+
x
i
(2)
下面研究y
i
的分布。因为y
i
只能取两个值,0和1,所以y
i
服从两点分布。把y
i
的分布记为,
P ( y
i
= 1) = p
i
P ( y
i
= 0) = 1 - p
i
那么
E(y
i
) = 1 (p
i
) + 0 (1 - p
i
) = p
i
(3)
由〔2〕和〔3〕式有
p
i
=
+
x
i
〔y
i
的样本值是0或1,而预测值是概率。〕 (4)
以p
i
= - 0.2 + 0.05 x
i
为例,说明x
i
每增加一个单位,那么采用第一种选择的概率增加
0.05。
现在分析Tobit模型误差的分布。由Tobit模型〔1〕有,
u
i
= y
i
-
-
x
i
=
1
x
i
, y
i
1
x
i
, y
i
0
E(u
i
) = (1-
-
x
i
) p
i
+ (-
-
x
i
) (1 - p
i
) = p
i
-
-
x
i
1
由〔4〕式,有
E(u
i
) = p
i
-
-
x
i
= 0
因为y
i
只能取0, 1两个值,所以,
E(u
i
2
) = (1-
-
x
i
)
2
p
i
+ (-
-
x
i
)
2
(1 - p
i
)
= (1-
-
x
i
)
2
(
+
x
i
) + (
+
x
i
)
2
(1 -
-
x
i
), 〔依据(4)式〕
= (1-
-
x
i
) (
+
x
i
) = p
i
(1 - p
i
) , 〔依据(4)式〕
= E(y
i
) [1- E(y
i
) ]
上两式说明,误差项的期望为零,方差具有异方差。当p
i
接近0或1时,u
i
具有较小的
方差,当p
i
接近1/2时,u
i
具有较大的方差。所以Tobit模型〔1〕回归系数的OLS估计量
具有无偏性和一致性,但不具有有效性。
假设用模型〔4〕进行预测,当预测值落在 [0,1] 区间之内〔即x
i
取值在[4, 24] 之内〕
时,那么没有什么问题;但当预测值落在[0,1] 区间之外时,那么会暴露出该模型的严重
缺点1〕。线性概率模型常写成如下形式,
图1
1,
+
x
i
1
p
i
=
+
x
i
, 0 <
+
x
i
< 1 (5)
0,
+
x
i
0
然而这样做是有问题的。假设预测某个事件发生的概率等于1,但是实际中该事件可能
根本不会发生。反之,预测某个事件发生的概率等于0,但是实际中该事件却可能发生了。
虽然估计过程是无偏的,但是由估计过程得出的预测结果却是有偏的。
x
i
所对应的所有预测值〔概率值〕都落在〔0,1〕之间。〔2〕同时对于所有的x
i
,当x
i
增加时,希望y
i
F(z
i
) 能满足这样的要求。采用的模型称作Probit模型。用正态分布的累积
概率作为Probit模型的预测概率。另外logistic满足这样的要求。采用logisticlogit模型。
1
0.8
0.6
1
0.8
0.6
0.4
0.2
0
0
-4-2024
0.4
0.2
累积正态概率分布曲线 logistic曲线
2
版权声明:本文标题:二元选择模型 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://roclinux.cn/b/1713177953a622670.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论