admin 管理员组

文章数量: 1086019


2024年4月15日发(作者:如何自学it)

二元选择摸型

如果回归模型的解释变量中含有定性变量,那么可以用虚拟变量处理之。在实际经济问

题中,被解释变量也可能是定性变量。如通过一系列解释变量的观测值观察人们对某项动议

的态度,某件事情的成功和失败等。当被解释变量为定性变量时怎样建立模型呢?这就是要

介绍的二元选择模型或多元选择模型,统称离散选择模型。这里主要介绍Tobit〔线性概率〕

模型,Probit〔概率单位〕模型和Logit模型。

1.Tobit〔线性概率〕模型

Tobit模型的形式如下,

y

i

=

+

x

i

+ u

i

(1)

其中u

i

为随机误差项,x

i

为定量解释变量。y

i

为二元选择变量。此模型由James Tobin 1958

年提出,因此得名。如利息税、机动车的费改税问题等。设

1 〔假设是第一种选择〕

y

i

=

0 〔假设是第二种选择〕

1.2

Y

1.0

0.8

0.6

0.4

0.2

0.0

X

-0.2

330380

对y

i

取期望,

E(y

i

) =

+

x

i

(2)

下面研究y

i

的分布。因为y

i

只能取两个值,0和1,所以y

i

服从两点分布。把y

i

的分布记为,

P ( y

i

= 1) = p

i

P ( y

i

= 0) = 1 - p

i

那么

E(y

i

) = 1 (p

i

) + 0 (1 - p

i

) = p

i

(3)

由〔2〕和〔3〕式有

p

i

=

+

x

i

〔y

i

的样本值是0或1,而预测值是概率。〕 (4)

以p

i

= - 0.2 + 0.05 x

i

为例,说明x

i

每增加一个单位,那么采用第一种选择的概率增加

0.05。

现在分析Tobit模型误差的分布。由Tobit模型〔1〕有,

u

i

= y

i

-

-

x

i

=

1

x

i

, y

i

1

x

i

, y

i

0

E(u

i

) = (1-

-

x

i

) p

i

+ (-

-

x

i

) (1 - p

i

) = p

i

-

-

x

i

1

由〔4〕式,有

E(u

i

) = p

i

-

-

x

i

= 0

因为y

i

只能取0, 1两个值,所以,

E(u

i

2

) = (1-

-

x

i

)

2

p

i

+ (-

-

x

i

)

2

(1 - p

i

)

= (1-

-

x

i

)

2

(

+

x

i

) + (

+

x

i

)

2

(1 -

-

x

i

), 〔依据(4)式〕

= (1-

-

x

i

) (

+

x

i

) = p

i

(1 - p

i

) , 〔依据(4)式〕

= E(y

i

) [1- E(y

i

) ]

上两式说明,误差项的期望为零,方差具有异方差。当p

i

接近0或1时,u

i

具有较小的

方差,当p

i

接近1/2时,u

i

具有较大的方差。所以Tobit模型〔1〕回归系数的OLS估计量

具有无偏性和一致性,但不具有有效性。

假设用模型〔4〕进行预测,当预测值落在 [0,1] 区间之内〔即x

i

取值在[4, 24] 之内〕

时,那么没有什么问题;但当预测值落在[0,1] 区间之外时,那么会暴露出该模型的严重

缺点1〕。线性概率模型常写成如下形式,

图1

1,

+

x

i

 1

p

i

=

+

x

i

, 0 <

+

x

i

< 1 (5)

0,

+

x

i

 0

然而这样做是有问题的。假设预测某个事件发生的概率等于1,但是实际中该事件可能

根本不会发生。反之,预测某个事件发生的概率等于0,但是实际中该事件却可能发生了。

虽然估计过程是无偏的,但是由估计过程得出的预测结果却是有偏的。

x

i

所对应的所有预测值〔概率值〕都落在〔0,1〕之间。〔2〕同时对于所有的x

i

,当x

i

增加时,希望y

i

F(z

i

) 能满足这样的要求。采用的模型称作Probit模型。用正态分布的累积

概率作为Probit模型的预测概率。另外logistic满足这样的要求。采用logisticlogit模型。

1

0.8

0.6

1

0.8

0.6

0.4

0.2

0

0

-4-2024

0.4

0.2

累积正态概率分布曲线 logistic曲线

2


本文标签: 模型 变量 概率 选择 预测