Modelos de decisión binaria

Ejemplos:

1. Una institución financiera debe decidir si aprobar o desaprobar una solicitud de crédito. El funcionario encargado de aprobar los créditos dispone de la siguiente información del solicitante: valor de propiedades inmuebles, historia crediticia (pagó o nó préstamos previos), ingresos por trabajo, garantes (si o nó), edad, sexo, número de miembros del hogar, número de dependientes.
2. Una empresa de transportes debe decidir si debe comprar un nuevo vehículo. La empresa dispone de información sobre el valor del vehículo, kilometraje recorrido, kilómetros por galón, número máximo de pasajeros.
3. Un individuo debe decidir si trabaja o nó. Para ello dispone de información sobre el nivel de salarios de mercado, edad, sexo, nivel de educación, ingreso no laboral.

El problema

Como los ejemplos anteriores indican, el agente de decisión (la institución financiera, la empresa de transportes, el individuo)enfrenta dos elecciones alternativas (aprueba crédito o nó, compra nuevo vehículo o nó, trabaja o nó). El agente elige la alternativa que optimice su función objetivo (mayor beneficio, mayor rendimiento, mayor utilidad).

Formalizando el problema

Supongamos que el individuo n enfrenta dos opciones: i y j. Sea Uin el valor que la opción i tiene para el individuo n y Ujn el valor que la opción j tiene para el individuo n. Descompongamos el valor de cada opción en dos componentes: uno sistemático (denotado por Vin para la opción i y Vjn para la opción j) y otro aleatorio(denotado por e in para la opción i y e jn para la opción j), es decir:

Uin = Vin + e in

Ujn = Vjn + e jn

Definamos un vector de atributos xin (la información del solicitante disponible para la institución crediticia, la información sobre el nuevo vehículo, las características individuales del posible trabajador). Los componentes sistemáticos de los valores de las alternativas para cada individuo pueden re-escribirse como una función del vector de atributos:

Vin = V(xin)

Vjn = V(xjn)

Por simplicidad, se suele asumir linearidad en los parámetros:

Vin = b ’xin

Vjn = b ’xjn

Por otro lado, la probabilidad de elegir la alternativa i por el individuo n estará dada por:

Pn(i) = Pr(Uin > Ujn)

= Pr(Vin + e in > Vjn + e jn)

= Pr(e jn - e in < Vin - Vjn)

= Pr(e jn - e in < b ’(xin - xjn))

Imponiendo algún supuesto razonable a la distribución de la diferencia de los componentes aleatorios, podemos hallar una expresión (una fórmula explícita) que dependa de los vectores de atributos. Teniendo una expresión para Pn(i) que dependa solo de los vectores de atributos xin y xjn, se puede evaluar la probabilidad de que una alternativa sea elegida en base a sus atributos. Es decir, siguiendo los ejemplos anteriores, la institución crediticia dispone de un criterio estadístico para decidir si concede o nó un crédito, la empresa de transportes tiene una forma para decidir su compra, y el economista laboral puede modelar la decisión de participación del individuo n en el mercado laboral.

Modelos de elección binaria de uso común

Modelo Binario Probit

Bajo el supuesto de que e in y e jn están distribuidas normal con media 0 y varianzas s i2 y s j2 respectivamente, la diferencia e in - e jn estará distribuida normal con media 0 y varianza s 2 = s i2 + s j2 - 2s ij . Denótese F (.) la distribución normal cumulativa estandarizada. En este caso

Pn(i) =F (b ‘(xin - xjn)/ s )

Nótese que los parámetros b son identificados a una escala dada por s . Por convención se asume que s =1.

Modelo Binario Logit

Bajo el supuesto de que la diferencia e n = e in - e jn está distribuida logísticamente, es decir, con función de distribución

F(e n) = 1/(1+e-m e n), m > 0, -¥ < e n < ¥

y con función de densidad

f(e n) = m e-m e n/(1+e-m e n)2

la probabilidad de elegir la alternativa i estará dada por:

Pn(i) = Pr(Uin > Ujn)

= 1/(1 + e-m (Vin - Vjn))

Bajo el supuesto de linearidad en los parámetros:

Pn(i) = 1/(1 + e-m b ‘ (xin - xjn))

Dado que m no puede ser distinguido en la escala de b , se asume que m =1.

Modelo de probabilidad lineal

Bajo el supuesto de que la diferencia e n = e in - e jn está distribuida en forma uniforme en el intervalo [ -M, M] , la probabilidad de que la alternativa i sea elegida estará dada por

Pn(i) = Pr(Uin > Ujn)

= Pr(Vin + e in > Vjn + e jn)

= Pr(e jn - e in < Vin - Vjn)

= Pr(e n < Vin - Vjn)

= 0 si Vin - Vjn < -M

(Vin - Vjn + M)/(2M) si -M £ Vin - Vjn £ M

1 si Vin - Vjn > M

Asumiendo linearidad en los parámetros, la condición anterior se transforma en

0 si b ’(xin - xjn)< -M

Pn(i) =(b ’(xin - xjn)+ M)/(2M) si -M £ b ’(xin - xjn)£ M

1 si b ’(xin - xjn) > M

Como M determina la escala de Uin y Ujn, su elección es arbitraria. Por conveniencia se fija en M=1/2.


Referencias

Amemiya, Takeshi
Advanced Econometrics
Basil Blackwell. 1985.

Ben-Akiva, Moshe and Steven R. Lerman
Discrete Choice Analysis: Theory and Application to Travel Demand
The MIT Press. 1985

Greene, William H.
Econometric Analysis.
Macmillan Publishing Company. 1993.

Maddala, G. S.
Limited-Dependent and Qualitative Variables in Econometrics
Cambridge University Press. 1991.

Volver a la página Web de E. Paredes