PONTIFICIA UNIVERSIDAD CATÓLICA DEL PERÚ
ESCUELA DE GRADUADOS
ESTIMACIÓN BAYESIANA DE EFECTOS DE RED: EL
MODELO LOGIT MIXTO
TESIS PARA OPTAR POR EL GRADO DE MAGISTER EN
ESTADÍSTICA
Presentado por:
Paulo Roberto Chahuara Vargas
Asesor: Cristian Luis Bayes Rodriguez
Miembros del jurado:
Dr. Oscar Edgardo Millones Destefano
Dr. Cristian Luis Bayes Rodriguez
Dr. Luis Hilmer Valdivieso Serrano
Lima, Julio 2017
Dedicatoria
A mi familia y a la leve piedad del tiempo.
ii
Agradecimentos
A mi asesor, el Dr. Cristian Bayes, por su valiosa gúıa y consejos durante el proceso de
este trabajo.
Al Dr. Valdivieso y el Dr. Millones por sus imprescindibles sugerencias.
También quisiera expresar mi agradecimiento a los profesores de la Maestŕıa de Estad́ıstica
de la Pontificia Universidad Católica del Perú (PUCP): Valdivieso, Bayes, Flores, Tarazona,
Veliz, Giancarlo, Millones y Camiz, quienes con sus enseñanzas y su buena disposición han
contribuido en mi proceso continuo de formación, no solo a nivel del aprendizaje técnico, sino
también como persona. Mi más profundo respeto y admiración hacia ustedes.
iii
Resumen
Los efectos o externalidades de red son factores que pueden condicionar las decisiones
de contratación de los consumidores en favor de empresas ya establecidas y encontra de los
nuevos competidores, pudiendo limitar la competencia efectiva y potencial de los mercados,
en especial, en aquellas industrias donde el número de empresas es bajo y la entrada de
nuevos competidores es poco frecuente. Por ello, es importante verificar su existencia y la
magnitud de sus efectos sobre las decisiones de compra de los consumidores con el objetivo
de justificar o establecer medidas que impulsen una competencia más equilibrada entre las
empresas. Además, teniendo en consideración que los consumidores pueden tener cierto grado
de heterogeneidad en sus comportamientos de adquisición, también resulta relevante estudiar
el grado de diferenciación de los efectos de red entre los consumidores a fin de mejorar las
poĺıticas que fomenten la competencia.
Este trabajo tiene por objetivo estimar un modelo logit mixto bajo el enfoque de la infe-
rencia bayesiana, para estudiar emṕıricamente la existencia y heterogeneidad de los efectos
de red sobre las decisiones de contratación de los consumidores en la industria de telefońıa
móvil peruana. El análisis se hace con base a una muestra que combina información de la
Encuetas Residencial de Servicios de Telecomunicaciones (ERESTEL) del año 2015 e infor-
mación de las empresas operadoras del servicio de telefońıa móvil.
Los resultados de las estimaciones realizadas sugieren que los efectos de red tendŕıan
un condicionamiento importante sobre las decisiones de contración del servicio de telefońıa
móvil, además de presentar un grado de heterogeneidad estad́ısticamente significativo en la
magnitud de sus efectos.
Palabras clave: modelo logit mixto, inferencia bayesiana, efectos de red.
iv
Índice general
Índice de figuras VI
Índice de cuadros VII
1. Introducción 1
1.1. Consideraciones Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3. Organización del Trabajo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2. Modelos de Elección Discreta 5
2.1. Utilidad y regla de comportamiento . . . . . . . . . . . . . . . . . . . . . . . 5
2.2. Derivación de las probabilidades de elección . . . . . . . . . . . . . . . . . . . 6
3. Modelo Logit Estándar 7
3.1. Especificando una función densidad para el término de error . . . . . . . . . . 7
3.2. Probabilidades de elección . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
4. Modelo Logit Mixto (MLX) 10
4.1. Especificación del Comportamiento . . . . . . . . . . . . . . . . . . . . . . . . 10
4.2. Probabilidades de elección . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.3. Aproximación Bayesiana para el MLX . . . . . . . . . . . . . . . . . . . . . . 11
5. Aplicación 17
5.1. Base de datos y medición de las variables de investigación . . . . . . . . . . . 17
5.2. Resultados de la investigación . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
6. Conclusiones 25
6.1. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
6.2. Sugerencias para investigaciones futuras . . . . . . . . . . . . . . . . . . . . . 26
A. Código 28
Bibliograf́ıa 31
v
Índice de figuras
5.1. Distribución de βCNn en la muestra . . . . . . . . . . . . . . . . . . . . . . . . 21
5.2. Distribución de βPn en la muestra . . . . . . . . . . . . . . . . . . . . . . . . . 22
5.3. Distribución de las correlaciones del vector de medias b en la muestra simulada 22
5.4. Distribución de las correlaciones de las desviaciones estándar de la matŕız de
covarianzas W en la muestra simulada . . . . . . . . . . . . . . . . . . . . . . 23
5.5. Distribución de la cadena del vector de medias b en la muestra simulada . . . 23
5.6. Distribución de la cadena de las desviaciones estándar de la matŕız de cova-
rianzas W en la muestra simulada . . . . . . . . . . . . . . . . . . . . . . . . 24
vi
Índice de cuadros
5.1. Medición de las Variables introducidas en el Modelo . . . . . . . . . . . . . . 18
5.2. Resultados de la Estimación . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
vii
Caṕıtulo 1
Introducción
1.1. Consideraciones Preliminares
Los efectos o externalidades de red pueden definirse como aquellos efectos que hacen que
el valor que obtiene una persona por consumir un producto, o hacer uso de un servicio, de-
penda no solo de la utilidad del producto o servición en śı mismo (valor intŕınsico), sino del
número de individuos que lo consumen o utilizan (valor de sincronización). Alternativamente,
se dice que las preferencias de los consumidores muestran externalidades de red si la utilidad
de cada consumidor se eleva cuando el número total de consumidores se incrementa (Farrell
y Klemperer, 2007; Shy, 2001). Por ejemplo, el servicio de telefońıa móvil ofrecido por una
empresa operadora resultará más útil o beneficioso para una persona a medida que esta com-
pañia tenga más clientes, ya que de este modo, el individuo no solo podrá comunicarse con
un número de usuarios mayor, sino que esta comunicación puede resultar menos costosa para
el consumidor: una mayor base de suscriptores en una compañia móvil disminuye los costos
unitarios de la empresa, además de permitirle menores costos relacionados a la interconexión
de llamadas que terminan en las redes de otras compañias móviles, lo cual se traduce en
ofertas comerciales más atractivas.
Los efectos de red pueden condicionar de forma importante la decisión del consumidor
para elegir al provedor de un bien o servicio, pues la presencia de externalidades de red
implica que en los compradores emerjan deseos de afinidad con el resto de consumidores, y,
en consecuencia, las personas tomarán sus decisiones de elección de proveedor condiciona-
dos por la aspiración de ser compatibles con lo que ya han elegido la mayoŕıa de usuarios
en el mercado, o en algunos casos con las eleccions ya realizadas por los integrantes de su
red social (familiares, amigos, compañeros o colegas). Esto genera una situación eficas para
que las empresas establezcan relaciones con sus consumidores encaminadas a una muy larga
duración (e.g. Czajkowski y Sobolewski, 2015; Maicas et al., 2009, Ocoña et al., 2009 y 2010,
Birke y Swann, 2006, Corrocher y Zirulia, 2009, Maicas y Sese, 2011).
Si bien los efectos de red pueden resultar beneficiosos para las firmas, su presencia puede
representar un desequilibrio para la competencia entre empresas. Esto es particularmente
sustancial, en las industrias donde el número de competidores es limitado y la oportunidad
que aparescan nuevas empresas que reten a las compañias establecidas es poco frecuente.
Bajo este contexto, la oportunidad de que el consumidor cuente con más opciones de provee-
1
CAPÍTULO 1. INTRODUCCIÓN 2
dores en el mercado puede perderse ya que las externalidades de red se vuelven una ventaja
sostenible para las compañias con más tiempo o participación en el mercado a la hora com-
petir por atraer o retener clientes frente a las nuevas empresas retadoras o de menor cuota
en la industria (Fu, 2004). Como resultado, el mercado no puede desconcentrase de las em-
presas ya establecidas y termina o continua en manos de pocos proveedores, degradándose la
competencia (Farrell y Klemperer, 2007; Katz y Shapiro, 1985 y 1994). Ello les permite a las
compañ́ıas fijar precios que resultan superiores a los precios de un mercado sin externalidades
de red, limitando -por los altos precios- que más personas puedan hacer uso del bien o servicio
y disminuyendo el excedente del consumidor (la diferencia entre lo que está dispuesto a pagar
como máximo un cliente y lo que realmente termina pagando). Además, dada la fragilidad
o ausencia de competencia, estas pocas empresas tienen el incentivo de fijar la calidad del
producto en un nivel que no es óptimo para la sociedad e inclusive darse el lujo de operar con
costos altos, generando una industria ineficiente. En suma, una reducción del bienestar social.
Por lo expuesto, existe un importante interés y preocupación sobre el rol de las exter-
nalidades de red de parte de las instituciones públicas encargadas de diseñar y establecer
las poĺıticas de competencia y regulación que arbitrarán el juego competitivo de los merca-
dos. En esta ĺınea, el desarrollo e implementación eficaz de tales poĺıticas requiere no solo
un análisis que defina e identifique para cada industria la manera en que los efectos de red
se manifiestan y operan, sino que también cuantifique su magnitud y distribución entre los
agentes económicos. Sin embargo, no son muchos los estudios de naturaleza emṕırica que
analizan la relevancia de las externalidades de red sobre la elección de proveedor en los con-
sumidores. Particularmente, se han encontrado estudios de esta ı́ndole a nivel de Estados
Unidos, Europa o Aśıa. Lo que es más, dentro de este grupo de investigaciones, parte de la
perspectiva adoptada ha sido cuantificar los efectos de red a nivel promedio o agregado (Ka-
racuka et al., 2013; Maicas et al., 2010; Doganoglu y Grzybowski, 2007; Birke y Swann, 2006;
Kim y Kwon, 2003), obviando que puede existir un grado de diferenciación en el comporta-
miento de cada consumidor y que estas heterogeneidades podŕıan influir sobre la medición
de las externalidades de red, lo cual convierte al estudio de estos elementos restrictivos de la
competencia en un tema importante para los hacederos de poĺıticas públicas y privadas, los
agentes económicos y la comunidad cient́ıfica.
La presente investigación tiene como finalidad utilizar un modelo estad́ıstico para estimar
y analizar la relevancia y heterogeneidad de los efectos de red sobre la elección de proveedor
que realizan los consumidores. El trabajo toma como ámbito de aplicación la industria de
telefońıa móvil peruana debido a que, en primer lugar, reúne las caracteŕısticas de ser una
industria con pocas empresas compitiendo y en donde la mayoria de clientes está concen-
trada en una operadora, lo que incrementa las posibilidades del daño que pueden tener las
externalidades de red sobre la competencia. En segundo lugar, es un sector que tiene una
importancia fundamental en el bienestar social del páıs (e.g. Beuermann et. al., 2012). En
tercer lugar, tiene instituciones públicas tales como el Ministerio de Transporte y Comuni-
caciones (MTC) y el Organismo Supervisor de la Inversión Privada en Telecomunicaciones
CAPÍTULO 1. INTRODUCCIÓN 3
(OSIPTEL) especialmente interesados en el desarrollo del sector. Por ejemplo, el OSIPTEL
es la autoridad regulatoria y en los últimos años ha estado aplicando diversas poĺıticas que
han buscado mejorar la competencia efectiva entre las empresas (e.g., cargos de terminación
móvil diferenciados). En esta ĺınea, una cuestión que siempre ha estado presente es si unos
cargos (precios) de terminación de llamadas elevados pueden ser utilizados por los operadores
ya establecidos para expulsar del mercado a nuevos retadores, situación que se ve reforzada
por las externalidades de red. Aśı, cuando las llamadas que terminan en la red de otro ope-
rador resultan más caras que las llamadas que terminan en la misma red del operador, la red
con más suscriptores se vuelve más atractiva para los usuarios, ya que si se suscriben a esta
red una mayor proporción de sus llamadas serán de la misma red y, por tanto, incurrirán en
un menor costo de comunicación. Por el contrario, ser cliente de una red pequeña supone un
costo para los usuarios porque reciben un menor numero de llamadas, además de incurrir en
mayores gastos por comunicación, ya que la mayoŕıa de sus llamadas terminarán en la red
del operador más grande. Por último, a diferencia de otras industrias reguladas en el Perú
(saneamiento, electricidad, gas natural o transporte), los usuarios de telefońıa móvil tienen
la facilidad técnica o legal de elegir con qué compañ́ıa contratar su servicio.
Para contrastar lo señalado en el párrafo anterior, se dispone de una base de datos que
combina información sobre los atributos de las diferentes empresas operadoras de telefońıa
móvil con información sobre las decisiones de contratación de usuarios del servicio de tele-
fońıa móvil. La metodoloǵıa empleada en la presente tesis sigue la adoptada por el grupo
pequeño de investigaciones que estudiaron la magnitud y heterogeneidad de los efectos de
red a nivel individual (Czajkowski y Sobolewski, 2015; Sobolewski y Czajkowski, 2012; Mai-
cas et al., 2009; Polo y Sesé, 2009). Dicha metodoloǵıa, se basa en la utilización del modelo
logit mixto estimado bajo inferencia bayesiana. Esto debido a las ventajas del procedimiento
bayesiano frente a la estimación clásica. Por ejemplo, el procedimiento bayesiano no requie-
re la maximización de una función de verosimilitud, a diferencia de la inferencia clásica, lo
que expone a la estimación clásica a problemas de convergencia por valores iniciales pobres,
optimos locales o problemas de curvaturas de la función de verosimilitud que pueden derivar
en resultados engañosos (Train, 2009; Balcombe et al., 2009).
1.2. Objetivos
A partir de lo señalado en la sección anterior, el presente trabajo tiene el objetivo general
de estimar el modelo logit mixto bajo el enfoque de la inferencia bayesiana, para evaluar la
existencia y heterogeneidad de los efectos o externalidades de red sobre la elección de pro-
veedor que realizan los consumidores en la industria peruana de servicio de telefońıa móvil.
Los objetivos espećıficos de la tesis son los siguientes:
Estudiar el modelo de elección discreta logit mixto bajo inferencia bayesiana.
Estimar la influencia de los efectos de red sobre las decisiones de los consumidores para
elegir un operador de telefońıa móvil.
CAPÍTULO 1. INTRODUCCIÓN 4
Evaluar si esta influencia presenta una heterogeneidad importante entre los consumi-
dores.
Evaluar si estos efectos son estad́ısticamente significativos.
1.3. Organización del Trabajo
En el Caṕıtulo 2, se presenta el marco general de los modelos de elección bajo el enfoque
de la teoŕıa de la utilidad aleatoria. Luego, en el Caṕıtulo 3 se muestra la versión básica del
modelo logit mixto, el modelo logit estándar, para seguidamente en el Caṕıtulo 4 centrar-
se concretamente en el modelo logit mixto y su estimación bajo el enfoque de la inferencia
bayesiana. Despues, en el Caṕıtulo 5 se utiliza el modelo logit mixto para obtener el efecto
estimado de las externalidades de red sobre el proceso de elección de compañ́ıa de telefońıa
móvil que el consumidor peruano realiza, y se estudia la heterogeneidad de dichos efectos. Fi-
nalmente, en el Caṕıtulo 6 se expone las conclusiones obtenidas del trabajo. Adicionalmente,
en el anexo de la tesis, se presenta el código que fue programado en el software estad́ıstico R
para realizar la estimación (Apéndice A).
Caṕıtulo 2
Modelos de Elección Discreta
De acuerdo a los trabajos previos sobre la estimación de efectos de red, el punto de parti-
da de la estimación son los modelos de elección discreta (Thurstone, 1927; Marscchak, 1960;
McFadden, 1974). Dichos modelos se derivan generalmente bajo el enfoque de la utilidad
aleatoria, cuyo supuesto angular es la maximización de la utilidad en el comportamiento del
tomador de decisiones. Bajo este enfoque cada alternativa u opción del conjunto de elección
le reporta al decisor un nivel de utilidad. La utilidad es el beneficio o bienestar percibido
de elegir una alternativa del conjunto de elección, y el decisor se comporta de forma tal que
escoje la alternativa que le reporta el mayor nivel de utilidad.
A continuación se describe el modelo de elección discreta desde la optica de la teoŕıa de
la utilidad aleatoria. Es importante señalar que esta sección se basa en gran medida en Train
(2009).
2.1. Utilidad y regla de comportamiento
Se asume que una persona n = 1, ..., N , enfrenta en cada peŕıodo t = 1, ..., T , la decisión
de elegir un operador de telefońıa móvil j = 1, ..., J . En cada situación de elección t, la per-
sona n asocia a cada alternativa j cierto nivel de utilidad denotado como Unjt ∀j, t. La regla
de comportamiento, en base al enfoque de la utilidad aleatoria, es que el decisor eligirá la
alternativa que le brinda el máximo nivel de bienestar o utilidad en el peŕıodo de decisión t.
Esto es, elegir la alternativa ynt, si y sólo si: Unyntt > Unjt, ∀j 6= ynt.
Sin embargo, desde el punto de vista del investigador, no es posible observar la utilidad
del decisor en cada situación de elección. El investigador solo puede observar un vector 1×K
no estócastico de atributos que describen a la empresa operadora j tal y como se presentan
al decisor n en el peŕıodo t. Este vector se denota como xnjt ∀j, t y es importante señalar que
también puede incluir variables que caracterizan al decisor. Asimismo, el investigador puede
especificar en cada peŕıodo una función que relacione las variables observadas con la utilidad
que percibe el decisor. Esta función se denota como Vnjt = V (xnjt), ∀j, t, y suele llamarse
utilidad representativa (Train, 2009).
5
CAPÍTULO 2. MODELOS DE ELECCIÓN DISCRETA 6
2.2. Derivación de las probabilidades de elección
Dado que existen aspectos de la utilidad que el investigador no observa o no puede
observar, Vnjt 6= Unjt, se puede descomponer la utilidad como Unjt = Vnjt + εnjt, donde εnjt
captura los factores que afectan a la utilidad, pero no están incluidos en la parte determińıstica
Vnjt. Según Train (2009), esta descomposición es totalmente general, ya que εnjt se define
simplemente como la diferencia entre la verdadera utilidad Unjt y la parte de la utilidad que
el investigador captura en Vnjt . El investigador no conoce εnjt ∀j, t, y por lo tanto trata
estos términos como variables aleatorias. Dichas variables suelen ser llamados términos de
error. La densidad conjunta del vector de errores en el peŕıodo t, εnt = (εn1t, ..., εnJt), es
etiquetada como f(εnt). Conociendo esta densidad, el investigador puede hacer afirmaciones
probabiĺısticas acerca de la elección de proveedor de servicio de telefońıa móvil que toma el
decisor. Aśı, la probabilidad que el decisor n elija en el periodo de decisión t a la alternativa
ynt es
Pnt(ynt) = P (Unyntt > Unjt, ∀j 6= ynt)
= P (Vnyntt + εnyntt > Vnjt + εnjt, ∀j 6= ynt)
= P (εnjt − εnyntt < Vnyntt − Vnjt, ∀j 6= ynt)
Esta probabilidad es una distribución acumulativa, es decir, es la probabilidad de que cada
término aleatorio εnjt− εnyntt esté por debajo de la cantidad observada Vnyntt−Vnjt. Usando
la densidad f(εnt) la probabilidad acumulada de elegir ynt en la situación de elección t puede
ser escrita como
Pnt(ynt) = P∫ (εnjt − εnyntt < Vnyntt − Vnjt, ∀j =6 ynt)
= I(εnjt − εnyntt < Vnyntt − Vnjt, ∀j 6= ynt)f(εnt)dεnt
εnt
donde I(·) es una función indicadora, igual a 1 cuando la expresión entre paréntesis es ver-
dadera y cero en caso contrario. Esta expresión es una integral multidimensional, sobre la
densidad de probabilidad de la parte no observada de la utilidad, f(εnt). Diferentes modelos
de elección discreta se obtienen mediante especificaciones diferentes de esta densidad, es de-
cir, a partir de diferentes supuestos acerca de cómo se distribuye la densidad de probabilidad
de la parte no observada de la utilidad. La integral tiene una forma cerrada sólo para ciertas
especificaciones de f(·). En particular, el modelo logit estándar tienen una expresión cerrada
para esta integral.
Caṕıtulo 3
Modelo Logit Estándar
La presente sección describe el modelo de logit estándar siguiendo en su mayor parte la
exposición que realiza McFadden (1974) y Train (2009) sobre este modelo.
3.1. Especificando una función densidad para el término de error
El modelo logit estándar se obtiene suponiendo que cada εnjt se distribuye independien-
temente y de forma idénticamente distribuida respecto a n, j y sobre todo, t, de acuerdo a
una densidad de probabilidad valor extremo tipo I con parametro de localización igual a cero
y parámetro de escala igual a 1. Dicha densidad, también es conocida como la distribución
estándar de Gumbel.
Aśı, se define la densidad de cada componente no observado de la utilidad en la situación
de elección t como
f(εnjt) = exp(−εnjt)exp(−exp(−εnjt)),
cuya distribución acumulada es
F (εnjt) = exp(− exp(−εnjt))
Considerar la distribución de valor extremo para los errores es similar a asumir que los errores
se distribuyen normalmente y de forma independiente. La distribución de valor extremo tiene
colas ligeramente más gruesas que una distribución normal, lo que implica que permite un
comportamiento ligeramente más aberrante que la normal. Por lo general, sin embargo, la
diferencia entre errores distribuidos según el valor extremo y según distribuciones normales
independientes es indistinguible emṕıricamente (Train, 2009). De hecho, el supuesto clave del
modelo no es tanto la forma de la distribución como que los errores sean independientes entre
śı. La suposición de que los errores sean independientes unos de otros es muy importante y
podŕıa ser visto como restrictiva, ya que implica que el investigador tiene especificado la
utilidad representativa (Vnjt) con tal grado de precisión que la parte restante de la utilidad
(εnjt) es esencialmente ruido: toda la información necesaria en el proceso de decisión es cap-
turada en la forma anaĺıtica de Vnjt, haciendo que el error de una alternativa no proporciona
al investigador ninguna información sobre el error de otra alternativa diferente.
7
CAPÍTULO 3. MODELO LOGIT ESTÁNDAR 8
3.2. Probabilidades de elección
Siguiendo la aproximación de McFadden (1974), a continuación se derivan las probabili-
dades de elección logit. La probabilidad que el usuario n elija en el periodo de decisión t la
empresa de telefońıa móvil ynt es
Pnt(ynt) = P (Vnyntt + εnyntt > Vnjt + εnjt, ∀j 6= ynt)
= P (εnjt < εnyntt + Vnyntt − Vnjt, ∀j 6= ynt)
Si εnyntt esta dado, la distribución acumulada para cada εnjt evaluada en εnyntt+Vnyntt−Vnjt
es
Fεnjt(εnyntt + Vnyntt − Vnjt) = exp(−exp(−(εnyntt + Vnyntt − Vnjt)))
Se etiqueta a Pnt(ynt|εnyntt) como el valor de la probabilidad de elección Pnt(ynt) dado el
valor de εnyntt. Ya que los εs son independientes entre alternativas, la probabilidad sobre
todo j 6= ynt es el producto de todas las distribuciones acumuladas individuales:
∏
Pnt(ynt|εnyntt) = exp(−exp(−(εnyntt + Vnyntt − Vnjt)))
j 6=ynt
En vista de que εnyntt en realidad no está dado, la probabilidad de elección Pnt(ynt) es la
integral de Pnt(ynt|εnyntt) sobre todos los valores de εnyntt ponderados por la densidad descrita
para f(εnyntt):
∫  ∏ −(εny t+Vny t−Vnjt) −εny t
Pnt(y
−e nt nt −εny t −e nt
nt) =  e  e nt e dεnyntt
j=6 ynt
que puede ser reescrito como
∫ +∞  ∏ − −(s+Ve ny t−Vnt njt) −sPnt(ynt) = e  e−se−e ds
s=−∞ j=6 ynt
donde s = εnyntt. Además, se debe notar que Vnyntt − Vnyntt = 0. Por lo que, agrupando
términos en el exponente de e, se tiene
∫ ∏ +∞
− −(s+Ve ny t−Vnt njtP −snt(ynt) =  e  e ds
∫s=−∞ j ∑ +∞
= exp− e−(s+Vnyntt−Vnjt) e−sds
∫s=−∞  j ∑ +∞
= exp−e−s e−(Vnyntt−Vnjt) e−sds
s=−∞ j
Reescribiendo exp(−s) = z, con −exp(−s)ds = dz:
CAPÍTULO 3. MODELO LOGIT ESTÁNDAR 9
∫ 0 ∑ 
Pnt(ynt) = exp−z e−(Vnyntt−Vnjt) (−dz)
∫∞  ∑j ∞= exp −z e−(Vnyntt−Vnjt) dz
0 ( ∑ j )
exp −∑z e−(Vny t−Vnjt) ∣ntj ∣= ∣∞
− e−(Vny ∣ntt−Vnjt)
∑ j
0
1
=
e−
)
(Vnyntt−Vnjt
j
∑eVnyntt=
Vnjt
j e
La utilidad representativa suele especificarse de forma que sea lineal en relación a los
parámetros: V ′njt = β xnjt, donde xnjt es el vector no estócastico observable mencionado en el
Caṕıtulo 2 y, que, dado el planteamiento de la presente tesis, incluirá la variable independiente
proxy de los efectos de red. Con esta especificación, la probabilidad de que el consumidor n
elija a la empresa operadora ynt se convierte en
∑β′e xnynttPnt(ynt) = β′xnjt
j e
que es la probabilidad de elección del modelo logit estándar para el periodo de decisión t.
El hecho de que las probabilidades de elección se expresan en una forma cerrada es una de
las mayores ventajas de logit frente a otros modelos de elección discreta, como el probit.
En este sentido, las probabilidades de elección logit son rapidamente calculadas y esto es
beneficioso cuando se realiza estimaciones basadas en simulación. Además, McFadden (1974)
demostró que la función logaritmo de la verosimilitud (log-verosimilitud o log-likelihood) con
estas probabilidades de elección, es globalmente cóncava respecto a los parámetros β.
Ahora bien, la última probabilidad también se puede reexpresar como
∏J
(P (y ))dyntnt nt
ynt=1
donde dynt = 1 si el consumidor n eligió la opción ynt en el periodo t y cero en caso contrario.
Luego, si se tiene una muestra de N usuarios cuyas elecciones de proveedor de telefońıa móvil
fueron observadas durante T peŕıodos, la función de verosimilitud de la muestra o - dicho de
otro modo - la probabilidad de que cada persona de la muestra haya elegido la alternativa
que realmente se ha observado que eligió, dado que los ε’s también son independientes entre
decisores y peŕıodos de elección, es
∏N ∏T ∏J
[P dyntnt(ynt)]
n=1 t=1 ynt=1
Caṕıtulo 4
Modelo Logit Mixto (MLX)
La siguiente sección describe el modelo de comportamiento MLX y el enfoque bayesiano
para estimar el MLX. Es importante señalar que esta sección se basa en gran parte en Mc-
Fadden y Train (2000), Train (2001 y 2009), Huber y Train (2001), y Train y Sonnier (2005).
4.1. Especificación del Comportamiento
El modelo logit mixto parte de reespecificar la utilidad que recibe el consumidor n de la
empresa operadora j en el peŕıodo de elección t, de la siguiente forma:
′
Unjt = βnxnjt + εnjt,
donde nuevamente xnjt es un vector 1 × K no estocástico de variables observables que in-
cluyen la covariable de los efectos de red, o, en términos generales, xnjt contiene variables
independientes relacionadas al proveedor de servicio de telefońıa móvil j o al decisor n en
el tiempo t. Por su parte, εnjt es el término de error cuya función de densidad es de valor
extremo tipo I los cuales se asumen son independientes e identicamente distribuidos. Sin
embargo, ahora βn es un vector de coeficientes que representa la influencia espećıfica de
xnjt sobre las preferencias del usuario n. Aśı, estos coeficientes vaŕıan entre decisores y el
investigador puede especificar una densidad para βn que describa la distribución de estos
parámetros en la población, con un vector de medias b y matriz de covarianzas W . Con ello,
esta especificación es igual a la de un modelo logit estándar, excepto que los βs vaŕıan entre
consumidores en lugar de ser fijos, y hace que el MLX se caracterize como un modelo de coefi-
cientes aleatorios. Seguidamente, se plantea que el decisor conoce el valor de su propia βn y de
las εnjt para cualquier opción j, y elige la alternativa ynt siempre que Unyntt > Unjt, ∀j 6= ynt.
4.2. Probabilidades de elección
El investigador observa las xnjt pero no los βn’s o los εnjt’s. Si el investigador observase
las βn’s, entonces la probabilidad de elección en el periodo t seŕıa la del modelo logit estándar,
ya que los εnjts son valor extremo independientes e identicamente distribuidos. Es decir, la
probabilidad de elegir a ynt condicionada sobre βn es
′
eβnxnyntt
L(ynt|βn) = ∑J ′eβnxnjtj=1
10
CAPÍTULO 4. MODELO LOGIT MIXTO (MLX) 11
Si definimos la secuencia de elecciones concretas de la persona n como yn = {yn1, ..., ynT }, la
probabilidad de las alternativas elegidas por el consumidor n, condicionado a βn, es
∏T ∑ ′eβnxnynttL(yn|βn) = J β′nxnjt
t=1 j=1 e
No obstante, el investigador desconoce los βns y por ende no puede condicionar sobre βn.
En este sentido, la probabilidad de elección incondicionada es la integral de L(yn|βn) sobre
todos los posibles valores de βn: ∫
Pn(yn|b,W ) = L(yn|βn)f(βn|b,W )dβn
que es la probabilidad de elección del modelo logit mixto.
En la literatura económica o de marketing, la distribución de los parámetros f(βn|b,W )
se suele especificar como Normal: β v N(b,W ) (Hall et al., 2006; Johnson et al., 2000; King
et al., 2007; Lancsar et al., 2007; Negŕın et al., 2008). Empero, otros trabajos han utilizado
la distribución log normal, lnβ v N(b,W ) (Train, 1998), la distribución uniforme (Revelt
y Train, 2000), distribución triangular (Revelt y Train, 2000), distribución SB de Johnson
(Train y Sonnier, 2005), y una distribución normal censurado por debajo en cero (Bhat,
2000). Los coeficientes también se pueden especificar como fijos; es decir, que no vaŕıan en la
población.
Por su parte, la función de verosimilitud para la muestra de consumidores de tamaño N ,
dada la independencia de los errores entre decisores, es
∏N
Pn(yn|b,W )
n=1
4.3. Aproximación Bayesiana para el MLX
Dado los fines del presente trabajo, más que la estimación de las probabilidad de elección
Pn, se busca la estimación de la distribución posteriori de b y W , ya que la cuantificación de
b y W es sustancial para analizar la importancia y la heterogeneidad, respectivamente, de
los efectos de red sobre la elección de compañia de telefońıa móvil.
La distribución posteriori de b y W , se denota como K(·) y es por definición proporcional
a la distribución a priori de b y W , k(b,W ), multiplicado por la la función de verosimilitud
del modelo logit mixto:
∏N
K(b,W |Y ) ∝ Pn(yn|b,W )k(b,W )
n=1
donde Y = (y1, ..., yN ) representa las elecciones de los decisores de toda la muestra.
Resulta posible simular valores de K(b,W |Y ) utilizando el algoritmo Metropolis-Hastings
CAPÍTULO 4. MODELO LOGIT MIXTO (MLX) 12
(MH). Sin embargo, por cada iteración de este algoritmo, seŕıa necesario calcular Pn(yn|b,W )
que contiene una integral no cerrada que tamb́ıen debe ser simulada. Para sortear esta restric-
ción, el algoritmo MH debe combinarse con el algoritmo de muestreo de Gibbs. El muestreo
de Gibbs implica la estimación de una secuencia de simulaciones en donde cada simulación
de un parámetro es estimada condicionada sobre los demás parámetros en el modelo (en una
forma jerárquica). Para ello, se debe tener en cuenta que βn es un parámetro más junto a b
y W . Aśı, la distribución posteriori de b, W y β = (β1, ..., βn)
T es
∏N
K(b,W,β|Y ) ∝ Ln(yn|βn)f(βn|b,W )k(b,W )
n=1
Antes de describir los pasos en detalle, se enunciarán dos lemas útiles para este desarrollo1:
Lema 1 (Priori conjugada para una normal multivariada con media desconocida, pero
varianza conocida). Si se tiene un vector aleatorio β de dimensión K × 1 que sigue una
distribución normal, con vector de medias desconocido b y matriz de covarianzas conocida
W , β ∼ N∑(b,W ), y se tiene una muestra aleatoria βn(n = 1, ..., N) de N(b,W ), donde
β = (1/N) Nn=1 βn es la media muestral. Si la distribución a priori de b es normal, con
vector de medias b0 y matriz de covarianzas W0, b ∼ N(b0,W0), cuya varianza tiende a
infinito, entonces la distribución a posteriori de b es normal, con vector de medias β y matriz
de covarianzas W/N , b ∼ N(β,W/N).
Lema 2: (Priori conjugada para una normal multivariada con media conocida, pero va-
rianza desconocida). Si se tiene un vector aleatorio β de dimensión K × 1 que sigue una
distribución normal, con vector de medias conocido b y matriz de covarianzas desconocida
W , β ∼ N(∑b,W ), y se tiene una muestra aleatoria βn(n = 1, ..., N) de N(b,W ), dondeN − − ′S = (1/N) n=1(βn b)(βn b) es la varianza alrededor de la media conocida b. Si la
distribución a priori de W es wishart invertida con K grados de libertad y matriz esca-
lar I (I es la matriz identidad), W ∼ IW (K,KI), entonces la distribución a posteriori
(KI +NS)
de W es (wishart invertida, co)n K + N grados de libertad y matriz escalar ,K +N
∼ (KI +NS)W IW K +N, .
K +N
Luego, asumiendo que la distribución a priori de k(b, w) = k(b)k(W ), donde k(b) ∼
N(b0,W0) con una varianza que tiende a infinito, k(W ) ∼ IW (K,KI) y βn ∼ N(b,W ). A
continuación se detalla el muestreo de Gibbs para los tres conjuntos de parámetros b, W y
β.
(1) b|W,β.
En este paso se condiciona respecto a W y a los βns de cada persona, lo que significa que
se trata a estos parámetros como si se conocieran. Aśı, los βns constituyen una muestra
de N realizaciones de una distribución normal con media desconocida b y varianza W
1Una prueba del cumplimiento de estos lemas se muestra en las páginas 13 y 14.
CAPÍTULO 4. MODELO LOGIT MIXTO (MLX) 13
conocida. La probabilidad de observar la muestra β dado b y W es
∏N [ ]
p(β|b,W ) = (2π)−K/2 |W |−1/2
′
exp −1 (β − b) W−1n (βn − b)
2
n=1 [ ∑ ]N
= (2π)−NK/2
′
|W |−N/2 1exp −1[− (βn − b) W (βn − b)2 n∑=1N [ ]]
= (2π)−NK/2 |W |−N/2 1exp − tr W−1
′
[ (βn − b) (βn − b)2 n=(1 ∑ )]N1 ′
= (2π)−NK/2 |W |−N/2 exp − tr W−1 (βn − b) (βn − b) ,
2
n=1
donde la expresión “tr” que se encuentra dentro de los corchetes indica el operador
traza. Asimismo, cabe señalar que la expresión dentro de los paréntesis puede ser reex-
presada de la siguiente forma
∑N ′ ′ ∑N ′
(βn − b)(βn − b) = S +N(β − b)(β − b) ,donde S = (βn − β)(βn − β)
n=1 n=1
Considerando esta reexpresión, se puede escribir p(β|b,W ) como
[ ]
| 1 ′p(β b,W ) = (2π)−NK/2 |W |−N/2 exp − tr(W−1[S +N(β − b)(β − b)
2
Ahora, dado que W es conocido, y que la distribución a priori de b es N(b0,W0) se
obtiene [ ]
p(b|W,β) ∝ 1exp[− (b−
′
b ) W−10 0 (b− b0)2 ]
× 1 ′exp [− tr(W−1[S +N(β − b)(β − b) ])2 ]
∝ −1 ′ ′exp ((b− b0) W−10 (b− b0) + (b− β) (NW
−1)(b− β))
2
Dando la forma cuadratica en b
′
(b− b −10) W0 (b−
′
b0) + (b− β) (NW−1)(b− β)
′ ′
= (b−b) (W−10 +NW
−1)(b−b)+(b0−β) [W−1(W−1 −1 −10 0 +NW ) NW
−1](b0−β),
donde b = (W−1 +NW−1)−1(W−10 0 b0 +NW
−1β). Luego, si se simplifica la distribución
posteriori de p(b|W,β) de la siguiente forma
[ ]
1 ′
p(b|W,β) ∝ exp − (b− b) (W−1 −1
2 0
+NW )(b− b)
se puede reconocer inmediatamente que esta última expresión es la función de densidad
CAPÍTULO 4. MODELO LOGIT MIXTO (MLX) 14
de una distribución normal multivariada. Por lo tanto,
b|W,β ∼ N(b, [W−1 −1 −10 +NW ] )
Ahora, ya que se consideró que la distribución a priori de b es N(b0,W0) con una
varianza que tiende a infinito. Entonces, W0 → ∞ ⇒ W−10 → 0, lo que nos lleva de
inmediato al cumplimiento del lema 1: ( )
W
b|W,β ∼ N β,
N
(2) W |b,β.
En este caso, los βns constituyen una muestra de una distribución normal con media b
conocida y varianza W desconocida. Entonces, si se considera la probabilidad p(b|W,β)
y la distribución a priori de W , IW[(v0, v0S0), la distr]ibución a posteriori de W es:
1
p(W |b,β) ∝ [|W |−(v0+K+1)/(2 exp − tr(v0S0W−1)2 )]
× |W |−N/2 −1 ′exp tr([S[+N(β − b)(β − b) ]W−1)2 ]
∝ |W |−(v0+N+K+1)/2 1 ′exp [− tr([v0S0 + S +N(β −] b)(β − b) ]W−1)2
∝ |W |−(v0+N+K+1)/2 1e[xp − tr([v0S +]NS]W−10 )2
∝ |W |−(v1+K+1)/2 exp −1 tr(v1S −11W ) .
2
Esta última expresión representa la función de densidad de una distribución Wishart
invertida IW (v1, v1S1), donde
v0S0 +NS
v1 = v0 +N S1 =
v0 +N
No obstante, la distribución a priori de W se definió como IW (K,KI) y no como
IW (v0, v0S0), por lo que procediendo con la equivalencia de parametros, se tiene el
inmediato cumplimiento del lema 2: la distribución a posteriori de W es una Wishart
invertida co∑n K+N grados de libertad y matriz de escala (KI+NS)/(K+N), donde′
S = (1/N) Nn=1(βn − b)(βn − b) es la varianza muestral de las βns alrededor de la
media conocida b.
(3) βn|b,W .
La distribución a posteriori de los βn de cada persona, condicionada respecto a sus
elecciones y a los parámetros de la población, es
K(βn|b,W, yn) ∝ Ln(yn|βn)φ(βn|b,W )
CAPÍTULO 4. MODELO LOGIT MIXTO (MLX) 15
Para extraer valores al azar de esta distribución posteriori se utilizá el algoritmo MH.
Aśı, para cada βin el algoritmo MH opera de la siguente forma:
(a) Se comienza con un valor inicial βin.
(b) Se extrae K valores independientes de una densidad normal estándar, y se agrupan
los valores en un vector etiquetado como ηi.
(c) Se crea un valor de prueba de βi+1 como β̃i+1 = βin n n + ρLη
i, donde ρ es un escalar
especificado por el investigador y L es el factor Choleski de W . Se debe tener en
cuenta que la distribución propuesta del algoritmo MH se especifica como normal
con media cero y varianza ρ2W .
(d) Se extrae un valor de una variable uniforme estándar µi+1.
(e) Se calcula el ratio:
L(y |β̃i+1n n )φ(β̃i+1n |b,W )F =
L(yn|β̃in)φ(β̃in|b,W )
(f) Si µi+1 ≤ F , se acepta β̃i+1n y se define βi+1 = β̃i+1n n . Si µi+1 > F , se rechaza βi+1n
y se deja βi+1 in = βn.
(g) Se repite el proceso varias veces. Para un i suficientemente alto, βin es un valor
extráıdo al azar de la distribución a posteriori.
En el algoritmo MH, el escalar ρ es especificado por el investigador. Este escalar de-
termina el tamaño de cada salto dentro de la distribución. Usualmente, saltos más
pequeños se trasladan en más aceptaciones, y saltos más grandes resultan en pocas
aceptaciones. Sin embargo, usar saltos pequeños implica que el algoritmo MH necesi-
tará más iteraciones para converger e involucra más correlación serial en la muestra
despues de la convergencia.
La tasa de aceptación óptima para el algoritmo MH es de aproximadamente 0.44 cuando
K = 1 y cae hasta 0.23 cuando K se eleva (vease Gelman et al. (1995, p. 335) para
mayor detalle). En este sentido, el valor de ρ puede ser ajustado por el investigador
para lograr una tasa de aceptación entorno a estos valores, bajando ρ para obtener una
tasa de aceptación mayor y elevándolo para obtener una tasa de aceptación menor.
De hecho, ρ se puede ajustar como parte del proceso de iteración. El investigador es-
tablece el valor inicial de ρ. En cada iteración, un valor de prueba de βn es aceptado
o rechazado para cada muestra n. Si en una iteración, la tasa de aceptación entre las
N observaciones es superior a un valor dado (por ejemplo, 0.33), entonces, ρ se eleva.
Si la tasa de aceptación está por debajo de este valor, ρ se baja. Por tal, el valor de
ρ puede moverse durante el proceso de iteración para alcanzar el nivel de aceptación
especificado (Train, 2009).
Enunciando nuevamente pero de forma más concisa el procedimiento de estimación, el
algoritmo comienza con valores iniciales de b0, W 0, y β0n. Luego, la i-ésima iteración del
muestreo de Gibbs puede ser estimada en 3 pasos:
CAPÍTULO 4. MODELO LOGIT MIXTO (MLX) 16
i−1 i−1
Extraer bi de N(β ,W i−1/N) donde β es la media de βi−1n
i−1 i−1 ∑
Extraer W i de IW (K+N, (KI+NS )/(K+N)), donde S = (βi−1n n −bi)(βi−1n −
bi
′
) /N
Para cada muestra n, extraer βin usando una iteración del algoritmo MH descrito an-
teriormente, empezando por βi−1n y usando la densidad φ(βn|bi,W i).
Estos tres pasos se repiten para muchas iteraciones. Los valores resultantes convergen a va-
lores extráıdos de la distribución posteriori conjunta de b, W y β. Una vez se obtienen los
valores convergentes de la distribución posteriori, se puede calcular la media y la desvia-
ción estándar de los valores extráıdos para obtener estimaciones y errores estándar de los
parámetros.
Caṕıtulo 5
Aplicación
5.1. Base de datos y medición de las variables de investigación
De acuerdo al planteamiento de la presente tesis, se necesita incluir las externalidades de
red como parte del vector de variables observables, xnjt, y poder aśı obtener la media (b) y
la desviación estándar (σ) asociada a la distribución del coeficiente. La aproximación de los
efectos de red dentro del logit mixto, se realizó utilizando la cuota de mercado de la empresa
operadora j en el peŕıodo t. Asimismo, los trabajos anteriores han incluido al precio como
otro factor coadyuvante en la contratación del servicio de telefońıa móvil y lo han aproximado
por el ARPU (ingreso promedio reportado por las empresas operadoras entre el número de
ĺıneas en servicio). Sin embargo, dado que en el presente caso la información del ARPU no
es pública, se utilizó el gasto mensual que declararón tener los consumidores e una encuesta.
Aśı, la base de datos que se dispone combina información de las empresas de telefońıa
móvil y de los clientes. La información sobre el número de ĺıneas en servicio (total de sus-
criptores) de cada empresa operadora procede de los reportes administrativos publicados en
la página institucional del OSIPTEL, mientras que los datos sobre la elección de los usua-
rios del servicio de telefońıa móvil y el gasto asociado al servicio provienen de la Encuesta
Residencial de Servicios de Telecomunicaciones (ERESTEL) del año 2015, y que también se
encuentra disponible en la web del OSIPTEL.
La ERESTEL permite recoger información de los servicios de telecomunicaciones (tele-
fońıa fija y móvil, internet fijo y móvil, televisión de paga y telefońıa de uso público) en
términos de la demanda de acceso y uso de dichos servicios en el sector residencial (hogares
y sus miembros). Asimismo, contiene información sobre las caracteŕısticas demográficas y
socioeconómicas de los encuestados. Por otra parte, es importante mencionar, que si bien en
sus inicios la ERESTEL fue concebida como una base del tipo corte transversal, es a partir
del año 2013 que se determinó que parte de la muestra global sea elegida para un seguimiento
longitudinal cuyo cierre está programado para el año 2017. Por lo que actualmente, se cuen-
tan con 3 olas panel correspondiente al periodo 2013 - 2015, que aún no son de acceso público.
La ERESTEL 2015 entrevistó a 55323 miembros del hogar, cuya edad van desde infantes
hasta adultos mayores, y donde naturalmente no todas las personas cuentan con un celular o
tienen el servicio de telefońıa móvil. En este sentido, fue necesario aplicar una serie de filtros
17
CAPÍTULO 5. APLICACIÓN 18
a la muestra potencial de la ERESTEL y aśı tener una muestra de interés para el presente
trabajo. Al respecto, es conveniente señalar que en general la estimación bayesiana presenta
limitaciones de caracter computacional para trabajar con muestras bastantes grandes, por lo
que se hace necesario en algunos casos acotar las bases de datos. Aśı pues, los criterios para
la elección de los individuos que conformaron la muestra de anaĺısis fueron los siguientes:
La persona debe ubicarse en Lima Metropolitana. Esto a fin de reducir los problemas
de contratación con una empresa operadora por falta de cobertura o disponibilidad del
servicio al interior del páıs.
La persona debe poseer un teléfono móvil.
La persona debe tener una edad de 18 a 64 años.
La persona debe ser el único responsable del pago de su servicio de telefońıa móvil.
La modalidad de contratación del servicio de telefońıa móvil es postpago o control.
El hogar de la persona debe pertenecer al nivel socieconómico C.
La persona declaró el último gasto mensual en su servicio de telefońıa móvil.
Con estos filtros, la muestra utilizada para los fines del presente trabajo es de 615 indi-
viduos. Ahora b́ıen, un aspecto importante en la construcción de la base de datos para la
estimación del logit mixto es aproximar o construir los escenarios contrafactuales que dan
respuesta a la siguiente pregunta: ¿Cuánto hubiera sido el precio que pagaba un consumi-
dor si contrataba con el operador s en lugar del j en el peŕıodo t?. Para ello, se imputó el
gasto medio que declararón tener los consumidores en cada empresa operadora del servicio
de telefońıa móvil. Este promedio se calculo considerando al total de usuarios de Lima Me-
tropolitana que declararón tener el servicio de telefońıa móvil bajo la modalidad postpago
o control. En el caso de la covariable asociada a los efectos de red, la cuota de mercado
de las empresas operadoras se calculó teniendo en cuenta el promedio de lineas móviles en
servicio de cada empresa operadora durante el año 2015. El Cuadro 5.1 resume la estrateǵıa
de aproximación de las variables que intervienen en el modelamiento.
Cuadro 5.1: Medición de las Variables introducidas en el Modelo
Variable Definición Efecto Esperado
Variable dummy que representa la elección
efectuada por el individuo:
Utilidad Unjt 1 =el consumidor n elige la empresa
operadora j en el peŕıodo t.
0 =en caso contrario.
Logaritmo natural del gasto del usuario en
Precio Pnjt Negativola empresa j en el peŕıodo t.
Participación de mercado del número de
Efectos de red
CNnjt ĺıneas en servicio de la empresa operadora Positivoclásicos
j en el peŕıodo t, expresado en porcentaje.
CAPÍTULO 5. APLICACIÓN 19
5.2. Resultados de la investigación
El análisis de regresión se realizó con el modelo logit mixto bajo la aproximación baye-
siana, el cual fue descrita en el Caṕıtulo 4, y cuya función de utilidad considerando la base
de datos y las variables utilizadas, toma la siguiente forma:
U = βPP + βCNnjt n njt n CNnjt + εnjt; t = 1, j = 1, 2, 3, 4.
Las estimaciones se obtuvieron utilizando un código de simulación propio, que fue desa-
rrollado en el software para el análisis estad́ıstico R. Dicho código se basó en el procedimiento
presentado en Train (2009, pág. 301-302) y que fue expuesto en el Caṕıtulo 4. En la esti-
mación, se especificó un total de 160.000 simulaciones, de las cuales las 10.000 primeras
iteraciones se destinaron para la fase de burn-in (quemado), y de las 150.000 restantes se
conservaron uno de cada trecientos (thin). Esto, para obtener los resúmenes estad́ısticos de
los parámetros de interés 1. Los valores iniciales para el vector de medias b se obtuvieron
a partir de la regresión logit condicional (logit estándar), mientras que para la matriz de
covarianzas W se partió de una matriz identidad (I). Luego, esta matriz I y el vector de
medias mencionado, fueron empleados para generar los valores iniciales de los βs individua-
les por medio de una distribución normal multivariada. Asimismo, el parámetro ρ se fijo en
2.608 (redondeado a 3 decimales) y se creó un contador para registrar la tasa de aceptación
obtenida luego de terminada la simulación. Mayores detalles sobre el código de estimación
pueden encontrarse en el Apéndice A.
Los resultados del procedimiento bayesiano del modelo logit mixto se presentan en el
Cuadro 5.2. Dicho cuadro muestra la siguiente información: (1) En la primera columna se
encuentran los coeficientes asociados a las covariables consideradas en la función de utilidad,
(2) en la segunda columna se tiene el parámetro de la media y la desviación estándar co-
rrespondiente a cada coeficiente, (3) en la tercera columna se muestra la estimación de la
media por parámetro, en tanto que en la (4 )cuarta columna se encuentra el valor obtenido
de su desviación estándar. Por último, (5) en la quinta y (6) sexta columna se presenta los
ĺımites del intervalo de credibilidad (ICr) formado por los cuantiles 0.025 (ĺımite inferior o
LI) y 0.975 (ĺımite superior o LS) de la muestra simulada (Albert, 2009; pág. 64-65). Cabe
señalar, que el ICr permite evaluar la relevancia estad́ıstica de los parámetros. Aśı, cuando
dentro del ICr de la media simulada se encuentra el cero (0), este parámetro se considerá
como estadisticamente no significativo y el anaĺısis de su dispersión pierde relevancia.
1Saltos de 300 permitieron asegurar que las cadenas simuladadas no tuvieran problemas de autocorrelación
de orden mayor a 1 o 2, aunque es importante mencionar que saltos de 100 solo generarón autocorrelaciones
que van descendiendo hasta el orden 5, para luego no ser significativas
CAPÍTULO 5. APLICACIÓN 20
Cuadro 5.2: Resultados de la Estimación
Parámetros Error
Coeficiente Media LI LS
de la distribución Estándar
P Media de la disribución (b
P ) −0,648 0,090 −0,819 −0,476
βn
Desv. est. de la disribución (σP ) 0,413 0,077 0,288 0,590
CN Media de la disribución (b
CN ) 0,090 0,010 0,071 0,110
βn
Desv. est. de la disribución (σCN ) 0,170 0,014 0,148 0,198
La tasa de aceptación obtenida fue de 0,249 y se encuentra dentro del rango óptimo
señalado por Gelman et al. (1995, p. 335). Los resultados muestran que el impacto sobre la
utilidad asociado a los efectos de red (βCNn ) presenta una media positiva (b
CN = 0,090) y es-
tad́ısticamente relevente (su ICr no contiene al 0). Ello significa que el tamaño de la empresa
operadora es un factor importante para el consumidor cuando decide elegir una compañia de
telefońıa móvil ya que su nivel de bienestar o utilidad tiene un incremento estad́ısticamen-
te importante. Aśı, los operadores de mayor cuota de mercado -que usulmente son los que
llevan más tiempo operando en la industria- pueden direccionar por defecto las decisiones
de contratación de los consumidores hacia sus redes, afectando la captación de clientes de
nuevos entrantes o competidores, mermando la desconcentración del mercado. En cuanto a la
heterogeneidad de los impactos de las externalidades de red, se registró que el incremento de
utilidad que supone la elección de un operador de mayor tamaño no es identica para todos los
individuos, sino que existen diferencias estad́ısticamente relevantes que ponen de manifiesto
cierta diversidad en la influncia de las externalidades de red sobre los consumidores; lo cual
queda reflejado a través de la desviación estándar de βCN (σCNn = 0,170).
Aśı pues, la Figura 5.1 presenta la distribución estimada de los βCNn para los individuos de
la muestra bajo estudio, donde se puede apreciar que para la gran mayoŕıa de consumidores
el tamaño del proveedor de telefońıa móvil implica un aumento de su utilidad en alrededor
de 0,23. Sin embargo, existen grupos minoritarios de consumidores donde este efecto puede
llegar a cambiar, siendo negativa en algunos casos (entorno a −0,05) o con una influencia
positiva leve (entorno a 0,07). Esta heterogeneidad se manisfiesta a pesar de tener una muestra
acotada a un grupo espećıfico de consumidores.
CAPÍTULO 5. APLICACIÓN 21
Figura 5.1: Distribución de βCNn en la muestra
Naturalmente, otro factor que también se encontro como determinante en la elección
de empresa operadora que realizán los consumidores estaŕıa representado por el precio del
servicio de telefońıa móvil. Esto, de acuerdo a la estimación de la media (bP = −0,648) co-
rrespondiente al coeficiente βPn y su respectivo ICr. Además, este efecto del precio presenta
una importante heterogeneidad de acuerdo a la desviación estándar estimada (σP = 0,413)
y su ditribución en la muestra de estudio, según se puede observar en la Figura 5.2. Aśı, en
algunos consumidores, la influencia del precio puede llegar a ubicarse en −0,9 o reducirse a
−0,3. Esta heterogenidad se encuentra, nuevamente, pese a tener una muestra bajo análisis
correspondiente a un grupo particular de usuarios del servicio de telefońıa móvil.
CAPÍTULO 5. APLICACIÓN 22
Figura 5.2: Distribución de βPn en la muestra
Por último, las Figuras 5.3 y 5.4 presentan la función de autocorrelación de la media y la
desviación estándar de cada coeficiente estimado, mientras que las Figuras 5.5 y 5.6 muestran
la evolución de las cadenas de los valores estimados. Aśı, estos gráficos dan indicios que los
valores simulados lograron alcanzar la convergencia y formar una muestra estad́ısticamente
independiente.
Figura 5.3: Distribución de las correlaciones del vector de medias b en la muestra simulada
CAPÍTULO 5. APLICACIÓN 23
Figura 5.4: Distribución de las correlaciones de las desviaciones estándar de la matŕız de covarianzas
W en la muestra simulada
Figura 5.5: Distribución de la cadena del vector de medias b en la muestra simulada
CAPÍTULO 5. APLICACIÓN 24
Figura 5.6: Distribución de la cadena de las desviaciones estándar de la matŕız de covarianzas W en
la muestra simulada
Caṕıtulo 6
Conclusiones
6.1. Conclusiones
Como se señaló en el Caṕıtulo 1, la existencia de efectos de red, al generar una atrac-
ción o dependencia en los consumidores por proveedores de mayor cuota de mercado, puede
degradar la intensidad competitiva de un mercado, protegiendo la base de clientes de las
empresas operadoras de mayor tamaño frente a la competencia de nuevos retadores. Aśı, se
generaŕıa una situación donde se consolida el dominio de las empresas ya establecidas y se
elimina la competencia efectiva y potencial de nuevos competidores, llevando al mercado a
una situación oligopólica donde es dif́ıcil la desconcetración.
La presente investigación teńıa por objetivo principal estudiar la magnitud y heteroge-
neidad de los efectos de red en el mercado de telefońıa móvil peruano usando un modelo logit
mixto bayesiano. Aśı, dado la base de datos utilizada, el peŕıodo de análisis, y la metodoloǵıa
y estrategia de estimación empleada, la evidencia emṕırica obtenida permitiŕıa sostener que
los efectos de red no solo se encontraŕıan presentes en el mercado de telefońıa móvil peruano,
a través de su influencia en la utilidad de los usuarios, sino que también esta influencia re-
sultaŕıa tener cierto grado de heterogéneidad entre los consumidores. Esto, pese a que en el
presente estudio se utilizo una muestra espećıfica de clientes: usuarios postpago o control del
nivel socieconomico C.
Dado estos hallazgos, se puede plantear algunas implicaciones de poĺıtica para los dife-
rentes agentes económicos, y, en especial, para el organismo regulador. En este sentido, las
medidas que ha venido implementando el OSIPTEL en los últimos años a fin de potenciar
la competencia en el mercado de telefońıa móvil, tales como el establecimiento de cargos de
terminación móvil diferenciados según el tamaño o participación de mercado de las empresas
operadoras, se encontraŕıa justificado y debe seguir siendo mejorado y complementado por
otras medidas que ayuden a relativizar la influencia de los efectos o externalidades de red.
Para ello, seŕıa importante tener en cuenta que la magnitud en que afectan dichas externa-
lidades no seŕıa homogénea en todos los usuarios del servicio de telefońıa móvil, sino que
existiŕıan diferencias significativas entre ellos.
Por ejemplo, se podŕıa argumentar que la propia dinámica competitiva del mercado móvil
peruano estaŕıa relativizando la importancia de realizar poĺıticas que fomenten un juego com-
25
CAPÍTULO 6. CONCLUSIONES 26
petitivo más equilibrado, como los cargos móviles diferenciados, ya que se esta observando
que cada vez más consumidores estan obtando por elegir operadores de menor cuota de mer-
cado, hecho que se reflejaŕıa en la estimación realizada, donde para un grupo de abonados
el efecto de las externalidades de red resultó negativo. No obstante, la misma estimación
llevada a cabo muestra que para la mayor parte del grupo de análisis aún se prefiere elegir los
operadores de tamaño de red grandes: el efecto de las externalidades de red en este grupo es
positivo, además de que su magnitud es mayor al grupo donde el efecto es negativo, lo que en
neto da una influencia positiva de las externalidades de red sobre la utilidad del consumidor.
En este sentido, la poĺıtica del establecimiento de cargos no podŕıa descartarse en el corto
plazo. Sin embargo, dicha afirmación no necesariamente se puede mantener en el largo plazo,
particularmente, si se considera la creciente inversión que estan realizando los operadores en
redes de datos (internet) y el direccionamiento de las preferencias de la demanda hacia servi-
cios de voz o mensajeŕıa que se realizan por internet (por ejemplo, el mayor uso de WhatsApp
o Skype).
6.2. Sugerencias para investigaciones futuras
Este trabajo no está libre de limitaciones, algunas de las cuales pueden servir de punto
de partida o referencia para futuros análisis. A continuación, se listán posibles alternativas
de mejora o extensiones:
Para realizar la estimación se tuvo que recurrir a un procedimiento de imputación sobre
el precio que pagaŕıa cada decisor si estuviera en otro operador diferente a su actual
proveedor. Asimismo, los efectos de red solo teńıan la variabilidad disponible de la cuota
de mercado de las empresas operadoras al 2015. Futuros trabajos, podŕıan construir
un experimento de elección considerando la técnica de Conjoint, donde el precio y el
número de clientes de cada opción o alternativa de proveedor se defina previamente y
vaŕıen en una serie de preguntas hipotéticas donde el consumidor tiene que elegir, dado
el precio y la cuota de mercado de la compañia, su operador de telefońıa móvil.
No se puede descartar que la estimación de los coeficientes pueda tener un grado de
sobre o subestimación como consecuencia de la posible endogeneidad de las variables
explicativas en la especificación mostrada, particularmente en el caso del precio. Por
ende, trabajos posteriores podŕıan ampliar el modelo logit mixto para incorporar más
covariables, reduciendo las posibilidades de sesgo por variables omitidas relevantes, o un
método que permita estimar el modelo de elección en presencia de variables explicativas
endogenas, como el enfoque basado en la función de control.
El modelamiento de la media de los βs ha sido incondicional. Empero, se podŕıa incluir
un segundo nivel de análisis, donde la media dependa de ciertas covariables como el
nivel socioeconómico, la edad, el género, la modalidad de contratación del servicio de
telefońıa móvil, la duración del contrato, la empresa a la que se pertenece, el tiempo
con el servicio móvil, etc.
CAPÍTULO 6. CONCLUSIONES 27
Las estimaciones obtenidas de la media y la varianza correspondientes a los βs se ob-
tuvieron considerando una distribución normal. Nuevas investigaciones, podŕıan con-
siderar la modificación de este supuesto y analizar su influencia sobre los resultados
finales.
El uso del algoritmo de Gibbs para simular la distribućıón posteriori también podŕıa
modificarse por algoritmos que tengan otras ventajas comparativas. Por ejemplo, en la
reducción del tiempo de estimación o frente a la necesidad de reducir los problemas de
autocorrelación o convergencia de las cadenas generadas. En esta ĺınea, futuros trabajos
podŕıan realizar la implementación del logit mixto (o sus mejoras) en el software Stan,
una herramienta desarrollada recientemente para la inferencia bayesiana en los modelos
estad́ısticos y que mejora la calidad de las estimaciones por el algoritmo que utiliza.
Los resultados hallados han sido bajo el enfoque de la inferencia bayesiana. No obstante,
seŕıa interesante analizar si estos resultados se mantienen bajo la inferencia clásica.
La modificación del enlace logistico por uno asimétrico o por una mixtura de funciones
es otro aspecto que podŕıa estudiarse.
Usar una base longitudinal o panel, donde los consumidores tengan una suficiente ven-
tana temporal (minimo 3 años, considerando los plazos de duración contractual) para
cambiar o modificar sus procesos de elección de operador móvil mejoraŕıa la robustez
de los resultados.
Apéndice A
Código
set . seed (475446) # f i j a l a s e m i l l a d e l random number g e n e r a t o r .
##i n s t a l l . p a c k ag e s (” mvtnorm ”)
l ibrary (mvtnorm) # rmvnorm f u n c t i o n
##i n s t a l l . p a c k ag e s (”MCMCpack”)
l ibrary (MCMCpack) # r w i s h and r i w i s h f u n c t i o n
##i n s t a l l . p a c k ag e s (” mcmcse ”)
l ibrary (mcmcse )
l ibrary ( bayesm )
##########
# Datos #
##########
l ibrary ( ” f o r e i g n ” )
base1=read . dta ( ”C: /Users/Paulo Roberto/Desktop/Tes i s/base y do s i s e t /base . dta” )
head ( base1 , n=15) # l a s 15 pr imeras l ı́ n e a s
lapply ( base1 , class ) # Toda l a base e s t a en formato número
save ( base1 , f i l e=” base1 . Rda” )
head ( base1 , n=6)
cho i ce1<−( base1$ cho i c e==1)
cho i ce2<−( base1$ cho i c e==2)
cho i ce3<−( base1$ cho i c e==3)
cho i ce4<−( base1$ cho i c e==4)
#Frecuenc ia de l a s e l e c c i o n e s
f e=table ( base1$ cho i c e )
N<−nrow( base1 )
####################################
# R e p o s i t o r i o s y Va lore s I n i c i a l e s #
####################################
memory . l i m i t ( s i z e = 40000)
nsim<−160000
K<−2
be<−matrix (0 , nsim ,K) ; be [ 1 , ]<−c (−1.800999 , .030279)
bedoble<−array (0 ,dim=c (K,K, nsim ) ) ; bedoble [ , , 1 ]<−diag (K)
beta<−betanew<−array (0 ,dim=c (N,K, nsim ) ) ; beta [ , , 1 ]<−rmvnorm(N, be [ 1 , ] , bedoble [ , , 1 ] )
rho<−2.60831426
counter<−0
########
# MCMC #
########
for ( t in 2 : nsim ){
# Extrayendo be
v<−bedoble [ , , t−1]/N
m<−apply (beta [ , , t−1] ,2 ,mean)
be [ t , ]<−rmvnorm (1 ,m, v )
# Extrayendo b e d o b l e
tmp<−t (beta [ , , t−1])−be [ t , ]
bedoble [ , , t ]<−rw i shar t ( K+N, solve (K∗diag (K) + tmp %∗%t (tmp ) ) ) $IW
28
APÉNDICE A. CÓDIGO 29
for (n in 1 :N){
# C a l c u l a l a v e r o s i m i l i t u d basada en e l a n t i g u o v a l o r de b e t a
v1 <− log ( base1 [ n , 4 ] ) ∗beta [ n , 1 , t−1] + base1 [ n , 1 2 ]∗beta [ n , 2 , t−1]
v2 <− log ( base1 [ n , 5 ] ) ∗beta [ n , 1 , t−1] + base1 [ n , 1 3 ]∗beta [ n , 2 , t−1]
v3 <− log ( base1 [ n , 6 ] ) ∗beta [ n , 1 , t−1] + base1 [ n , 1 4 ]∗beta [ n , 2 , t−1]
v4 <− log ( base1 [ n , 7 ] ) ∗beta [ n , 1 , t−1] + base1 [ n , 1 5 ]∗beta [ n , 2 , t−1]
l o l d <− log ( (exp( v1 ) ∗ cho i ce1 [ n ] + exp( v2 ) ∗ cho i ce2 [ n ] + exp( v3 ) ∗ cho i ce3 [ n ]
+ exp( v4 ) ∗ cho i ce4 [ n ] ) / ( exp( v1 ) + exp( v2 ) + exp( v3 ) + exp( v4 ) ) )
# Extrayendo c a n d i d a t o s
betanew [ n , , t ]<− beta [ n , , t−1] + t ( chol ( rho∗bedoble [ , , t ] ) ) %∗%rnorm(K)
# C a l c u l a l a v e r o s i m i l i t u d basada en e l nuevo v a l o r de b e t a
v1 <− log ( base1 [ n , 4 ] ) ∗betanew [ n , 1 , t ] + base1 [ n , 1 2 ]∗betanew [ n , 2 , t ]
v2 <− log ( base1 [ n , 5 ] ) ∗betanew [ n , 1 , t ] + base1 [ n , 1 3 ]∗betanew [ n , 2 , t ]
v3 <− log ( base1 [ n , 6 ] ) ∗betanew [ n , 1 , t ] + base1 [ n , 1 4 ]∗betanew [ n , 2 , t ]
v4 <− log ( base1 [ n , 7 ] ) ∗betanew [ n , 1 , t ] + base1 [ n , 1 5 ]∗betanew [ n , 2 , t ]
lnew <− log ( (exp( v1 ) ∗ cho i ce1 [ n ] + exp( v2 ) ∗ cho i ce2 [ n ] + exp( v3 ) ∗ cho i ce3 [ n ]
+ exp( v4 ) ∗ cho i ce4 [ n ] ) / ( exp( v1 ) + exp( v2 ) + exp( v3 ) + exp( v4 ) ) )
# P r o b a b i l i d a d de Aceptac i ón ( en e s c a l a l o g a r i t m i c a )
r <− lnew + dmvnorm( betanew [ n , , t ] , be [ t , ] , bedoble [ , , t ] , log=T) −
( l o l d + dmvnorm(beta [ n , , t−1] , be [ t , ] , bedoble [ , , t ] , log=T) )
i f ( log ( runif (1 ) ) < r ) {
beta [ n , , t ]<−betanew [ n , , t ]
counter=counter + 1
} else {
beta [ n , , t ]<−beta [ n , , t−1]
}
}
i f ( t %2%0==0) print ( t )
} # Fin MCMC
accept . r a t e=counter/ ( nsim∗N)
#CADENAS SIMULADAS DEL VECTOR b
##Media de l o s e l e m e n t o s d e l v e c t o r b
nsim<−160000
burn<−10001
th in<−300
index<−seq (1 , nsim−burn+1, th in )
s t r ( index )
bBpr<−be [ burn : nsim , 1 ] [ index ]
bBcn<−be [ burn : nsim , 2 ] [ index ]
length ( bBpr )
length (bBcn)
mean b=c (mean( bBpr ) , mean(bBcn ) )
##D e s v i a c i ó n e s t á n d a r de l o s e l e m e n t o s d e l v e c t o r b
sd b=c ( sd ( bBpr ) , sd (bBcn ) )
##I n t e r v a l o s de c r e d i b i l i d a d para l a media de l o s e l e m e n t o s d e l v e c t o r b , basados en q u a n t i l e s
qbBpr=quantile (bBpr , c ( . 0 2 5 , . 9 7 5 ) )
qbBcn=quantile (bBcn , c ( . 0 2 5 , . 9 7 5 ) )
#CADENAS SIMULADAS DE LA MATRIZ W
varBpr=bedoble [ 1 , 1 , burn : nsim ] [ index ]
varBcn=bedoble [ 2 , 2 , burn : nsim ] [ index ]
desvBpr=sqrt ( varBpr )
desvBcn=sqrt ( varBcn )
length ( desvBpr )
length ( desvBcn )
##Media de l a s Var ianzas ( y D e s v i a c i o n Est ándar ) de l a m a t r i z W
mean W=c (mean( varBpr ) , mean( varBcn ) )
mean sdW=c (mean( desvBpr ) , mean( desvBcn ) )
##D e s v i a c i ó n e s t á n d a r de l a s Var ianzas ( y D e s v i a c i o n Est ándar ) de l a m a t r i z W
sd W=c ( sd ( varBpr ) , sd ( varBcn ) )
sd sdW=c ( sd ( desvBpr ) , sd ( desvBcn ) )
APÉNDICE A. CÓDIGO 30
##I n t e r v a l o s de c r e d i b i l i d a d para l a d e s v i a c i ó n e s t á n d a r de l a s d e s v i a c i ó n e s e s t á n d a r
##de l a m a t r i z W
qdvBpr=quantile ( desvBpr , c ( . 0 2 5 , . 9 7 5 ) )
qdvBcn=quantile ( desvBcn , c ( . 0 2 5 , . 9 7 5 ) )
#Bs i n d i v i d u a l e s
Bpr=apply (beta [ , 1 , seq ( burn , nsim ,by=300) ] ,1 ,mean)
Bcn=apply (beta [ , 2 , seq ( burn , nsim ,by=300) ] ,1 ,mean)
hist (Bpr , main=NULL)
hist (Bcn , main=NULL)
#Mostrando l o s r e s u l t a d o s de l a s i m u l a c i ó n : Tasa de a c e p t a c i ó n , medias , d e s v i a c i o n e s e s t á n d a r
#e i n t e r v a l o s de c r e d i b i l i d a d
accept . r a t e
mean b
sd b
qbBpr
qbBcn
mean sdW
sd sdW
qdvBpr
qdvBcn
#Mostrando l o s r e s u l t a d o s de l a s i m u l a c i ó n : La f u n c i ó n de a u t o c o r r e l a c i ó n
par ( mfrow=c ( 1 , 2 ) )
a c f (bBpr , col=2)
ac f (bBcn , col=2)
par ( mfrow=c ( 1 , 2 ) )
a c f ( desvBpr , col=2)
ac f ( desvBcn , col=2)
#Mostrando l o s r e s u l t a d o s de l a s i m u l a c i ó n : La cadena
par ( mfrow=c ( 1 , 2 ) )
ts . plot (bBpr , col=2)
ts . plot (bBcn , col=2)
par ( mfrow=c ( 1 , 2 ) )
ts . plot ( desvBpr , col=2)
ts . plot ( desvBcn , col=2)
save ( accept . rate , be , bedoble , beta , fe , f i l e=
”C: /Users/Paulo Roberto/Desktop/Tes i s/base y do s i s e t /E s p e c i f i c a c i ó n f i n a l /myscript11 160k . rda” )
load ( f i l e=
”C: /Users/Paulo Roberto/Desktop/Tes i s/base y do s i s e t /E s p e c i f i c a c i ó n f i n a l /myscript11 160k . rda” )
Bibliograf́ıa
Albert, J. (2009). Bayesian Computation with R. Springer.
Baker, M. (2014). Adaptive Markov chain Monte Carlo sampling and estimation in Mata.
The Stata Journal, 14(3), 623-661.
Balcombe, K., Chalak, A., y Fraser, I. (2009). Model selection for the mixed logit with
Bayesian estimation. Journal of Environmental Economics and Management, 57, 226-237.
Bhat, C. (2000). Incorporating observed and unobserved heterogeneity in urbanwork travel
mode choice modeling. Transportation Science, 34 (2), 228-238.
Birke, D., y Swann, G.P.(2006). Network effects and the choice of mobile phone operator.
Journal of Evolutionary Economics, 16(1-2), 65-84.
Beuermann, D., McKelvey, C., y Sotelo C. (2012). The Effects of Mobile Phone Infrastruc-
ture: Evidence from Rural Peru. Documento de Trabajo N◦ 2012-12. BCRP.
Czajkowski, M., y Sobolewski, M. (2015). How much do switching costs and local network
effects contribute to consumer lock-in in mobile telephony?. Telecommunications Policy.
Corrocher, N., y Zirulia, L.(2009).Me and you and everyone we know: an empirical analysis
of local network effects in mobile communications. Telecommunications Policy, 33(1), 68?79.
Doganoglu, T. y Grzybowski, L. (2007). Estimating network effects in mobile telephony in
Germany. Information Economics and Policy, 19(1), 65-79.
Farrell, J., y Klemperer, P. (2007). Coordination and lock-in: competition with switching
costs and network effects. En M. Armostrong, y R.Porter (Eds.), Handbook of industrial
organisation (pp. 1967-2072). Elsvier: Elsvier, 2007.
Fu, W.W. (2004).Termination-discriminatory pricing, subscriber bandwagons, and network
traffic patterns: the Taiwanese mobile phone market. Telecommunications Policy, 28(1), 5-
22.
Hall, J., Fiebig, D.G., King, M.T., Hossain, I., y Louviere, J.J. (2006). What influences
participation in genetic carrier testing? Results from a discrete choice experiment. Journal
of Health Economics, 25(3), 520-537.
Huber, J., y Train, K. (2001). On the Similarity of Classical and Bayesian Estimates of
Individual Mean Partworths. Marketing Letters, 12(3), 259-269.
31
BIBLIOGRAFÍA 32
Johnson, F.R., Banzhaf, M.R., y Desvousges, W.H. (2000). Willingness to pay for improved
respiratory and cardiovascular health: a multiple-format, stated-preference approach. Health
Economics, 9(4), 295-317.
Karaçuka, M., Çatik, A.N., y Haucap, J.(2013). Consumer choice and local network effects
in mobile telecommunications in Turkey. Telecommunications Policy, 37(4), 334-344.
Katz, M., y Shapiro, C. (1985).Networks externalities, competition, and compatibility. The
American Economic Review, 75(3), 424-440.
Katz, M., y Shapiro, C. (1994).Systems competition and network effects. Journal of Economic
Perspectives, 8(2), 93-115.
Klemperer, P. (1995). Competition when consumers have switching costs: an overview with
applications to industrial organization, macroeconomics, and international trade. The Re-
view of Economic Studies, 4, 515.
Kim, H.S., y Kwon, N. (2003). The advantage of network size in acquiring new subscribers:
a conditional logit analysis of the Kore an mobile telephony market. Information Economics
and Policy, 15(1), 17-33.
King, M.T., Hall, J., Lancsar, E., Fiebig, D. Hossain, I., Louviere, J., Reddel, H.K., y
Jenkins, C.R. (2007). Patient preferences for managing asthma: results from a discrete choice
experiment. Health Economics, 16 (7), 703-717.
Lancsar, E., Hall, J.P., Kennny, P., Louviere, J.J., Fiebig, D.G., Hossain, I., Thien, F.C.,
Reddel, H.K., y Jenkins, C.R. (2007). Using discrete choice experiments to investigate subject
preferences for preventive asthma medication. Respirology, 12(1), 127-136.
Maicas, J.P., Polo, Y., y Sese, F.J. (2009). The role of (personal) network effects and swit-
ching costs in determining mobile users’ choice. Journal of Information Technology, 24(2),
160-171.
Maicas, J.P., Polo, Y., y Sese, F.J. (2010). El Papel de los efectos de red y los costos de
cambio en la elección de la compañ́ıa de telefońıa móvil. Revista Europea de Dirección y
Economı́a de la Empresa, vol. 19, núm 3, pp. 161-172.
Maicas, J.P., y Sese, F.J. (2011). Network effects in the mobile communications industry:
an overview. In Máıcas Juan P.(Ed.), Recent Developments in the Mobile Communications
Industry: A Multidisciplinary Approach (pp. 131-140). Crotia: In Tech.
Marschak, J. (1960). Binary choice constraints on random utility indications. in K. Arrow,
ed., Stanford Symposium on Mathematical Methods in the Social Sciences, Stanford Uni-
versity Press, Stanford, CA, pp. 312-329.
McFadden, D. (1974). Conditional logit analysis of qualitative choice behavior. in P. Za-
rembka, ed., Frontiers in Econometrics, Academic Press, New York, pp. 105-142.
BIBLIOGRAFÍA 33
McFadden, D., y Train, K. (2000). Mixed MNL models for discrete response. Journal of
Applied Econometrics, 15(5), 447-470.
Negrin, M.A., Pinilla, J., y León, C.J. (2008). Willingness to pay for alternative policies for
patients with Alzheimer?s Disease. Health Economics, Policy and Law 3 (Pt 3), 257-275.
Regiera, D., Ryanb, M., Phimister, E., y Marrad, C. (2009).Bayesian and classical estima-
tion of mixed logit: An application to genetic testing. Journal of Health Economics, 598-610.
Revelt, D., y Train, K. (2000). Specific taste parameters and mixed logit.Working paper,
Department of Economics, University of California, Berkeley.
Rust,R., y Verhoef, P. (2005).Optimizing the Marketing Interventions Mix in Intermediate-
Term CRM. Marketing Science, 24(3), 477?489.
Shy, O. (2001). The Economics of Network Industries. Cambridge University Press.
Sobolewski, M., y Czajkowski, M. (2012). Network effects and preference heterogeneity in
the case of mobile telecommunications markets. Telecommunications Policy, 36(3), 197-211.
Ocaña, C., Polo, F., y Sesé, F. (2009). Existencia y heterogeneidad de los costes de cambio
en la industria de la telefońıa móvil. Hacienda Pública Española / Revista de Economı́a
Pública, 191(4/2009): 926.
Polo, Y., y Sesé, J. (2009). La Retención de los Clientes. Un Estudio Emṕırico de sus
Determinantes. Revista Española de Investigación de Marketing ESIC. Vol. 13, n◦ 1, pp.
117-137.
Thurstone, L. (1927). A law of comparative judgement. Psychological Review 34, 273-286.
Train, K. (1998). Recreation demand models with taste differences over people. Land Eco-
nomics, 74 (2), 230-239.
Train, K. (2001). A Comparison of Hierarchical Bayes and Maximum Simulated Likelihood
for Mixed Logit. Department of Economics, University of California, Berkeley.
Train, K.(2009). Discrete Choice Methods with Simulation. Cambridge University Press.
Train, K., y Sonnier, G. (2005).Mixed logit with bounded distributions of correlated part-
worths. In: Alberini, A., Scarpa, R. (Eds.), Applications of Simulation Methods in Environ-
mental and Resource Economics. Springer, Dordrecht, pp. 117-134.