PONTIFICIA UNIVERSIDAD CATÓLICA DEL PERÚ ESCUELA DE GRADUADOS ESTIMACIÓN BAYESIANA DE EFECTOS DE RED: EL MODELO LOGIT MIXTO TESIS PARA OPTAR POR EL GRADO DE MAGISTER EN ESTADÍSTICA Presentado por: Paulo Roberto Chahuara Vargas Asesor: Cristian Luis Bayes Rodriguez Miembros del jurado: Dr. Oscar Edgardo Millones Destefano Dr. Cristian Luis Bayes Rodriguez Dr. Luis Hilmer Valdivieso Serrano Lima, Julio 2017 Dedicatoria A mi familia y a la leve piedad del tiempo. ii Agradecimentos A mi asesor, el Dr. Cristian Bayes, por su valiosa gúıa y consejos durante el proceso de este trabajo. Al Dr. Valdivieso y el Dr. Millones por sus imprescindibles sugerencias. También quisiera expresar mi agradecimiento a los profesores de la Maestŕıa de Estad́ıstica de la Pontificia Universidad Católica del Perú (PUCP): Valdivieso, Bayes, Flores, Tarazona, Veliz, Giancarlo, Millones y Camiz, quienes con sus enseñanzas y su buena disposición han contribuido en mi proceso continuo de formación, no solo a nivel del aprendizaje técnico, sino también como persona. Mi más profundo respeto y admiración hacia ustedes. iii Resumen Los efectos o externalidades de red son factores que pueden condicionar las decisiones de contratación de los consumidores en favor de empresas ya establecidas y encontra de los nuevos competidores, pudiendo limitar la competencia efectiva y potencial de los mercados, en especial, en aquellas industrias donde el número de empresas es bajo y la entrada de nuevos competidores es poco frecuente. Por ello, es importante verificar su existencia y la magnitud de sus efectos sobre las decisiones de compra de los consumidores con el objetivo de justificar o establecer medidas que impulsen una competencia más equilibrada entre las empresas. Además, teniendo en consideración que los consumidores pueden tener cierto grado de heterogeneidad en sus comportamientos de adquisición, también resulta relevante estudiar el grado de diferenciación de los efectos de red entre los consumidores a fin de mejorar las poĺıticas que fomenten la competencia. Este trabajo tiene por objetivo estimar un modelo logit mixto bajo el enfoque de la infe- rencia bayesiana, para estudiar emṕıricamente la existencia y heterogeneidad de los efectos de red sobre las decisiones de contratación de los consumidores en la industria de telefońıa móvil peruana. El análisis se hace con base a una muestra que combina información de la Encuetas Residencial de Servicios de Telecomunicaciones (ERESTEL) del año 2015 e infor- mación de las empresas operadoras del servicio de telefońıa móvil. Los resultados de las estimaciones realizadas sugieren que los efectos de red tendŕıan un condicionamiento importante sobre las decisiones de contración del servicio de telefońıa móvil, además de presentar un grado de heterogeneidad estad́ısticamente significativo en la magnitud de sus efectos. Palabras clave: modelo logit mixto, inferencia bayesiana, efectos de red. iv Índice general Índice de figuras VI Índice de cuadros VII 1. Introducción 1 1.1. Consideraciones Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3. Organización del Trabajo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 2. Modelos de Elección Discreta 5 2.1. Utilidad y regla de comportamiento . . . . . . . . . . . . . . . . . . . . . . . 5 2.2. Derivación de las probabilidades de elección . . . . . . . . . . . . . . . . . . . 6 3. Modelo Logit Estándar 7 3.1. Especificando una función densidad para el término de error . . . . . . . . . . 7 3.2. Probabilidades de elección . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 4. Modelo Logit Mixto (MLX) 10 4.1. Especificación del Comportamiento . . . . . . . . . . . . . . . . . . . . . . . . 10 4.2. Probabilidades de elección . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 4.3. Aproximación Bayesiana para el MLX . . . . . . . . . . . . . . . . . . . . . . 11 5. Aplicación 17 5.1. Base de datos y medición de las variables de investigación . . . . . . . . . . . 17 5.2. Resultados de la investigación . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 6. Conclusiones 25 6.1. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 6.2. Sugerencias para investigaciones futuras . . . . . . . . . . . . . . . . . . . . . 26 A. Código 28 Bibliograf́ıa 31 v Índice de figuras 5.1. Distribución de βCNn en la muestra . . . . . . . . . . . . . . . . . . . . . . . . 21 5.2. Distribución de βPn en la muestra . . . . . . . . . . . . . . . . . . . . . . . . . 22 5.3. Distribución de las correlaciones del vector de medias b en la muestra simulada 22 5.4. Distribución de las correlaciones de las desviaciones estándar de la matŕız de covarianzas W en la muestra simulada . . . . . . . . . . . . . . . . . . . . . . 23 5.5. Distribución de la cadena del vector de medias b en la muestra simulada . . . 23 5.6. Distribución de la cadena de las desviaciones estándar de la matŕız de cova- rianzas W en la muestra simulada . . . . . . . . . . . . . . . . . . . . . . . . 24 vi Índice de cuadros 5.1. Medición de las Variables introducidas en el Modelo . . . . . . . . . . . . . . 18 5.2. Resultados de la Estimación . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 vii Caṕıtulo 1 Introducción 1.1. Consideraciones Preliminares Los efectos o externalidades de red pueden definirse como aquellos efectos que hacen que el valor que obtiene una persona por consumir un producto, o hacer uso de un servicio, de- penda no solo de la utilidad del producto o servición en śı mismo (valor intŕınsico), sino del número de individuos que lo consumen o utilizan (valor de sincronización). Alternativamente, se dice que las preferencias de los consumidores muestran externalidades de red si la utilidad de cada consumidor se eleva cuando el número total de consumidores se incrementa (Farrell y Klemperer, 2007; Shy, 2001). Por ejemplo, el servicio de telefońıa móvil ofrecido por una empresa operadora resultará más útil o beneficioso para una persona a medida que esta com- pañia tenga más clientes, ya que de este modo, el individuo no solo podrá comunicarse con un número de usuarios mayor, sino que esta comunicación puede resultar menos costosa para el consumidor: una mayor base de suscriptores en una compañia móvil disminuye los costos unitarios de la empresa, además de permitirle menores costos relacionados a la interconexión de llamadas que terminan en las redes de otras compañias móviles, lo cual se traduce en ofertas comerciales más atractivas. Los efectos de red pueden condicionar de forma importante la decisión del consumidor para elegir al provedor de un bien o servicio, pues la presencia de externalidades de red implica que en los compradores emerjan deseos de afinidad con el resto de consumidores, y, en consecuencia, las personas tomarán sus decisiones de elección de proveedor condiciona- dos por la aspiración de ser compatibles con lo que ya han elegido la mayoŕıa de usuarios en el mercado, o en algunos casos con las eleccions ya realizadas por los integrantes de su red social (familiares, amigos, compañeros o colegas). Esto genera una situación eficas para que las empresas establezcan relaciones con sus consumidores encaminadas a una muy larga duración (e.g. Czajkowski y Sobolewski, 2015; Maicas et al., 2009, Ocoña et al., 2009 y 2010, Birke y Swann, 2006, Corrocher y Zirulia, 2009, Maicas y Sese, 2011). Si bien los efectos de red pueden resultar beneficiosos para las firmas, su presencia puede representar un desequilibrio para la competencia entre empresas. Esto es particularmente sustancial, en las industrias donde el número de competidores es limitado y la oportunidad que aparescan nuevas empresas que reten a las compañias establecidas es poco frecuente. Bajo este contexto, la oportunidad de que el consumidor cuente con más opciones de provee- 1 CAPÍTULO 1. INTRODUCCIÓN 2 dores en el mercado puede perderse ya que las externalidades de red se vuelven una ventaja sostenible para las compañias con más tiempo o participación en el mercado a la hora com- petir por atraer o retener clientes frente a las nuevas empresas retadoras o de menor cuota en la industria (Fu, 2004). Como resultado, el mercado no puede desconcentrase de las em- presas ya establecidas y termina o continua en manos de pocos proveedores, degradándose la competencia (Farrell y Klemperer, 2007; Katz y Shapiro, 1985 y 1994). Ello les permite a las compañ́ıas fijar precios que resultan superiores a los precios de un mercado sin externalidades de red, limitando -por los altos precios- que más personas puedan hacer uso del bien o servicio y disminuyendo el excedente del consumidor (la diferencia entre lo que está dispuesto a pagar como máximo un cliente y lo que realmente termina pagando). Además, dada la fragilidad o ausencia de competencia, estas pocas empresas tienen el incentivo de fijar la calidad del producto en un nivel que no es óptimo para la sociedad e inclusive darse el lujo de operar con costos altos, generando una industria ineficiente. En suma, una reducción del bienestar social. Por lo expuesto, existe un importante interés y preocupación sobre el rol de las exter- nalidades de red de parte de las instituciones públicas encargadas de diseñar y establecer las poĺıticas de competencia y regulación que arbitrarán el juego competitivo de los merca- dos. En esta ĺınea, el desarrollo e implementación eficaz de tales poĺıticas requiere no solo un análisis que defina e identifique para cada industria la manera en que los efectos de red se manifiestan y operan, sino que también cuantifique su magnitud y distribución entre los agentes económicos. Sin embargo, no son muchos los estudios de naturaleza emṕırica que analizan la relevancia de las externalidades de red sobre la elección de proveedor en los con- sumidores. Particularmente, se han encontrado estudios de esta ı́ndole a nivel de Estados Unidos, Europa o Aśıa. Lo que es más, dentro de este grupo de investigaciones, parte de la perspectiva adoptada ha sido cuantificar los efectos de red a nivel promedio o agregado (Ka- racuka et al., 2013; Maicas et al., 2010; Doganoglu y Grzybowski, 2007; Birke y Swann, 2006; Kim y Kwon, 2003), obviando que puede existir un grado de diferenciación en el comporta- miento de cada consumidor y que estas heterogeneidades podŕıan influir sobre la medición de las externalidades de red, lo cual convierte al estudio de estos elementos restrictivos de la competencia en un tema importante para los hacederos de poĺıticas públicas y privadas, los agentes económicos y la comunidad cient́ıfica. La presente investigación tiene como finalidad utilizar un modelo estad́ıstico para estimar y analizar la relevancia y heterogeneidad de los efectos de red sobre la elección de proveedor que realizan los consumidores. El trabajo toma como ámbito de aplicación la industria de telefońıa móvil peruana debido a que, en primer lugar, reúne las caracteŕısticas de ser una industria con pocas empresas compitiendo y en donde la mayoria de clientes está concen- trada en una operadora, lo que incrementa las posibilidades del daño que pueden tener las externalidades de red sobre la competencia. En segundo lugar, es un sector que tiene una importancia fundamental en el bienestar social del páıs (e.g. Beuermann et. al., 2012). En tercer lugar, tiene instituciones públicas tales como el Ministerio de Transporte y Comuni- caciones (MTC) y el Organismo Supervisor de la Inversión Privada en Telecomunicaciones CAPÍTULO 1. INTRODUCCIÓN 3 (OSIPTEL) especialmente interesados en el desarrollo del sector. Por ejemplo, el OSIPTEL es la autoridad regulatoria y en los últimos años ha estado aplicando diversas poĺıticas que han buscado mejorar la competencia efectiva entre las empresas (e.g., cargos de terminación móvil diferenciados). En esta ĺınea, una cuestión que siempre ha estado presente es si unos cargos (precios) de terminación de llamadas elevados pueden ser utilizados por los operadores ya establecidos para expulsar del mercado a nuevos retadores, situación que se ve reforzada por las externalidades de red. Aśı, cuando las llamadas que terminan en la red de otro ope- rador resultan más caras que las llamadas que terminan en la misma red del operador, la red con más suscriptores se vuelve más atractiva para los usuarios, ya que si se suscriben a esta red una mayor proporción de sus llamadas serán de la misma red y, por tanto, incurrirán en un menor costo de comunicación. Por el contrario, ser cliente de una red pequeña supone un costo para los usuarios porque reciben un menor numero de llamadas, además de incurrir en mayores gastos por comunicación, ya que la mayoŕıa de sus llamadas terminarán en la red del operador más grande. Por último, a diferencia de otras industrias reguladas en el Perú (saneamiento, electricidad, gas natural o transporte), los usuarios de telefońıa móvil tienen la facilidad técnica o legal de elegir con qué compañ́ıa contratar su servicio. Para contrastar lo señalado en el párrafo anterior, se dispone de una base de datos que combina información sobre los atributos de las diferentes empresas operadoras de telefońıa móvil con información sobre las decisiones de contratación de usuarios del servicio de tele- fońıa móvil. La metodoloǵıa empleada en la presente tesis sigue la adoptada por el grupo pequeño de investigaciones que estudiaron la magnitud y heterogeneidad de los efectos de red a nivel individual (Czajkowski y Sobolewski, 2015; Sobolewski y Czajkowski, 2012; Mai- cas et al., 2009; Polo y Sesé, 2009). Dicha metodoloǵıa, se basa en la utilización del modelo logit mixto estimado bajo inferencia bayesiana. Esto debido a las ventajas del procedimiento bayesiano frente a la estimación clásica. Por ejemplo, el procedimiento bayesiano no requie- re la maximización de una función de verosimilitud, a diferencia de la inferencia clásica, lo que expone a la estimación clásica a problemas de convergencia por valores iniciales pobres, optimos locales o problemas de curvaturas de la función de verosimilitud que pueden derivar en resultados engañosos (Train, 2009; Balcombe et al., 2009). 1.2. Objetivos A partir de lo señalado en la sección anterior, el presente trabajo tiene el objetivo general de estimar el modelo logit mixto bajo el enfoque de la inferencia bayesiana, para evaluar la existencia y heterogeneidad de los efectos o externalidades de red sobre la elección de pro- veedor que realizan los consumidores en la industria peruana de servicio de telefońıa móvil. Los objetivos espećıficos de la tesis son los siguientes: Estudiar el modelo de elección discreta logit mixto bajo inferencia bayesiana. Estimar la influencia de los efectos de red sobre las decisiones de los consumidores para elegir un operador de telefońıa móvil. CAPÍTULO 1. INTRODUCCIÓN 4 Evaluar si esta influencia presenta una heterogeneidad importante entre los consumi- dores. Evaluar si estos efectos son estad́ısticamente significativos. 1.3. Organización del Trabajo En el Caṕıtulo 2, se presenta el marco general de los modelos de elección bajo el enfoque de la teoŕıa de la utilidad aleatoria. Luego, en el Caṕıtulo 3 se muestra la versión básica del modelo logit mixto, el modelo logit estándar, para seguidamente en el Caṕıtulo 4 centrar- se concretamente en el modelo logit mixto y su estimación bajo el enfoque de la inferencia bayesiana. Despues, en el Caṕıtulo 5 se utiliza el modelo logit mixto para obtener el efecto estimado de las externalidades de red sobre el proceso de elección de compañ́ıa de telefońıa móvil que el consumidor peruano realiza, y se estudia la heterogeneidad de dichos efectos. Fi- nalmente, en el Caṕıtulo 6 se expone las conclusiones obtenidas del trabajo. Adicionalmente, en el anexo de la tesis, se presenta el código que fue programado en el software estad́ıstico R para realizar la estimación (Apéndice A). Caṕıtulo 2 Modelos de Elección Discreta De acuerdo a los trabajos previos sobre la estimación de efectos de red, el punto de parti- da de la estimación son los modelos de elección discreta (Thurstone, 1927; Marscchak, 1960; McFadden, 1974). Dichos modelos se derivan generalmente bajo el enfoque de la utilidad aleatoria, cuyo supuesto angular es la maximización de la utilidad en el comportamiento del tomador de decisiones. Bajo este enfoque cada alternativa u opción del conjunto de elección le reporta al decisor un nivel de utilidad. La utilidad es el beneficio o bienestar percibido de elegir una alternativa del conjunto de elección, y el decisor se comporta de forma tal que escoje la alternativa que le reporta el mayor nivel de utilidad. A continuación se describe el modelo de elección discreta desde la optica de la teoŕıa de la utilidad aleatoria. Es importante señalar que esta sección se basa en gran medida en Train (2009). 2.1. Utilidad y regla de comportamiento Se asume que una persona n = 1, ..., N , enfrenta en cada peŕıodo t = 1, ..., T , la decisión de elegir un operador de telefońıa móvil j = 1, ..., J . En cada situación de elección t, la per- sona n asocia a cada alternativa j cierto nivel de utilidad denotado como Unjt ∀j, t. La regla de comportamiento, en base al enfoque de la utilidad aleatoria, es que el decisor eligirá la alternativa que le brinda el máximo nivel de bienestar o utilidad en el peŕıodo de decisión t. Esto es, elegir la alternativa ynt, si y sólo si: Unyntt > Unjt, ∀j 6= ynt. Sin embargo, desde el punto de vista del investigador, no es posible observar la utilidad del decisor en cada situación de elección. El investigador solo puede observar un vector 1×K no estócastico de atributos que describen a la empresa operadora j tal y como se presentan al decisor n en el peŕıodo t. Este vector se denota como xnjt ∀j, t y es importante señalar que también puede incluir variables que caracterizan al decisor. Asimismo, el investigador puede especificar en cada peŕıodo una función que relacione las variables observadas con la utilidad que percibe el decisor. Esta función se denota como Vnjt = V (xnjt), ∀j, t, y suele llamarse utilidad representativa (Train, 2009). 5 CAPÍTULO 2. MODELOS DE ELECCIÓN DISCRETA 6 2.2. Derivación de las probabilidades de elección Dado que existen aspectos de la utilidad que el investigador no observa o no puede observar, Vnjt 6= Unjt, se puede descomponer la utilidad como Unjt = Vnjt + εnjt, donde εnjt captura los factores que afectan a la utilidad, pero no están incluidos en la parte determińıstica Vnjt. Según Train (2009), esta descomposición es totalmente general, ya que εnjt se define simplemente como la diferencia entre la verdadera utilidad Unjt y la parte de la utilidad que el investigador captura en Vnjt . El investigador no conoce εnjt ∀j, t, y por lo tanto trata estos términos como variables aleatorias. Dichas variables suelen ser llamados términos de error. La densidad conjunta del vector de errores en el peŕıodo t, εnt = (εn1t, ..., εnJt), es etiquetada como f(εnt). Conociendo esta densidad, el investigador puede hacer afirmaciones probabiĺısticas acerca de la elección de proveedor de servicio de telefońıa móvil que toma el decisor. Aśı, la probabilidad que el decisor n elija en el periodo de decisión t a la alternativa ynt es Pnt(ynt) = P (Unyntt > Unjt, ∀j 6= ynt) = P (Vnyntt + εnyntt > Vnjt + εnjt, ∀j 6= ynt) = P (εnjt − εnyntt < Vnyntt − Vnjt, ∀j 6= ynt) Esta probabilidad es una distribución acumulativa, es decir, es la probabilidad de que cada término aleatorio εnjt− εnyntt esté por debajo de la cantidad observada Vnyntt−Vnjt. Usando la densidad f(εnt) la probabilidad acumulada de elegir ynt en la situación de elección t puede ser escrita como Pnt(ynt) = P∫ (εnjt − εnyntt < Vnyntt − Vnjt, ∀j =6 ynt) = I(εnjt − εnyntt < Vnyntt − Vnjt, ∀j 6= ynt)f(εnt)dεnt εnt donde I(·) es una función indicadora, igual a 1 cuando la expresión entre paréntesis es ver- dadera y cero en caso contrario. Esta expresión es una integral multidimensional, sobre la densidad de probabilidad de la parte no observada de la utilidad, f(εnt). Diferentes modelos de elección discreta se obtienen mediante especificaciones diferentes de esta densidad, es de- cir, a partir de diferentes supuestos acerca de cómo se distribuye la densidad de probabilidad de la parte no observada de la utilidad. La integral tiene una forma cerrada sólo para ciertas especificaciones de f(·). En particular, el modelo logit estándar tienen una expresión cerrada para esta integral. Caṕıtulo 3 Modelo Logit Estándar La presente sección describe el modelo de logit estándar siguiendo en su mayor parte la exposición que realiza McFadden (1974) y Train (2009) sobre este modelo. 3.1. Especificando una función densidad para el término de error El modelo logit estándar se obtiene suponiendo que cada εnjt se distribuye independien- temente y de forma idénticamente distribuida respecto a n, j y sobre todo, t, de acuerdo a una densidad de probabilidad valor extremo tipo I con parametro de localización igual a cero y parámetro de escala igual a 1. Dicha densidad, también es conocida como la distribución estándar de Gumbel. Aśı, se define la densidad de cada componente no observado de la utilidad en la situación de elección t como f(εnjt) = exp(−εnjt)exp(−exp(−εnjt)), cuya distribución acumulada es F (εnjt) = exp(− exp(−εnjt)) Considerar la distribución de valor extremo para los errores es similar a asumir que los errores se distribuyen normalmente y de forma independiente. La distribución de valor extremo tiene colas ligeramente más gruesas que una distribución normal, lo que implica que permite un comportamiento ligeramente más aberrante que la normal. Por lo general, sin embargo, la diferencia entre errores distribuidos según el valor extremo y según distribuciones normales independientes es indistinguible emṕıricamente (Train, 2009). De hecho, el supuesto clave del modelo no es tanto la forma de la distribución como que los errores sean independientes entre śı. La suposición de que los errores sean independientes unos de otros es muy importante y podŕıa ser visto como restrictiva, ya que implica que el investigador tiene especificado la utilidad representativa (Vnjt) con tal grado de precisión que la parte restante de la utilidad (εnjt) es esencialmente ruido: toda la información necesaria en el proceso de decisión es cap- turada en la forma anaĺıtica de Vnjt, haciendo que el error de una alternativa no proporciona al investigador ninguna información sobre el error de otra alternativa diferente. 7 CAPÍTULO 3. MODELO LOGIT ESTÁNDAR 8 3.2. Probabilidades de elección Siguiendo la aproximación de McFadden (1974), a continuación se derivan las probabili- dades de elección logit. La probabilidad que el usuario n elija en el periodo de decisión t la empresa de telefońıa móvil ynt es Pnt(ynt) = P (Vnyntt + εnyntt > Vnjt + εnjt, ∀j 6= ynt) = P (εnjt < εnyntt + Vnyntt − Vnjt, ∀j 6= ynt) Si εnyntt esta dado, la distribución acumulada para cada εnjt evaluada en εnyntt+Vnyntt−Vnjt es Fεnjt(εnyntt + Vnyntt − Vnjt) = exp(−exp(−(εnyntt + Vnyntt − Vnjt))) Se etiqueta a Pnt(ynt|εnyntt) como el valor de la probabilidad de elección Pnt(ynt) dado el valor de εnyntt. Ya que los εs son independientes entre alternativas, la probabilidad sobre todo j 6= ynt es el producto de todas las distribuciones acumuladas individuales: ∏ Pnt(ynt|εnyntt) = exp(−exp(−(εnyntt + Vnyntt − Vnjt))) j 6=ynt En vista de que εnyntt en realidad no está dado, la probabilidad de elección Pnt(ynt) es la integral de Pnt(ynt|εnyntt) sobre todos los valores de εnyntt ponderados por la densidad descrita para f(εnyntt): ∫  ∏ −(εny t+Vny t−Vnjt) −εny t Pnt(y −e nt nt −εny t −e nt nt) =  e  e nt e dεnyntt j=6 ynt que puede ser reescrito como ∫ +∞  ∏ − −(s+Ve ny t−Vnt njt) −sPnt(ynt) = e  e−se−e ds s=−∞ j=6 ynt donde s = εnyntt. Además, se debe notar que Vnyntt − Vnyntt = 0. Por lo que, agrupando términos en el exponente de e, se tiene ∫ ∏ +∞ − −(s+Ve ny t−Vnt njtP −snt(ynt) =  e  e ds ∫s=−∞ j ∑ +∞ = exp− e−(s+Vnyntt−Vnjt) e−sds ∫s=−∞  j ∑ +∞ = exp−e−s e−(Vnyntt−Vnjt) e−sds s=−∞ j Reescribiendo exp(−s) = z, con −exp(−s)ds = dz: CAPÍTULO 3. MODELO LOGIT ESTÁNDAR 9 ∫ 0 ∑  Pnt(ynt) = exp−z e−(Vnyntt−Vnjt) (−dz) ∫∞  ∑j ∞= exp −z e−(Vnyntt−Vnjt) dz 0 ( ∑ j ) exp −∑z e−(Vny t−Vnjt) ∣ntj ∣= ∣∞ − e−(Vny ∣ntt−Vnjt) ∑ j 0 1 = e− ) (Vnyntt−Vnjt j ∑eVnyntt= Vnjt j e La utilidad representativa suele especificarse de forma que sea lineal en relación a los parámetros: V ′njt = β xnjt, donde xnjt es el vector no estócastico observable mencionado en el Caṕıtulo 2 y, que, dado el planteamiento de la presente tesis, incluirá la variable independiente proxy de los efectos de red. Con esta especificación, la probabilidad de que el consumidor n elija a la empresa operadora ynt se convierte en ∑β′e xnynttPnt(ynt) = β′xnjt j e que es la probabilidad de elección del modelo logit estándar para el periodo de decisión t. El hecho de que las probabilidades de elección se expresan en una forma cerrada es una de las mayores ventajas de logit frente a otros modelos de elección discreta, como el probit. En este sentido, las probabilidades de elección logit son rapidamente calculadas y esto es beneficioso cuando se realiza estimaciones basadas en simulación. Además, McFadden (1974) demostró que la función logaritmo de la verosimilitud (log-verosimilitud o log-likelihood) con estas probabilidades de elección, es globalmente cóncava respecto a los parámetros β. Ahora bien, la última probabilidad también se puede reexpresar como ∏J (P (y ))dyntnt nt ynt=1 donde dynt = 1 si el consumidor n eligió la opción ynt en el periodo t y cero en caso contrario. Luego, si se tiene una muestra de N usuarios cuyas elecciones de proveedor de telefońıa móvil fueron observadas durante T peŕıodos, la función de verosimilitud de la muestra o - dicho de otro modo - la probabilidad de que cada persona de la muestra haya elegido la alternativa que realmente se ha observado que eligió, dado que los ε’s también son independientes entre decisores y peŕıodos de elección, es ∏N ∏T ∏J [P dyntnt(ynt)] n=1 t=1 ynt=1 Caṕıtulo 4 Modelo Logit Mixto (MLX) La siguiente sección describe el modelo de comportamiento MLX y el enfoque bayesiano para estimar el MLX. Es importante señalar que esta sección se basa en gran parte en Mc- Fadden y Train (2000), Train (2001 y 2009), Huber y Train (2001), y Train y Sonnier (2005). 4.1. Especificación del Comportamiento El modelo logit mixto parte de reespecificar la utilidad que recibe el consumidor n de la empresa operadora j en el peŕıodo de elección t, de la siguiente forma: ′ Unjt = βnxnjt + εnjt, donde nuevamente xnjt es un vector 1 × K no estocástico de variables observables que in- cluyen la covariable de los efectos de red, o, en términos generales, xnjt contiene variables independientes relacionadas al proveedor de servicio de telefońıa móvil j o al decisor n en el tiempo t. Por su parte, εnjt es el término de error cuya función de densidad es de valor extremo tipo I los cuales se asumen son independientes e identicamente distribuidos. Sin embargo, ahora βn es un vector de coeficientes que representa la influencia espećıfica de xnjt sobre las preferencias del usuario n. Aśı, estos coeficientes vaŕıan entre decisores y el investigador puede especificar una densidad para βn que describa la distribución de estos parámetros en la población, con un vector de medias b y matriz de covarianzas W . Con ello, esta especificación es igual a la de un modelo logit estándar, excepto que los βs vaŕıan entre consumidores en lugar de ser fijos, y hace que el MLX se caracterize como un modelo de coefi- cientes aleatorios. Seguidamente, se plantea que el decisor conoce el valor de su propia βn y de las εnjt para cualquier opción j, y elige la alternativa ynt siempre que Unyntt > Unjt, ∀j 6= ynt. 4.2. Probabilidades de elección El investigador observa las xnjt pero no los βn’s o los εnjt’s. Si el investigador observase las βn’s, entonces la probabilidad de elección en el periodo t seŕıa la del modelo logit estándar, ya que los εnjts son valor extremo independientes e identicamente distribuidos. Es decir, la probabilidad de elegir a ynt condicionada sobre βn es ′ eβnxnyntt L(ynt|βn) = ∑J ′eβnxnjtj=1 10 CAPÍTULO 4. MODELO LOGIT MIXTO (MLX) 11 Si definimos la secuencia de elecciones concretas de la persona n como yn = {yn1, ..., ynT }, la probabilidad de las alternativas elegidas por el consumidor n, condicionado a βn, es ∏T ∑ ′eβnxnynttL(yn|βn) = J β′nxnjt t=1 j=1 e No obstante, el investigador desconoce los βns y por ende no puede condicionar sobre βn. En este sentido, la probabilidad de elección incondicionada es la integral de L(yn|βn) sobre todos los posibles valores de βn: ∫ Pn(yn|b,W ) = L(yn|βn)f(βn|b,W )dβn que es la probabilidad de elección del modelo logit mixto. En la literatura económica o de marketing, la distribución de los parámetros f(βn|b,W ) se suele especificar como Normal: β v N(b,W ) (Hall et al., 2006; Johnson et al., 2000; King et al., 2007; Lancsar et al., 2007; Negŕın et al., 2008). Empero, otros trabajos han utilizado la distribución log normal, lnβ v N(b,W ) (Train, 1998), la distribución uniforme (Revelt y Train, 2000), distribución triangular (Revelt y Train, 2000), distribución SB de Johnson (Train y Sonnier, 2005), y una distribución normal censurado por debajo en cero (Bhat, 2000). Los coeficientes también se pueden especificar como fijos; es decir, que no vaŕıan en la población. Por su parte, la función de verosimilitud para la muestra de consumidores de tamaño N , dada la independencia de los errores entre decisores, es ∏N Pn(yn|b,W ) n=1 4.3. Aproximación Bayesiana para el MLX Dado los fines del presente trabajo, más que la estimación de las probabilidad de elección Pn, se busca la estimación de la distribución posteriori de b y W , ya que la cuantificación de b y W es sustancial para analizar la importancia y la heterogeneidad, respectivamente, de los efectos de red sobre la elección de compañia de telefońıa móvil. La distribución posteriori de b y W , se denota como K(·) y es por definición proporcional a la distribución a priori de b y W , k(b,W ), multiplicado por la la función de verosimilitud del modelo logit mixto: ∏N K(b,W |Y ) ∝ Pn(yn|b,W )k(b,W ) n=1 donde Y = (y1, ..., yN ) representa las elecciones de los decisores de toda la muestra. Resulta posible simular valores de K(b,W |Y ) utilizando el algoritmo Metropolis-Hastings CAPÍTULO 4. MODELO LOGIT MIXTO (MLX) 12 (MH). Sin embargo, por cada iteración de este algoritmo, seŕıa necesario calcular Pn(yn|b,W ) que contiene una integral no cerrada que tamb́ıen debe ser simulada. Para sortear esta restric- ción, el algoritmo MH debe combinarse con el algoritmo de muestreo de Gibbs. El muestreo de Gibbs implica la estimación de una secuencia de simulaciones en donde cada simulación de un parámetro es estimada condicionada sobre los demás parámetros en el modelo (en una forma jerárquica). Para ello, se debe tener en cuenta que βn es un parámetro más junto a b y W . Aśı, la distribución posteriori de b, W y β = (β1, ..., βn) T es ∏N K(b,W,β|Y ) ∝ Ln(yn|βn)f(βn|b,W )k(b,W ) n=1 Antes de describir los pasos en detalle, se enunciarán dos lemas útiles para este desarrollo1: Lema 1 (Priori conjugada para una normal multivariada con media desconocida, pero varianza conocida). Si se tiene un vector aleatorio β de dimensión K × 1 que sigue una distribución normal, con vector de medias desconocido b y matriz de covarianzas conocida W , β ∼ N∑(b,W ), y se tiene una muestra aleatoria βn(n = 1, ..., N) de N(b,W ), donde β = (1/N) Nn=1 βn es la media muestral. Si la distribución a priori de b es normal, con vector de medias b0 y matriz de covarianzas W0, b ∼ N(b0,W0), cuya varianza tiende a infinito, entonces la distribución a posteriori de b es normal, con vector de medias β y matriz de covarianzas W/N , b ∼ N(β,W/N). Lema 2: (Priori conjugada para una normal multivariada con media conocida, pero va- rianza desconocida). Si se tiene un vector aleatorio β de dimensión K × 1 que sigue una distribución normal, con vector de medias conocido b y matriz de covarianzas desconocida W , β ∼ N(∑b,W ), y se tiene una muestra aleatoria βn(n = 1, ..., N) de N(b,W ), dondeN − − ′S = (1/N) n=1(βn b)(βn b) es la varianza alrededor de la media conocida b. Si la distribución a priori de W es wishart invertida con K grados de libertad y matriz esca- lar I (I es la matriz identidad), W ∼ IW (K,KI), entonces la distribución a posteriori (KI +NS) de W es (wishart invertida, co)n K + N grados de libertad y matriz escalar ,K +N ∼ (KI +NS)W IW K +N, . K +N Luego, asumiendo que la distribución a priori de k(b, w) = k(b)k(W ), donde k(b) ∼ N(b0,W0) con una varianza que tiende a infinito, k(W ) ∼ IW (K,KI) y βn ∼ N(b,W ). A continuación se detalla el muestreo de Gibbs para los tres conjuntos de parámetros b, W y β. (1) b|W,β. En este paso se condiciona respecto a W y a los βns de cada persona, lo que significa que se trata a estos parámetros como si se conocieran. Aśı, los βns constituyen una muestra de N realizaciones de una distribución normal con media desconocida b y varianza W 1Una prueba del cumplimiento de estos lemas se muestra en las páginas 13 y 14. CAPÍTULO 4. MODELO LOGIT MIXTO (MLX) 13 conocida. La probabilidad de observar la muestra β dado b y W es ∏N [ ] p(β|b,W ) = (2π)−K/2 |W |−1/2 ′ exp −1 (β − b) W−1n (βn − b) 2 n=1 [ ∑ ]N = (2π)−NK/2 ′ |W |−N/2 1exp −1[− (βn − b) W (βn − b)2 n∑=1N [ ]] = (2π)−NK/2 |W |−N/2 1exp − tr W−1 ′ [ (βn − b) (βn − b)2 n=(1 ∑ )]N1 ′ = (2π)−NK/2 |W |−N/2 exp − tr W−1 (βn − b) (βn − b) , 2 n=1 donde la expresión “tr” que se encuentra dentro de los corchetes indica el operador traza. Asimismo, cabe señalar que la expresión dentro de los paréntesis puede ser reex- presada de la siguiente forma ∑N ′ ′ ∑N ′ (βn − b)(βn − b) = S +N(β − b)(β − b) ,donde S = (βn − β)(βn − β) n=1 n=1 Considerando esta reexpresión, se puede escribir p(β|b,W ) como [ ] | 1 ′p(β b,W ) = (2π)−NK/2 |W |−N/2 exp − tr(W−1[S +N(β − b)(β − b) 2 Ahora, dado que W es conocido, y que la distribución a priori de b es N(b0,W0) se obtiene [ ] p(b|W,β) ∝ 1exp[− (b− ′ b ) W−10 0 (b− b0)2 ] × 1 ′exp [− tr(W−1[S +N(β − b)(β − b) ])2 ] ∝ −1 ′ ′exp ((b− b0) W−10 (b− b0) + (b− β) (NW −1)(b− β)) 2 Dando la forma cuadratica en b ′ (b− b −10) W0 (b− ′ b0) + (b− β) (NW−1)(b− β) ′ ′ = (b−b) (W−10 +NW −1)(b−b)+(b0−β) [W−1(W−1 −1 −10 0 +NW ) NW −1](b0−β), donde b = (W−1 +NW−1)−1(W−10 0 b0 +NW −1β). Luego, si se simplifica la distribución posteriori de p(b|W,β) de la siguiente forma [ ] 1 ′ p(b|W,β) ∝ exp − (b− b) (W−1 −1 2 0 +NW )(b− b) se puede reconocer inmediatamente que esta última expresión es la función de densidad CAPÍTULO 4. MODELO LOGIT MIXTO (MLX) 14 de una distribución normal multivariada. Por lo tanto, b|W,β ∼ N(b, [W−1 −1 −10 +NW ] ) Ahora, ya que se consideró que la distribución a priori de b es N(b0,W0) con una varianza que tiende a infinito. Entonces, W0 → ∞ ⇒ W−10 → 0, lo que nos lleva de inmediato al cumplimiento del lema 1: ( ) W b|W,β ∼ N β, N (2) W |b,β. En este caso, los βns constituyen una muestra de una distribución normal con media b conocida y varianza W desconocida. Entonces, si se considera la probabilidad p(b|W,β) y la distribución a priori de W , IW[(v0, v0S0), la distr]ibución a posteriori de W es: 1 p(W |b,β) ∝ [|W |−(v0+K+1)/(2 exp − tr(v0S0W−1)2 )] × |W |−N/2 −1 ′exp tr([S[+N(β − b)(β − b) ]W−1)2 ] ∝ |W |−(v0+N+K+1)/2 1 ′exp [− tr([v0S0 + S +N(β −] b)(β − b) ]W−1)2 ∝ |W |−(v0+N+K+1)/2 1e[xp − tr([v0S +]NS]W−10 )2 ∝ |W |−(v1+K+1)/2 exp −1 tr(v1S −11W ) . 2 Esta última expresión representa la función de densidad de una distribución Wishart invertida IW (v1, v1S1), donde v0S0 +NS v1 = v0 +N S1 = v0 +N No obstante, la distribución a priori de W se definió como IW (K,KI) y no como IW (v0, v0S0), por lo que procediendo con la equivalencia de parametros, se tiene el inmediato cumplimiento del lema 2: la distribución a posteriori de W es una Wishart invertida co∑n K+N grados de libertad y matriz de escala (KI+NS)/(K+N), donde′ S = (1/N) Nn=1(βn − b)(βn − b) es la varianza muestral de las βns alrededor de la media conocida b. (3) βn|b,W . La distribución a posteriori de los βn de cada persona, condicionada respecto a sus elecciones y a los parámetros de la población, es K(βn|b,W, yn) ∝ Ln(yn|βn)φ(βn|b,W ) CAPÍTULO 4. MODELO LOGIT MIXTO (MLX) 15 Para extraer valores al azar de esta distribución posteriori se utilizá el algoritmo MH. Aśı, para cada βin el algoritmo MH opera de la siguente forma: (a) Se comienza con un valor inicial βin. (b) Se extrae K valores independientes de una densidad normal estándar, y se agrupan los valores en un vector etiquetado como ηi. (c) Se crea un valor de prueba de βi+1 como β̃i+1 = βin n n + ρLη i, donde ρ es un escalar especificado por el investigador y L es el factor Choleski de W . Se debe tener en cuenta que la distribución propuesta del algoritmo MH se especifica como normal con media cero y varianza ρ2W . (d) Se extrae un valor de una variable uniforme estándar µi+1. (e) Se calcula el ratio: L(y |β̃i+1n n )φ(β̃i+1n |b,W )F = L(yn|β̃in)φ(β̃in|b,W ) (f) Si µi+1 ≤ F , se acepta β̃i+1n y se define βi+1 = β̃i+1n n . Si µi+1 > F , se rechaza βi+1n y se deja βi+1 in = βn. (g) Se repite el proceso varias veces. Para un i suficientemente alto, βin es un valor extráıdo al azar de la distribución a posteriori. En el algoritmo MH, el escalar ρ es especificado por el investigador. Este escalar de- termina el tamaño de cada salto dentro de la distribución. Usualmente, saltos más pequeños se trasladan en más aceptaciones, y saltos más grandes resultan en pocas aceptaciones. Sin embargo, usar saltos pequeños implica que el algoritmo MH necesi- tará más iteraciones para converger e involucra más correlación serial en la muestra despues de la convergencia. La tasa de aceptación óptima para el algoritmo MH es de aproximadamente 0.44 cuando K = 1 y cae hasta 0.23 cuando K se eleva (vease Gelman et al. (1995, p. 335) para mayor detalle). En este sentido, el valor de ρ puede ser ajustado por el investigador para lograr una tasa de aceptación entorno a estos valores, bajando ρ para obtener una tasa de aceptación mayor y elevándolo para obtener una tasa de aceptación menor. De hecho, ρ se puede ajustar como parte del proceso de iteración. El investigador es- tablece el valor inicial de ρ. En cada iteración, un valor de prueba de βn es aceptado o rechazado para cada muestra n. Si en una iteración, la tasa de aceptación entre las N observaciones es superior a un valor dado (por ejemplo, 0.33), entonces, ρ se eleva. Si la tasa de aceptación está por debajo de este valor, ρ se baja. Por tal, el valor de ρ puede moverse durante el proceso de iteración para alcanzar el nivel de aceptación especificado (Train, 2009). Enunciando nuevamente pero de forma más concisa el procedimiento de estimación, el algoritmo comienza con valores iniciales de b0, W 0, y β0n. Luego, la i-ésima iteración del muestreo de Gibbs puede ser estimada en 3 pasos: CAPÍTULO 4. MODELO LOGIT MIXTO (MLX) 16 i−1 i−1 Extraer bi de N(β ,W i−1/N) donde β es la media de βi−1n i−1 i−1 ∑ Extraer W i de IW (K+N, (KI+NS )/(K+N)), donde S = (βi−1n n −bi)(βi−1n − bi ′ ) /N Para cada muestra n, extraer βin usando una iteración del algoritmo MH descrito an- teriormente, empezando por βi−1n y usando la densidad φ(βn|bi,W i). Estos tres pasos se repiten para muchas iteraciones. Los valores resultantes convergen a va- lores extráıdos de la distribución posteriori conjunta de b, W y β. Una vez se obtienen los valores convergentes de la distribución posteriori, se puede calcular la media y la desvia- ción estándar de los valores extráıdos para obtener estimaciones y errores estándar de los parámetros. Caṕıtulo 5 Aplicación 5.1. Base de datos y medición de las variables de investigación De acuerdo al planteamiento de la presente tesis, se necesita incluir las externalidades de red como parte del vector de variables observables, xnjt, y poder aśı obtener la media (b) y la desviación estándar (σ) asociada a la distribución del coeficiente. La aproximación de los efectos de red dentro del logit mixto, se realizó utilizando la cuota de mercado de la empresa operadora j en el peŕıodo t. Asimismo, los trabajos anteriores han incluido al precio como otro factor coadyuvante en la contratación del servicio de telefońıa móvil y lo han aproximado por el ARPU (ingreso promedio reportado por las empresas operadoras entre el número de ĺıneas en servicio). Sin embargo, dado que en el presente caso la información del ARPU no es pública, se utilizó el gasto mensual que declararón tener los consumidores e una encuesta. Aśı, la base de datos que se dispone combina información de las empresas de telefońıa móvil y de los clientes. La información sobre el número de ĺıneas en servicio (total de sus- criptores) de cada empresa operadora procede de los reportes administrativos publicados en la página institucional del OSIPTEL, mientras que los datos sobre la elección de los usua- rios del servicio de telefońıa móvil y el gasto asociado al servicio provienen de la Encuesta Residencial de Servicios de Telecomunicaciones (ERESTEL) del año 2015, y que también se encuentra disponible en la web del OSIPTEL. La ERESTEL permite recoger información de los servicios de telecomunicaciones (tele- fońıa fija y móvil, internet fijo y móvil, televisión de paga y telefońıa de uso público) en términos de la demanda de acceso y uso de dichos servicios en el sector residencial (hogares y sus miembros). Asimismo, contiene información sobre las caracteŕısticas demográficas y socioeconómicas de los encuestados. Por otra parte, es importante mencionar, que si bien en sus inicios la ERESTEL fue concebida como una base del tipo corte transversal, es a partir del año 2013 que se determinó que parte de la muestra global sea elegida para un seguimiento longitudinal cuyo cierre está programado para el año 2017. Por lo que actualmente, se cuen- tan con 3 olas panel correspondiente al periodo 2013 - 2015, que aún no son de acceso público. La ERESTEL 2015 entrevistó a 55323 miembros del hogar, cuya edad van desde infantes hasta adultos mayores, y donde naturalmente no todas las personas cuentan con un celular o tienen el servicio de telefońıa móvil. En este sentido, fue necesario aplicar una serie de filtros 17 CAPÍTULO 5. APLICACIÓN 18 a la muestra potencial de la ERESTEL y aśı tener una muestra de interés para el presente trabajo. Al respecto, es conveniente señalar que en general la estimación bayesiana presenta limitaciones de caracter computacional para trabajar con muestras bastantes grandes, por lo que se hace necesario en algunos casos acotar las bases de datos. Aśı pues, los criterios para la elección de los individuos que conformaron la muestra de anaĺısis fueron los siguientes: La persona debe ubicarse en Lima Metropolitana. Esto a fin de reducir los problemas de contratación con una empresa operadora por falta de cobertura o disponibilidad del servicio al interior del páıs. La persona debe poseer un teléfono móvil. La persona debe tener una edad de 18 a 64 años. La persona debe ser el único responsable del pago de su servicio de telefońıa móvil. La modalidad de contratación del servicio de telefońıa móvil es postpago o control. El hogar de la persona debe pertenecer al nivel socieconómico C. La persona declaró el último gasto mensual en su servicio de telefońıa móvil. Con estos filtros, la muestra utilizada para los fines del presente trabajo es de 615 indi- viduos. Ahora b́ıen, un aspecto importante en la construcción de la base de datos para la estimación del logit mixto es aproximar o construir los escenarios contrafactuales que dan respuesta a la siguiente pregunta: ¿Cuánto hubiera sido el precio que pagaba un consumi- dor si contrataba con el operador s en lugar del j en el peŕıodo t?. Para ello, se imputó el gasto medio que declararón tener los consumidores en cada empresa operadora del servicio de telefońıa móvil. Este promedio se calculo considerando al total de usuarios de Lima Me- tropolitana que declararón tener el servicio de telefońıa móvil bajo la modalidad postpago o control. En el caso de la covariable asociada a los efectos de red, la cuota de mercado de las empresas operadoras se calculó teniendo en cuenta el promedio de lineas móviles en servicio de cada empresa operadora durante el año 2015. El Cuadro 5.1 resume la estrateǵıa de aproximación de las variables que intervienen en el modelamiento. Cuadro 5.1: Medición de las Variables introducidas en el Modelo Variable Definición Efecto Esperado Variable dummy que representa la elección efectuada por el individuo: Utilidad Unjt 1 =el consumidor n elige la empresa operadora j en el peŕıodo t. 0 =en caso contrario. Logaritmo natural del gasto del usuario en Precio Pnjt Negativola empresa j en el peŕıodo t. Participación de mercado del número de Efectos de red CNnjt ĺıneas en servicio de la empresa operadora Positivoclásicos j en el peŕıodo t, expresado en porcentaje. CAPÍTULO 5. APLICACIÓN 19 5.2. Resultados de la investigación El análisis de regresión se realizó con el modelo logit mixto bajo la aproximación baye- siana, el cual fue descrita en el Caṕıtulo 4, y cuya función de utilidad considerando la base de datos y las variables utilizadas, toma la siguiente forma: U = βPP + βCNnjt n njt n CNnjt + εnjt; t = 1, j = 1, 2, 3, 4. Las estimaciones se obtuvieron utilizando un código de simulación propio, que fue desa- rrollado en el software para el análisis estad́ıstico R. Dicho código se basó en el procedimiento presentado en Train (2009, pág. 301-302) y que fue expuesto en el Caṕıtulo 4. En la esti- mación, se especificó un total de 160.000 simulaciones, de las cuales las 10.000 primeras iteraciones se destinaron para la fase de burn-in (quemado), y de las 150.000 restantes se conservaron uno de cada trecientos (thin). Esto, para obtener los resúmenes estad́ısticos de los parámetros de interés 1. Los valores iniciales para el vector de medias b se obtuvieron a partir de la regresión logit condicional (logit estándar), mientras que para la matriz de covarianzas W se partió de una matriz identidad (I). Luego, esta matriz I y el vector de medias mencionado, fueron empleados para generar los valores iniciales de los βs individua- les por medio de una distribución normal multivariada. Asimismo, el parámetro ρ se fijo en 2.608 (redondeado a 3 decimales) y se creó un contador para registrar la tasa de aceptación obtenida luego de terminada la simulación. Mayores detalles sobre el código de estimación pueden encontrarse en el Apéndice A. Los resultados del procedimiento bayesiano del modelo logit mixto se presentan en el Cuadro 5.2. Dicho cuadro muestra la siguiente información: (1) En la primera columna se encuentran los coeficientes asociados a las covariables consideradas en la función de utilidad, (2) en la segunda columna se tiene el parámetro de la media y la desviación estándar co- rrespondiente a cada coeficiente, (3) en la tercera columna se muestra la estimación de la media por parámetro, en tanto que en la (4 )cuarta columna se encuentra el valor obtenido de su desviación estándar. Por último, (5) en la quinta y (6) sexta columna se presenta los ĺımites del intervalo de credibilidad (ICr) formado por los cuantiles 0.025 (ĺımite inferior o LI) y 0.975 (ĺımite superior o LS) de la muestra simulada (Albert, 2009; pág. 64-65). Cabe señalar, que el ICr permite evaluar la relevancia estad́ıstica de los parámetros. Aśı, cuando dentro del ICr de la media simulada se encuentra el cero (0), este parámetro se considerá como estadisticamente no significativo y el anaĺısis de su dispersión pierde relevancia. 1Saltos de 300 permitieron asegurar que las cadenas simuladadas no tuvieran problemas de autocorrelación de orden mayor a 1 o 2, aunque es importante mencionar que saltos de 100 solo generarón autocorrelaciones que van descendiendo hasta el orden 5, para luego no ser significativas CAPÍTULO 5. APLICACIÓN 20 Cuadro 5.2: Resultados de la Estimación Parámetros Error Coeficiente Media LI LS de la distribución Estándar P Media de la disribución (b P ) −0,648 0,090 −0,819 −0,476 βn Desv. est. de la disribución (σP ) 0,413 0,077 0,288 0,590 CN Media de la disribución (b CN ) 0,090 0,010 0,071 0,110 βn Desv. est. de la disribución (σCN ) 0,170 0,014 0,148 0,198 La tasa de aceptación obtenida fue de 0,249 y se encuentra dentro del rango óptimo señalado por Gelman et al. (1995, p. 335). Los resultados muestran que el impacto sobre la utilidad asociado a los efectos de red (βCNn ) presenta una media positiva (b CN = 0,090) y es- tad́ısticamente relevente (su ICr no contiene al 0). Ello significa que el tamaño de la empresa operadora es un factor importante para el consumidor cuando decide elegir una compañia de telefońıa móvil ya que su nivel de bienestar o utilidad tiene un incremento estad́ısticamen- te importante. Aśı, los operadores de mayor cuota de mercado -que usulmente son los que llevan más tiempo operando en la industria- pueden direccionar por defecto las decisiones de contratación de los consumidores hacia sus redes, afectando la captación de clientes de nuevos entrantes o competidores, mermando la desconcentración del mercado. En cuanto a la heterogeneidad de los impactos de las externalidades de red, se registró que el incremento de utilidad que supone la elección de un operador de mayor tamaño no es identica para todos los individuos, sino que existen diferencias estad́ısticamente relevantes que ponen de manifiesto cierta diversidad en la influncia de las externalidades de red sobre los consumidores; lo cual queda reflejado a través de la desviación estándar de βCN (σCNn = 0,170). Aśı pues, la Figura 5.1 presenta la distribución estimada de los βCNn para los individuos de la muestra bajo estudio, donde se puede apreciar que para la gran mayoŕıa de consumidores el tamaño del proveedor de telefońıa móvil implica un aumento de su utilidad en alrededor de 0,23. Sin embargo, existen grupos minoritarios de consumidores donde este efecto puede llegar a cambiar, siendo negativa en algunos casos (entorno a −0,05) o con una influencia positiva leve (entorno a 0,07). Esta heterogeneidad se manisfiesta a pesar de tener una muestra acotada a un grupo espećıfico de consumidores. CAPÍTULO 5. APLICACIÓN 21 Figura 5.1: Distribución de βCNn en la muestra Naturalmente, otro factor que también se encontro como determinante en la elección de empresa operadora que realizán los consumidores estaŕıa representado por el precio del servicio de telefońıa móvil. Esto, de acuerdo a la estimación de la media (bP = −0,648) co- rrespondiente al coeficiente βPn y su respectivo ICr. Además, este efecto del precio presenta una importante heterogeneidad de acuerdo a la desviación estándar estimada (σP = 0,413) y su ditribución en la muestra de estudio, según se puede observar en la Figura 5.2. Aśı, en algunos consumidores, la influencia del precio puede llegar a ubicarse en −0,9 o reducirse a −0,3. Esta heterogenidad se encuentra, nuevamente, pese a tener una muestra bajo análisis correspondiente a un grupo particular de usuarios del servicio de telefońıa móvil. CAPÍTULO 5. APLICACIÓN 22 Figura 5.2: Distribución de βPn en la muestra Por último, las Figuras 5.3 y 5.4 presentan la función de autocorrelación de la media y la desviación estándar de cada coeficiente estimado, mientras que las Figuras 5.5 y 5.6 muestran la evolución de las cadenas de los valores estimados. Aśı, estos gráficos dan indicios que los valores simulados lograron alcanzar la convergencia y formar una muestra estad́ısticamente independiente. Figura 5.3: Distribución de las correlaciones del vector de medias b en la muestra simulada CAPÍTULO 5. APLICACIÓN 23 Figura 5.4: Distribución de las correlaciones de las desviaciones estándar de la matŕız de covarianzas W en la muestra simulada Figura 5.5: Distribución de la cadena del vector de medias b en la muestra simulada CAPÍTULO 5. APLICACIÓN 24 Figura 5.6: Distribución de la cadena de las desviaciones estándar de la matŕız de covarianzas W en la muestra simulada Caṕıtulo 6 Conclusiones 6.1. Conclusiones Como se señaló en el Caṕıtulo 1, la existencia de efectos de red, al generar una atrac- ción o dependencia en los consumidores por proveedores de mayor cuota de mercado, puede degradar la intensidad competitiva de un mercado, protegiendo la base de clientes de las empresas operadoras de mayor tamaño frente a la competencia de nuevos retadores. Aśı, se generaŕıa una situación donde se consolida el dominio de las empresas ya establecidas y se elimina la competencia efectiva y potencial de nuevos competidores, llevando al mercado a una situación oligopólica donde es dif́ıcil la desconcetración. La presente investigación teńıa por objetivo principal estudiar la magnitud y heteroge- neidad de los efectos de red en el mercado de telefońıa móvil peruano usando un modelo logit mixto bayesiano. Aśı, dado la base de datos utilizada, el peŕıodo de análisis, y la metodoloǵıa y estrategia de estimación empleada, la evidencia emṕırica obtenida permitiŕıa sostener que los efectos de red no solo se encontraŕıan presentes en el mercado de telefońıa móvil peruano, a través de su influencia en la utilidad de los usuarios, sino que también esta influencia re- sultaŕıa tener cierto grado de heterogéneidad entre los consumidores. Esto, pese a que en el presente estudio se utilizo una muestra espećıfica de clientes: usuarios postpago o control del nivel socieconomico C. Dado estos hallazgos, se puede plantear algunas implicaciones de poĺıtica para los dife- rentes agentes económicos, y, en especial, para el organismo regulador. En este sentido, las medidas que ha venido implementando el OSIPTEL en los últimos años a fin de potenciar la competencia en el mercado de telefońıa móvil, tales como el establecimiento de cargos de terminación móvil diferenciados según el tamaño o participación de mercado de las empresas operadoras, se encontraŕıa justificado y debe seguir siendo mejorado y complementado por otras medidas que ayuden a relativizar la influencia de los efectos o externalidades de red. Para ello, seŕıa importante tener en cuenta que la magnitud en que afectan dichas externa- lidades no seŕıa homogénea en todos los usuarios del servicio de telefońıa móvil, sino que existiŕıan diferencias significativas entre ellos. Por ejemplo, se podŕıa argumentar que la propia dinámica competitiva del mercado móvil peruano estaŕıa relativizando la importancia de realizar poĺıticas que fomenten un juego com- 25 CAPÍTULO 6. CONCLUSIONES 26 petitivo más equilibrado, como los cargos móviles diferenciados, ya que se esta observando que cada vez más consumidores estan obtando por elegir operadores de menor cuota de mer- cado, hecho que se reflejaŕıa en la estimación realizada, donde para un grupo de abonados el efecto de las externalidades de red resultó negativo. No obstante, la misma estimación llevada a cabo muestra que para la mayor parte del grupo de análisis aún se prefiere elegir los operadores de tamaño de red grandes: el efecto de las externalidades de red en este grupo es positivo, además de que su magnitud es mayor al grupo donde el efecto es negativo, lo que en neto da una influencia positiva de las externalidades de red sobre la utilidad del consumidor. En este sentido, la poĺıtica del establecimiento de cargos no podŕıa descartarse en el corto plazo. Sin embargo, dicha afirmación no necesariamente se puede mantener en el largo plazo, particularmente, si se considera la creciente inversión que estan realizando los operadores en redes de datos (internet) y el direccionamiento de las preferencias de la demanda hacia servi- cios de voz o mensajeŕıa que se realizan por internet (por ejemplo, el mayor uso de WhatsApp o Skype). 6.2. Sugerencias para investigaciones futuras Este trabajo no está libre de limitaciones, algunas de las cuales pueden servir de punto de partida o referencia para futuros análisis. A continuación, se listán posibles alternativas de mejora o extensiones: Para realizar la estimación se tuvo que recurrir a un procedimiento de imputación sobre el precio que pagaŕıa cada decisor si estuviera en otro operador diferente a su actual proveedor. Asimismo, los efectos de red solo teńıan la variabilidad disponible de la cuota de mercado de las empresas operadoras al 2015. Futuros trabajos, podŕıan construir un experimento de elección considerando la técnica de Conjoint, donde el precio y el número de clientes de cada opción o alternativa de proveedor se defina previamente y vaŕıen en una serie de preguntas hipotéticas donde el consumidor tiene que elegir, dado el precio y la cuota de mercado de la compañia, su operador de telefońıa móvil. No se puede descartar que la estimación de los coeficientes pueda tener un grado de sobre o subestimación como consecuencia de la posible endogeneidad de las variables explicativas en la especificación mostrada, particularmente en el caso del precio. Por ende, trabajos posteriores podŕıan ampliar el modelo logit mixto para incorporar más covariables, reduciendo las posibilidades de sesgo por variables omitidas relevantes, o un método que permita estimar el modelo de elección en presencia de variables explicativas endogenas, como el enfoque basado en la función de control. El modelamiento de la media de los βs ha sido incondicional. Empero, se podŕıa incluir un segundo nivel de análisis, donde la media dependa de ciertas covariables como el nivel socioeconómico, la edad, el género, la modalidad de contratación del servicio de telefońıa móvil, la duración del contrato, la empresa a la que se pertenece, el tiempo con el servicio móvil, etc. CAPÍTULO 6. CONCLUSIONES 27 Las estimaciones obtenidas de la media y la varianza correspondientes a los βs se ob- tuvieron considerando una distribución normal. Nuevas investigaciones, podŕıan con- siderar la modificación de este supuesto y analizar su influencia sobre los resultados finales. El uso del algoritmo de Gibbs para simular la distribućıón posteriori también podŕıa modificarse por algoritmos que tengan otras ventajas comparativas. Por ejemplo, en la reducción del tiempo de estimación o frente a la necesidad de reducir los problemas de autocorrelación o convergencia de las cadenas generadas. En esta ĺınea, futuros trabajos podŕıan realizar la implementación del logit mixto (o sus mejoras) en el software Stan, una herramienta desarrollada recientemente para la inferencia bayesiana en los modelos estad́ısticos y que mejora la calidad de las estimaciones por el algoritmo que utiliza. Los resultados hallados han sido bajo el enfoque de la inferencia bayesiana. No obstante, seŕıa interesante analizar si estos resultados se mantienen bajo la inferencia clásica. La modificación del enlace logistico por uno asimétrico o por una mixtura de funciones es otro aspecto que podŕıa estudiarse. Usar una base longitudinal o panel, donde los consumidores tengan una suficiente ven- tana temporal (minimo 3 años, considerando los plazos de duración contractual) para cambiar o modificar sus procesos de elección de operador móvil mejoraŕıa la robustez de los resultados. Apéndice A Código set . seed (475446) # f i j a l a s e m i l l a d e l random number g e n e r a t o r . ##i n s t a l l . p a c k ag e s (” mvtnorm ”) l ibrary (mvtnorm) # rmvnorm f u n c t i o n ##i n s t a l l . p a c k ag e s (”MCMCpack”) l ibrary (MCMCpack) # r w i s h and r i w i s h f u n c t i o n ##i n s t a l l . p a c k ag e s (” mcmcse ”) l ibrary (mcmcse ) l ibrary ( bayesm ) ########## # Datos # ########## l ibrary ( ” f o r e i g n ” ) base1=read . dta ( ”C: /Users/Paulo Roberto/Desktop/Tes i s/base y do s i s e t /base . dta” ) head ( base1 , n=15) # l a s 15 pr imeras l ı́ n e a s lapply ( base1 , class ) # Toda l a base e s t a en formato número save ( base1 , f i l e=” base1 . Rda” ) head ( base1 , n=6) cho i ce1<−( base1$ cho i c e==1) cho i ce2<−( base1$ cho i c e==2) cho i ce3<−( base1$ cho i c e==3) cho i ce4<−( base1$ cho i c e==4) #Frecuenc ia de l a s e l e c c i o n e s f e=table ( base1$ cho i c e ) N<−nrow( base1 ) #################################### # R e p o s i t o r i o s y Va lore s I n i c i a l e s # #################################### memory . l i m i t ( s i z e = 40000) nsim<−160000 K<−2 be<−matrix (0 , nsim ,K) ; be [ 1 , ]<−c (−1.800999 , .030279) bedoble<−array (0 ,dim=c (K,K, nsim ) ) ; bedoble [ , , 1 ]<−diag (K) beta<−betanew<−array (0 ,dim=c (N,K, nsim ) ) ; beta [ , , 1 ]<−rmvnorm(N, be [ 1 , ] , bedoble [ , , 1 ] ) rho<−2.60831426 counter<−0 ######## # MCMC # ######## for ( t in 2 : nsim ){ # Extrayendo be v<−bedoble [ , , t−1]/N m<−apply (beta [ , , t−1] ,2 ,mean) be [ t , ]<−rmvnorm (1 ,m, v ) # Extrayendo b e d o b l e tmp<−t (beta [ , , t−1])−be [ t , ] bedoble [ , , t ]<−rw i shar t ( K+N, solve (K∗diag (K) + tmp %∗%t (tmp ) ) ) $IW 28 APÉNDICE A. CÓDIGO 29 for (n in 1 :N){ # C a l c u l a l a v e r o s i m i l i t u d basada en e l a n t i g u o v a l o r de b e t a v1 <− log ( base1 [ n , 4 ] ) ∗beta [ n , 1 , t−1] + base1 [ n , 1 2 ]∗beta [ n , 2 , t−1] v2 <− log ( base1 [ n , 5 ] ) ∗beta [ n , 1 , t−1] + base1 [ n , 1 3 ]∗beta [ n , 2 , t−1] v3 <− log ( base1 [ n , 6 ] ) ∗beta [ n , 1 , t−1] + base1 [ n , 1 4 ]∗beta [ n , 2 , t−1] v4 <− log ( base1 [ n , 7 ] ) ∗beta [ n , 1 , t−1] + base1 [ n , 1 5 ]∗beta [ n , 2 , t−1] l o l d <− log ( (exp( v1 ) ∗ cho i ce1 [ n ] + exp( v2 ) ∗ cho i ce2 [ n ] + exp( v3 ) ∗ cho i ce3 [ n ] + exp( v4 ) ∗ cho i ce4 [ n ] ) / ( exp( v1 ) + exp( v2 ) + exp( v3 ) + exp( v4 ) ) ) # Extrayendo c a n d i d a t o s betanew [ n , , t ]<− beta [ n , , t−1] + t ( chol ( rho∗bedoble [ , , t ] ) ) %∗%rnorm(K) # C a l c u l a l a v e r o s i m i l i t u d basada en e l nuevo v a l o r de b e t a v1 <− log ( base1 [ n , 4 ] ) ∗betanew [ n , 1 , t ] + base1 [ n , 1 2 ]∗betanew [ n , 2 , t ] v2 <− log ( base1 [ n , 5 ] ) ∗betanew [ n , 1 , t ] + base1 [ n , 1 3 ]∗betanew [ n , 2 , t ] v3 <− log ( base1 [ n , 6 ] ) ∗betanew [ n , 1 , t ] + base1 [ n , 1 4 ]∗betanew [ n , 2 , t ] v4 <− log ( base1 [ n , 7 ] ) ∗betanew [ n , 1 , t ] + base1 [ n , 1 5 ]∗betanew [ n , 2 , t ] lnew <− log ( (exp( v1 ) ∗ cho i ce1 [ n ] + exp( v2 ) ∗ cho i ce2 [ n ] + exp( v3 ) ∗ cho i ce3 [ n ] + exp( v4 ) ∗ cho i ce4 [ n ] ) / ( exp( v1 ) + exp( v2 ) + exp( v3 ) + exp( v4 ) ) ) # P r o b a b i l i d a d de Aceptac i ón ( en e s c a l a l o g a r i t m i c a ) r <− lnew + dmvnorm( betanew [ n , , t ] , be [ t , ] , bedoble [ , , t ] , log=T) − ( l o l d + dmvnorm(beta [ n , , t−1] , be [ t , ] , bedoble [ , , t ] , log=T) ) i f ( log ( runif (1 ) ) < r ) { beta [ n , , t ]<−betanew [ n , , t ] counter=counter + 1 } else { beta [ n , , t ]<−beta [ n , , t−1] } } i f ( t %2%0==0) print ( t ) } # Fin MCMC accept . r a t e=counter/ ( nsim∗N) #CADENAS SIMULADAS DEL VECTOR b ##Media de l o s e l e m e n t o s d e l v e c t o r b nsim<−160000 burn<−10001 th in<−300 index<−seq (1 , nsim−burn+1, th in ) s t r ( index ) bBpr<−be [ burn : nsim , 1 ] [ index ] bBcn<−be [ burn : nsim , 2 ] [ index ] length ( bBpr ) length (bBcn) mean b=c (mean( bBpr ) , mean(bBcn ) ) ##D e s v i a c i ó n e s t á n d a r de l o s e l e m e n t o s d e l v e c t o r b sd b=c ( sd ( bBpr ) , sd (bBcn ) ) ##I n t e r v a l o s de c r e d i b i l i d a d para l a media de l o s e l e m e n t o s d e l v e c t o r b , basados en q u a n t i l e s qbBpr=quantile (bBpr , c ( . 0 2 5 , . 9 7 5 ) ) qbBcn=quantile (bBcn , c ( . 0 2 5 , . 9 7 5 ) ) #CADENAS SIMULADAS DE LA MATRIZ W varBpr=bedoble [ 1 , 1 , burn : nsim ] [ index ] varBcn=bedoble [ 2 , 2 , burn : nsim ] [ index ] desvBpr=sqrt ( varBpr ) desvBcn=sqrt ( varBcn ) length ( desvBpr ) length ( desvBcn ) ##Media de l a s Var ianzas ( y D e s v i a c i o n Est ándar ) de l a m a t r i z W mean W=c (mean( varBpr ) , mean( varBcn ) ) mean sdW=c (mean( desvBpr ) , mean( desvBcn ) ) ##D e s v i a c i ó n e s t á n d a r de l a s Var ianzas ( y D e s v i a c i o n Est ándar ) de l a m a t r i z W sd W=c ( sd ( varBpr ) , sd ( varBcn ) ) sd sdW=c ( sd ( desvBpr ) , sd ( desvBcn ) ) APÉNDICE A. CÓDIGO 30 ##I n t e r v a l o s de c r e d i b i l i d a d para l a d e s v i a c i ó n e s t á n d a r de l a s d e s v i a c i ó n e s e s t á n d a r ##de l a m a t r i z W qdvBpr=quantile ( desvBpr , c ( . 0 2 5 , . 9 7 5 ) ) qdvBcn=quantile ( desvBcn , c ( . 0 2 5 , . 9 7 5 ) ) #Bs i n d i v i d u a l e s Bpr=apply (beta [ , 1 , seq ( burn , nsim ,by=300) ] ,1 ,mean) Bcn=apply (beta [ , 2 , seq ( burn , nsim ,by=300) ] ,1 ,mean) hist (Bpr , main=NULL) hist (Bcn , main=NULL) #Mostrando l o s r e s u l t a d o s de l a s i m u l a c i ó n : Tasa de a c e p t a c i ó n , medias , d e s v i a c i o n e s e s t á n d a r #e i n t e r v a l o s de c r e d i b i l i d a d accept . r a t e mean b sd b qbBpr qbBcn mean sdW sd sdW qdvBpr qdvBcn #Mostrando l o s r e s u l t a d o s de l a s i m u l a c i ó n : La f u n c i ó n de a u t o c o r r e l a c i ó n par ( mfrow=c ( 1 , 2 ) ) a c f (bBpr , col=2) ac f (bBcn , col=2) par ( mfrow=c ( 1 , 2 ) ) a c f ( desvBpr , col=2) ac f ( desvBcn , col=2) #Mostrando l o s r e s u l t a d o s de l a s i m u l a c i ó n : La cadena par ( mfrow=c ( 1 , 2 ) ) ts . plot (bBpr , col=2) ts . plot (bBcn , col=2) par ( mfrow=c ( 1 , 2 ) ) ts . plot ( desvBpr , col=2) ts . plot ( desvBcn , col=2) save ( accept . rate , be , bedoble , beta , fe , f i l e= ”C: /Users/Paulo Roberto/Desktop/Tes i s/base y do s i s e t /E s p e c i f i c a c i ó n f i n a l /myscript11 160k . rda” ) load ( f i l e= ”C: /Users/Paulo Roberto/Desktop/Tes i s/base y do s i s e t /E s p e c i f i c a c i ó n f i n a l /myscript11 160k . rda” ) Bibliograf́ıa Albert, J. (2009). Bayesian Computation with R. Springer. Baker, M. (2014). Adaptive Markov chain Monte Carlo sampling and estimation in Mata. The Stata Journal, 14(3), 623-661. Balcombe, K., Chalak, A., y Fraser, I. (2009). Model selection for the mixed logit with Bayesian estimation. Journal of Environmental Economics and Management, 57, 226-237. Bhat, C. (2000). Incorporating observed and unobserved heterogeneity in urbanwork travel mode choice modeling. Transportation Science, 34 (2), 228-238. Birke, D., y Swann, G.P.(2006). Network effects and the choice of mobile phone operator. Journal of Evolutionary Economics, 16(1-2), 65-84. Beuermann, D., McKelvey, C., y Sotelo C. (2012). The Effects of Mobile Phone Infrastruc- ture: Evidence from Rural Peru. Documento de Trabajo N◦ 2012-12. BCRP. Czajkowski, M., y Sobolewski, M. (2015). How much do switching costs and local network effects contribute to consumer lock-in in mobile telephony?. Telecommunications Policy. Corrocher, N., y Zirulia, L.(2009).Me and you and everyone we know: an empirical analysis of local network effects in mobile communications. Telecommunications Policy, 33(1), 68?79. Doganoglu, T. y Grzybowski, L. (2007). Estimating network effects in mobile telephony in Germany. Information Economics and Policy, 19(1), 65-79. Farrell, J., y Klemperer, P. (2007). Coordination and lock-in: competition with switching costs and network effects. En M. Armostrong, y R.Porter (Eds.), Handbook of industrial organisation (pp. 1967-2072). Elsvier: Elsvier, 2007. Fu, W.W. (2004).Termination-discriminatory pricing, subscriber bandwagons, and network traffic patterns: the Taiwanese mobile phone market. Telecommunications Policy, 28(1), 5- 22. Hall, J., Fiebig, D.G., King, M.T., Hossain, I., y Louviere, J.J. (2006). What influences participation in genetic carrier testing? Results from a discrete choice experiment. Journal of Health Economics, 25(3), 520-537. Huber, J., y Train, K. (2001). On the Similarity of Classical and Bayesian Estimates of Individual Mean Partworths. Marketing Letters, 12(3), 259-269. 31 BIBLIOGRAFÍA 32 Johnson, F.R., Banzhaf, M.R., y Desvousges, W.H. (2000). Willingness to pay for improved respiratory and cardiovascular health: a multiple-format, stated-preference approach. Health Economics, 9(4), 295-317. Karaçuka, M., Çatik, A.N., y Haucap, J.(2013). Consumer choice and local network effects in mobile telecommunications in Turkey. Telecommunications Policy, 37(4), 334-344. Katz, M., y Shapiro, C. (1985).Networks externalities, competition, and compatibility. The American Economic Review, 75(3), 424-440. Katz, M., y Shapiro, C. (1994).Systems competition and network effects. Journal of Economic Perspectives, 8(2), 93-115. Klemperer, P. (1995). Competition when consumers have switching costs: an overview with applications to industrial organization, macroeconomics, and international trade. The Re- view of Economic Studies, 4, 515. Kim, H.S., y Kwon, N. (2003). The advantage of network size in acquiring new subscribers: a conditional logit analysis of the Kore an mobile telephony market. Information Economics and Policy, 15(1), 17-33. King, M.T., Hall, J., Lancsar, E., Fiebig, D. Hossain, I., Louviere, J., Reddel, H.K., y Jenkins, C.R. (2007). Patient preferences for managing asthma: results from a discrete choice experiment. Health Economics, 16 (7), 703-717. Lancsar, E., Hall, J.P., Kennny, P., Louviere, J.J., Fiebig, D.G., Hossain, I., Thien, F.C., Reddel, H.K., y Jenkins, C.R. (2007). Using discrete choice experiments to investigate subject preferences for preventive asthma medication. Respirology, 12(1), 127-136. Maicas, J.P., Polo, Y., y Sese, F.J. (2009). The role of (personal) network effects and swit- ching costs in determining mobile users’ choice. Journal of Information Technology, 24(2), 160-171. Maicas, J.P., Polo, Y., y Sese, F.J. (2010). El Papel de los efectos de red y los costos de cambio en la elección de la compañ́ıa de telefońıa móvil. Revista Europea de Dirección y Economı́a de la Empresa, vol. 19, núm 3, pp. 161-172. Maicas, J.P., y Sese, F.J. (2011). Network effects in the mobile communications industry: an overview. In Máıcas Juan P.(Ed.), Recent Developments in the Mobile Communications Industry: A Multidisciplinary Approach (pp. 131-140). Crotia: In Tech. Marschak, J. (1960). Binary choice constraints on random utility indications. in K. Arrow, ed., Stanford Symposium on Mathematical Methods in the Social Sciences, Stanford Uni- versity Press, Stanford, CA, pp. 312-329. McFadden, D. (1974). Conditional logit analysis of qualitative choice behavior. in P. Za- rembka, ed., Frontiers in Econometrics, Academic Press, New York, pp. 105-142. BIBLIOGRAFÍA 33 McFadden, D., y Train, K. (2000). Mixed MNL models for discrete response. Journal of Applied Econometrics, 15(5), 447-470. Negrin, M.A., Pinilla, J., y León, C.J. (2008). Willingness to pay for alternative policies for patients with Alzheimer?s Disease. Health Economics, Policy and Law 3 (Pt 3), 257-275. Regiera, D., Ryanb, M., Phimister, E., y Marrad, C. (2009).Bayesian and classical estima- tion of mixed logit: An application to genetic testing. Journal of Health Economics, 598-610. Revelt, D., y Train, K. (2000). Specific taste parameters and mixed logit.Working paper, Department of Economics, University of California, Berkeley. Rust,R., y Verhoef, P. (2005).Optimizing the Marketing Interventions Mix in Intermediate- Term CRM. Marketing Science, 24(3), 477?489. Shy, O. (2001). The Economics of Network Industries. Cambridge University Press. Sobolewski, M., y Czajkowski, M. (2012). Network effects and preference heterogeneity in the case of mobile telecommunications markets. Telecommunications Policy, 36(3), 197-211. Ocaña, C., Polo, F., y Sesé, F. (2009). Existencia y heterogeneidad de los costes de cambio en la industria de la telefońıa móvil. Hacienda Pública Española / Revista de Economı́a Pública, 191(4/2009): 926. Polo, Y., y Sesé, J. (2009). La Retención de los Clientes. Un Estudio Emṕırico de sus Determinantes. Revista Española de Investigación de Marketing ESIC. Vol. 13, n◦ 1, pp. 117-137. Thurstone, L. (1927). A law of comparative judgement. Psychological Review 34, 273-286. Train, K. (1998). Recreation demand models with taste differences over people. Land Eco- nomics, 74 (2), 230-239. Train, K. (2001). A Comparison of Hierarchical Bayes and Maximum Simulated Likelihood for Mixed Logit. Department of Economics, University of California, Berkeley. Train, K.(2009). Discrete Choice Methods with Simulation. Cambridge University Press. Train, K., y Sonnier, G. (2005).Mixed logit with bounded distributions of correlated part- worths. In: Alberini, A., Scarpa, R. (Eds.), Applications of Simulation Methods in Environ- mental and Resource Economics. Springer, Dordrecht, pp. 117-134.