Modelos de regresión paramétricos bivariados para el análisis de supervivencia: una aplicación a tiempos de infección y síntomas
Abstract
Cuando se realizan estudios sobre tratamientos nuevos que pueden aplicarse a pacientes que sufren de una determinada enfermedad, un factor fundamental para evaluar la efectividad de dicho tratamiento es la determinación de si el paciente adquirió la enfermedad o no, y si presentó síntomas de dicha enfermedad, o no lo hizo. Dicho de otro modo, se requiere conocer (o estimar) el efecto que tuvo la aplicación del nuevo tratamiento en el tiempo en el cual el paciente adquirió la infección y el tiempo en el cual comenzó a presentar síntomas, variables que permiten determinar si el tratamiento pudo prevenir la enfermedad, o al menos ralentizar su propagación, y si pudo evitar o atenuar la aparición de síntomas. Es importante resaltar que el estudio del tiempo transcurrido hasta la ocurrencia de una infección o de la aparición de los síntomas, es un caso particular del análisis de supervivencia, rama de la estadística que tiene como objetivo el estudio del tiempo transcurrido hasta la ocurrencia de un evento, así como el efecto que tienen en dicho tiempo variables características propias de los individuos a los que les ocurre el evento, por ejemplo, en el caso de pacientes, se puede considerar el tratamiento que se le aplicó (el estándar o el nuevo), la edad, el género, entre otros. A estas últimas se les conoce como covariables. Así, el presente trabajo propone dos modelos paramétricos bivariados basados en distribuciones y métodos estadísticos utilizados en el análisis de supervivencia, modelos que permitirán estudiar el comportamiento conjunto del tiempo a infección y del tiempo a síntomas, considerando la relación intrínseca existente entre ambas variables. De esta manera, el método de estimación a utilizar será el modelo de tiempo de falla acelerado, modelo de regresión lineal en el cual se asume que el logaritmo del tiempo de infección y el logaritmo del tiempo de síntomas son iguales a una función lineal de las covariables más un error multiplicado por el parámetro de escala correspondiente a cada tiempo. En ese sentido, se cuentan con dos errores (uno para el tiempo de infección y otro para el de síntomas) que corresponden al componente aleatorio de la regresión, componente que se modelará de forma conjunta de las siguientes dos maneras: Asumiendo que ambos errores siguen una distribución bivariada de valores extremos. Asumiendo un modelo de cópulas, en la cual se asume que cada tiempo presenta una distribución marginal Weibull, y la relación de dependencia de ambos tiempos obedece a una cópula Gumbel. Finalmente, el método anterior se puede aplicar a una muestra determinada a fin de estimar los parámetros de las distribuciones asumidas, y de esta manera determinar el efecto que tienen cada una de las covariables en los tiempos de infección y de síntomas. En este trabajo en particular, se aplicará el modelo en el estudio de notificación de parejas, llevado a cabo por Golden en el 2005 y que tuvo como objetivo verificar si un grupo de pacientes presentó reinfección y síntomas de una enfermedad previa, así como el efecto de una nueva terapia sobre tales eventos. When studies are carried out on new treatments that can be applied to patients suffering from a certain disease, a fundamental factor to evaluate the effectiveness of such treatment is the determination of whether the patient acquired the disease or not, and if he presented symptoms of that disease, or did not. In other words, it is necessary to know (or estimate) the effect that the application of the new treatment had on the time in which the patient acquired the infection and the time in which he began to present symptoms, variables that make it possible to determine if the treatment was able to prevent the disease, or at least slow its spread, and whether it was able to prevent or mitigate the onset of symptoms. It is important to highlight that the study of the time elapsed until the occurrence of an infection or the appearance of symptoms is a particular case of survival analysis, a branch of statistics whose objective is the study of the time elapsed until the occurrence of a event, as well as the effect of variables characteristic of the individuals to whom the event occurs, for example, in the case of patients, the treatment applied to them (the standard or the new), age, gender, among others. This are known as covariates. Thus, the present work proposes two bivariate parametric models based on distributions and statistical methods used in survival analysis, models that will allow studying the joint behavior of time to infection and time to symptoms, considering the intrinsic relationship between both variables.
Then, the estimation method to be used will be the accelerated failure time model, a linear regression model in which it is assumed that the logarithm of the infection time and the logarithm of the symptom time are equal to a linear function of the covariates plus an error multiplied by the scale parameter corresponding to each time. With this in mind, there are two errors (one for the time of infection and the other for the time of symptoms) that correspond to the random component of the regression, a component that will be modeled jointly in the following two ways: Assuming that both errors follow a bivariate extreme value distribution. Assuming a copula model, in which it is assumed that each time presents a Weibull marginal distribution, and the dependency relationship of both times obeys a Gumbel copula.
Finally, the previous method can be applied to a specific sample in order to estimate the parameters of the assumed distributions, and in this way determine the effect that each of the covariates has on the times of infection and symptoms. In this particular work, the model will be applied in the couple notification study, carried out by Golden in 2005 and whose objective was to verify if a group of patients presented reinfection and symptoms of a previous disease, as well as the effect of a new therapy on such events.
Temas
Análisis de supervivencia
Cópulas (Estadística matemática)
Adherencia al tratamiento
Cópulas (Estadística matemática)
Adherencia al tratamiento
Para optar el título de
Maestro en Estadística
Collections
The following license files are associated with this item: