Egresados de Especialización

Egresados de Maestría

 

EGRESADOS DE LA ESPECIALIZACIÓN

Luis Eduardo Cardona (2006)

Guillermo León Roldán Sosa (2007)
Lucelly lópez López (2007)
Luis Fernando Berancur Lalinde (2007)
Oscar Alberto Saavedra Vásquez (2007)
Sandra Milena Díaz Espitia (2007)
Alejandro Estrada Restrepo (2008)
Diana Patricia Gómez Agudelo (2008)
Nelson Darío Giraldo Ramírez (2008)

 

EGRESADOS DE LA MAESTRÍA

 

Sandra Carolina Serna Pineda (2009)  Diana Milena Velásquez Sierra (2009)
Arice Lilibeth Pardo Camacho (2009)
Diana Marcela Pérez Valencia (2009)

 

 

TESIS DE ESPECIALIZACIÓN

 

Aplicación de la Estadística Espacial al Análisis de Datos Georeferenciados: Distribución de los Foraminíferos Planctónicos Recientes en la Cuenca de Panamá: Pacífico Colombiano.

Estudio del índice general de la bolsa de valores de Colombia IGBC, mediante un modelo ARIMA(p,d,q)
 
 
 

 

Nombre del Trabajo: "Medidas de no Linealidad en Regresión no Lineal"

Presentado por: Hugo Grisales Romero
Título obtenido: Especialista en Estadística
Año: 1993
Director: Sergio Yáñez Canal

RESUMEN

Usualmente la extensión de las inferencias de los modelos de regresión lineal al caso no lineal se han hecho obviando el grado de no linealidad y la importancia de la bondad de ajuste en muestras pequeñas. En este trabajo se analizan las medidas de Bates y Watts (1980) y Hougaard (1985) para la validación de la extensión inferencial confrontando esta última con la de Box (1971). Se desarrolló un software (RENOL: Regresión No Lineal) para el hallazgo de estas medidas y con su uso se evaluaron dos conjuntos de datos utilizados en sendas investigaciones exponiéndose las conclusiones pertinentes.

Palabras Clave: Regresión no Lineal, Medidas de Bates, Watts, Hougaard, y Box.

Inicio

Nombre del Trabajo: "Estudio de Asociación entre el examen admisicón de la Universidad Nacional y el Examen Icfes Primera Aproximación"


Presentado por: Sergio Iván Restrepo Ochoa
Año: 1993
Título obtenido: Especialista en Estadística
Director: Germán Cabarcas Iglesias, M.Sc.

RESUMEN

Aquí se presenta un primer estudio sobre el grado de asociación entre el puntaje que obtuvieron los estudiantes que se presentaron a la Universidad Nacional de Colombia (Sede Medellfn) y el puntaje obtenido por éstos en las pruebas del estado (pruebas del ICFES). El objetivo principal era tratar de sugerir la posibilidad de reemplazar el examen de admisión por el examen del estado. El estudio de asociación se realizó utilizando, por un lado, mínimos cuadrados ordinarios (OLS) y por otro lado, regresión logística. Los resultados nos muestran que hay una relación estadísticamente significativa entre tales pruebas. Sin embargo, el grado de asociación que obtuvimos no nos pareció satisfactorio y por tanto, el estudio no fue concluyente.

Palabras Clave: Mínimos cuadrados ordinarios, Regresión logística, Medidas de asociación.


Inicio

Nombre del Trabajo: "Desagregación de Series de Tiempo. Aplicación de una Nueva Metodología a Algunos Casos de la Economía Colombiana"


Presentado por: Luis Guillermo Pérez Puerta
Título obtenido: Especialista en Estadística
Año: 1994
Director: Elkin Castaño Vélez

RESUMEN

Es comun en el trabajo de series de tiempo que los datos se presenten en forma agregada en el tiempo y que se quiera conocer la serie en períodos de tiempo de longitud menor, es decir desagregada. En particular es usual encontrar series económicas anuales que deben ser desagregadas mensual o trimestralmente. En este trabajo se buscó conocer e implementar una metodología reciente, en ese momento, año l994, para la desagregación temporal de series de tiempo y aplicarla a una serie en la economía Colombiana.

La serie desagregada fue el PIB de Antioquia para los años 1982-1990. En serie, anual, fue desagregada mensualmente.

Este trabajo se fundamentó en dos artículos:

Guerrero, V. M (1990). Temporal Disaggregation of Time Series: An ARIMA-based Approach. International Statistical Review 58, 29-46.

Guerrero, V. M. and Martínez Jorge (1993).A Recursive ARIMA-based Procedure for disaggregating a Time Series Variable Using Concurrernt Data. Documento de trabajo.

Palabras Clave: Series de Tiempo, Desagregación.

Inicio

Nombre del Trabajo: Pruebas de Homogeneidad e Intervalos de Confianza para Proyeccciones con Matrices de Transición

Presentado por: Amparo del Carmén Chamorro Gómez
Título obtenido: Especialista en Estadística
Año: 1995
Director: Norman Diego Giraldo Gómez, M.Sc.

RESUMEN

Se introduce la aplicación del concepto de Tiempo de Absorción en cadenas de Markov finitas con un estado absorbente, a los modelos de crecimiento con matrices de transición de especies forestales, las cuales pueden interpretarse como ejemplos de tales tipos de cadenas. Además, se introducen pruebas de homogeneidad para la comparación de k matrices de transición como generalizaciones de pruebas jicuadrado. Se examinan también los tiempos de absorción para k matrices pero no se llega a un estadístico con base en los mismos. Finalmente, con base en la aproximación normal a la binomial se logra una expresión para intervalos de confianza aproximados para las predicciones con base en las matrices de transición. Este resultado se había tratado de obtener en un trabajo de grado anterior con base en simulación.

Palabras Clave: Matrices de transición, Pruebas de homogeneidad.


Inicio

Nombre del Trabajo: Aplicación de Técnicas de Estadísticas en la Evaluación Sensorial del Alimento

Presentado por: Esner Valencia Valencia
Título obtenido: Especialista en Estadística
Año: 1995
Director: Germán Cabarcas Iglesias, M.Sc.

RESUMEN

En este trabajo se discute el uso de algunas técnicas estadísticas en la evaluación sensorial de los alimentos. En primer lugar, se introducen algunos elementos metodológicos básicos y posterirmente se hace uso de datos relaes provenientes de las industrias de los jugos, las aguas envasadas y las cervezas para discutir la aplicación rigurosa de métodos estadísticos usuales en pruebas discriminatorias, de análisis descriptivo, y de aceptación o preferencia. En especial se estudian problemas en los cuales se realizan experiemntos binomiales, y diseños experimentales.

Palabras Clave: Atributos sensoriales, medición de respuesta, pruebas discriminatorias, comparaciones múltiples, diseño aleatorizado, bloques completos e incompletos.


Inicio

Nombre del Trabajo: Comparación entre la Regresión Logística y el Análisis Discriminante


Presentado por: Francisco Javier Castrillón Meneses
Título obtenido: Especialista en Estadística
Año: 1995
Director: Juan Carlos Correa Morales, Ph.D

RESUMEN

La clasificación es un problema que aparece en una gran cantidad de contextos y tiene mucha aplicabilidad en procesos científicos; es un problema multivariado; intuitivamente, entre más grande sea el conjunto de características, más fácil es la clasificación mientras que el problema de usar pocas variables usualmente conduce a obtener resultados pobres.

El análisis discriminante es una técnica que se basa principalmente en la suposición de que las dos poblaciones en las que se va a clasificar un nuevo objeto se distribuyen normalmente con igual matriz de varianzas y covarianzas, lo que da origen a una frontera de separación lineal. Por otro lado, la Regresión Logística no tiene ninguna clase de suposiciones sobre la forma distribucional de las poblaciones, hecho que como procedimiento de clasificación puede favorecerla más que el análisis discriminante en muchas aplicaciones particulares.

Palabras Clave: Regresión Logística, Análisis discriminante, Clasificación.

Inicio

Nombre del Trabajo: Método de Riesgos Proporcionales para Tiempo de Recurrencia en Leishmaniasis

Presentado por: Luis Fernando Grajales Hernández
Título obtenido: Especialista en Estadística
Año: 1997
Director: Sergio Yáñez Canal, M.Sc.

RESUMEN

Entre los años de 1983 y 1989, CIDEM lideró un estudio de cohorte con más de 400 pacientes de Tumaco, Cali y zonas aledañas, con diagnóstico de leishmaniasis tegumentaria, los cuales se trataron con Glucantime hasta la curación completa de las lesiones. Por medio de seguimientos, se establecen los tiempos de supervivencia para los pacientes recurrentes y censurados. El objetivo principal de este trabajo es hallar factores de riesgo asociados a la recurrencia. Utilizando Tablas de vida y Riesgos Proporcionales de Cox se obtienen resultados relacionados con el tiempo de supervivencia, explicada por las variables asociadas al tratamiento, respuesta inmune, subespecie infectante y exposición del paciente a la picadura del vector.

Palabras Clave: Leishmaniasis, supervivencia, Riesgos Proporcionales.

Inicio

Nombre del Trabajo: Proyección Pursuit Continua con Aplicaciones

Presentado por: Miguel Darío Ospina Valencia
Título obtenido: Especialista en Estadística
Año: 1997
Director: Juan Carlos Correa Morales, Ph.D

RESUMEN

Projection Pursuit, es un método utilizado para el análisis exploratorio de datos multivariados, buscando estructuras no lineales. Se estudia el algoritmo de esta proyección que puede ser aplicada a un conjunto de datos multivariados y que consiste en un proyección de los datos a una o dos dimensiones, buscando aquellas proyecciones que pueden ser consideradaas como "interesantes", deacuerdo al valor de un índice numérico asociado a la proyección, ccomparándola con distribución normal (caso continuo) para decidir cuando es interesante o no. Se estudia el algoritmo compuesto por Friedman (1987) para encontrar determinada "información" en un conjunto de datos de tipo continuo para obtener los diferentes índices y se observan algunas aplicaciones. Además, se implementa el Algoritmo computacional, mediante la utilización del programa S-PLUS, dando como resultado un sistema gráfico.

Palabras Clave: Proyección Pursuit, Análisis exploratorio, Análisis Multivariado.

Inicio

Nombre del Trabajo:El Litio como Profiláctico de la Psicosis Maníaco-Depresiva en Tratamientos a Corto y Largo Plazo

Presentado por: Luis Felipe Cogollo Negrete
Título obtenido: Especialista en Estadística
Año: 1997
Director: Juan Carlos Correa Morales, Ph.D

RESUMEN

La psicosis maniaco depresiva , que es un trastorno de altísima prevalencia, es sin duda el padecimiento psiquiatrico más frecuente diagnosticado en nuestro medio. Con este trabajo se quiere realizar un estudio con pacientes que sufren esta enfermedad y a los cuales se les suministra dosis de sales de litio, que nos permita tomar una decisión acertada acerca del manejo a largo plazo de los pacientes con sales de litio. Para ello, se realizó una regresión logística o un análisis de tablas de contingencia, además de la estadística descriptiva y de métodos muultivariables

Palabras Clave: Aplicación de regresión logística, tablas de contingencia, psicosis maniaco depresiva (PMD)


Inicio

Nombre del Trabajo: "Caracterización del Rendimiento Académico de los Estudiantes de la Universidad Nacional Sede Medellín, Según Variables Socio-Demográficas y Dedicación al Estudio"

Presentado por: Guillermo León Arias Pineda.
Título obtenido: Especialista en Estadística
Año: 1998
Director: Germán Cabarcas Iglesias, M.Sc.

RESUMEN

En este trabajo se utiliza el Análisis Factorial de Correspondencias Múltiples y métodos de Clasificación Jerárquica para estudiar la información recogida a través de una encuesta aplicada a estudiantes de la Universidad Nacional de Colombia, Sede Medellín matriculados en el segundo semestre de 1995. Estas técnicas permiten establecer tipologías de estudiantes y luego asociarlas con varios indicadores de rendimiento. Los métodos estadísticos de carácter exploratorio usados aquí son discutidos y confrontados con prácticas más artesanales de análisis que no toman en cuenta el carácter multivariado de la información. Los resultados se presentan finalmente en tablas de resumen.

Palabras Clave: Tablas de contingencia, Análisis de Correspondencias Simples y Múltiples. Planos y coordenadas factoriales, inercias, particiones. .


Inicio

Nombre del Trabajo: Proyecciones de Demanda de Energía a Corto Plazo para el Sistema Eléctrico Colombiano (SEC)


Presentado por: Juan Carlos Rodríguez Aguilar
Título obtenido: Especialista en Estadística
Año: 1998
Director: Emilia Correa Moreno, M.Sc.

RESUMEN

En este trabajo se aplicaron los modelos ARIMA en el pronóstico de la demanda de energía para los submercados en que Interconexión Eléctrica S.A. (ISA) ha dividido el país. Los submercados son: Empresa de Energía de Bogotá EEB (Comprende las demandas de Bogotá, Meta y Cundinamarca), Empresas Públicas de Medellín EEPPM (Comprende las demandas de Medell(n, Antioquia y Chocó), Corporación Eléctrica de la Costa Atlántica CORELCA (Comprende las demandas de Córdoba, Sucre, Bolívar, Magdalena, Cesar y Guajira), Central Hidroeléctrica de Caldas CHEC (Comprende las demandas de Caldas, Risaralda, Quindío, Tolima, Huila y Caquetá), NORDESTE (Comprende las demandas de Boyacá, Santander y Norte de Santander) y Corporación Regional del Valle del Cauca CVC (Comprende las demandas de Cali y Valle del Cauca).

Los datos usados, en la mayoría de los casos, consideraron la demanda de energía en el período 1975 a 1996, e incluyen los racionamientos ocurridos en ese período, los cuales fueron modelados. Los resultados de las proyecciones fueron comparados con las realizadas por ISA, la Unidad de planeación Minero Energética UPME y los datos reales durante 1997. Para la mayoría de los submercados, las proyecciones obtenidas tuvieron menor error que las otras proyecciones, al compararlas con los datos reales de 1997.

Palabras Clave: Modelos ARIMA.


Inicio

Nombre del Trabajo: Medidas de Asociación en Tablas de Contigencias

Presentado por: Darío Alberto Rico Higuita
Título obtenido: Especialista en Estadística
Año: 1998
Director: Juan Carlos Correa Morales, Ph.D

RESUMEN

La monografía presenta un resumen que incluye la formulación, clasificación y descripción de las más importantes propiedades de un representativo número de Medidas de Asociación aplicadas a Tablas de Contingencia de doble entrada, en las cuales se trata de determinar qué clase de medidas son aplicables en distintos casos, según el tipo de variables categóricas involucradas y la forma de la relación específica que se trata de establecer entre ellas. Estas medidas son en general, parámetros estadísticos que se formulan a partir de la evaluación de las probabilidades conjuntas, marginales y condicionales de la información cruzada de dos variables en una tabla y tratan de resumir en un solo valor la información contenida en ésta; por este mismo carácter, son deducibles parámetros para la variación y distribuciones aproximadas para sus estadísticos muestrales. Los alcances de la inferencia de estas medidas se perfilan más allá de los tradicionales test para determinar independencia, pero son más limitados que las posibilidades que ofrece la construcción de modelos categóricos para describir en forma más completa la estructura de la asociación entre dos variables.

Palabras clave: Medidas de Asociación, Tablas de Contingencia, Variables Categóricas.

Inicio

Nombre del Trabajo: Modelo de Regresión Logístico para Maximizar la Probabilidad de Obtener un Producto Dentro de Especificación

Presentado por: Omar de J. Vera Arbeláez
Título obtenido: Especialista en Estadística
Año: 1999
Director: Juan Carlos Correa Morales, Ph.D

RESUMEN

Empleando datos reales de un proceso y que se registran durante la producción de un tipo especial de resina, se utiliza una herramienta estadística tal como la regresión logística (modelo logit), para construir un modelo cuadrático que relacione la probabilidad de obtener un producto dentro de especificación y las covariables que se piensa pueden contribuir a la determinación de esta probabilidad. Para la selección de las variables, se utilizan criterios propios del campo de la industria de procesos químicos, en combinación con fundamentos matemáticos. Se utiliza el SAS para realizar el ajuste del modelo, a través del PROC LOGISTIC y su comando MODEL. 0btenido un modelo, se hace un completo análisis de diagnósticos del mismo, mediante la opción IPLOTS. Así, se llega a replantear el modelo y a aceptar este último.

Palabras clave: Regresión Logística, Diagnósticos en regresión Logística, Funciones de Enlace, Selección de un Modelo Logistico.

Inicio

Nombre del Trabajo: Modelamiento Estadístico para la Determinación de la Actividad de Insecticidas de Contacto


Presentado por: Gilma Norela Hernández Herrera
Título obtenido: Especialista en Estadística
Año: 1999
Director: Juan Carlos Correa Morales, Ph.D

RESUMEN

La estimación de la Dosis Letal Mediana (LD5O) es un problema importante en el estudio de la eficacia de insecticidas. En este trabajo utilizamos la metodología del Modelo de Regresión Logística para su estimación. Se presenta también una revisión del proceso de estimación por el método de Máxima Verosimilitud usando el método iterativo de Newton-Rapshon. Además se presentan las medidas de diagnóstico para determinar la bondad del ajuste del modelo, lo anterior basado en el trabajo de Pregibon (1981).
Lo anterior se hizo utilizando los datos proporcionados por el GIEM , de los dípteros expuestos a insecticidas de contacto. Se estiman los parámetros, se encuentra la ecuación y se calculan las medidas diagnósticas para la validación del ajuste.

Palabras clave: Función logit, Razón de Odds, Modelo logístico, LD5O, Diagnósticos de Regresión Logística.

Inicio

Nombre del Trabajo: Modelo Lineal Generalizado, Análisis de Datos Categóricos y Cartas de Control para Construcción e Interpretación de Indicadores de Impacto en Accidentalidad Laboral


Presentado por: Maria Isabel Gallego Pulgarín
Título obtenido: Especialista en Estadística
Año: 1999
Director: Juan Carlos Correa Morales, Ph.D

RESUMEN

Con el objeto de conocer con precisión la frecuencia con que ocurren los accidentes de trabajo y la severidad de las lesiones que causan en los individuos se precesó información de la accidentalidad laboral de una Administradora de Riesgos Profesionales Privada y de una Estatal. Se realizó Análisis Exploratorio de Datos, estudio de tendencia de los indicadores usados con más frecuencia en el medio y modelación a través de regresión poisson para explicar accidentalidad en los dos tipos de operadores del Sistema General de Riesgos Profesionales es muy similar, pero se aprecian algunas diferencias cualitativas en el manejo de los datos. La información es insuficiente para llevar a cabo una modelación adecuada que explique la ocurrencia del fenómeno. No se logra evidenciar el impacto de las acciones preventivas en los indicadores de accidentalidad.

Palabras clave: Datos cualitativos, accidentalidad, riesgos profesionales, Análisis exploratorio.

 Inicio

Nombre del Trabajo: Modelación de la Distribución y Abundancia de las Larvas de Mariposa Plutella en los Parches de Brassica Olearacea, una Aplicación de los Modelos Multinivel.

Presentado por: Juan de Jesús Sandoval
Título obtenido: Especialista en Estadística
Año: 1999
Director: Elkin Castaño Vélez

RESUMEN

En estudios de reforestación de bosques se observa que árboles o arbustos están agrupados en parches de vegetación y estos parches a su vez en bloques más grandes debido tal vez al terreno, a estos árboles se les puede medir una característica a diferentes fechas, cuando deseamos contar el número de larvas presentes en sus hojas o el número de animales que buscan refugio en los árboles, en la técnica de muestreo se debe usar alguna forma jerárquica para el conteo. Se ha considerado el problema de los parches de vegetación y se ha intentado la modelación estadística del conteo de larvas de Plutella xillostella (Mariposa punta de Diamante) en los parches de Brassica O (Repollo común), especialmente desarrollando modelos jerárquicos, en nuestro caso utilizando un modelo de tres niveles de jerarquía, dentro del cual se desarrolló un modelo con polinomio cuadrático en el tercer nivel y lineales en los otros dos, algunos de ellos fueron modelos de coeficientes aleatorios y otros pendientes cambiantes no aleatorias.

Palabras clave: Modelos jerárquicos, coeficientes aleatorios, pendientes cambiantes no aleatorias, parches de vegetación, plutella X, Brassica O.

Inicio

Nombre del Trabajo: Caracterización de la Población en el Tecnológico de Antioquia

Presentado por: Leonardo Ceballos Urrego
Título obtenido: Especialista en Estadística
Año: 1999
Director: Germán Cabarcas Iglesias, M.Sc.

RESUMEN

Tomando como base los datos aportados por una encuesta diseñada con criterios pedagógicos, bajo nueve aspectos diferentes que cubren varias dimensiones del ser humano, y la cual fue aplicada a 357 estudiantes del Tecnológico de Antioquia, se pretende con este trabajo caracterizar y/o tipificar a la población estudiantil de tal institución matriculada para el semestre 99-01, utilizando para ello la aplicación en secuencia de los siguientes Métodos de Análisis Estadístico Multivariado: 1o. Análisis Factorial de Correspondencia Múltiples (A.F.C.M.); 2o. A partir de los factores obtenidos en el método anterior, se aplican Métodos de Clasificación, en particular el análisis de Clusters o Grupos y dentro de éste la técnica de Clasificación Jerárquica Ascendente; 3o. Análisis de Tablas de Contingencia para las nuevas variables generadas con la ejecución de los dos métodos anteriores y 4o. Análisis Factorial Simple sobre las parejas de variables cuyas modalidades presentan mayor probabilidad de asociación dentro de las distintas tablas obtenidas, de acuerdo con el criterio del mayor Chi2. Este proceso con los 4 tipos de análisis, no solo conduce a la obtención de los objetivos propuestos para este trabajo ( De donde proceden?, Quienes son?, y Que pretenden?); sino que se puede consolidar como una metodología de análisis para estudios de la misma naturaleza, en los que predominen las variables cualitativas.

Palabras clave: Análisis Factorial de Correspondencias Múltiples (A.F.C.M. y A.F.S.). Histograma de Valores Propios. Modalidades Activas e Ilustrativas. Factores.Ejes Factoriales.Planos Factoriales.Contribuciones a la Inercia.Tipologías de Individuos.

Inicio

Nombre del Trabajo: Diagnósticos en Regresión Poisson

Presentado por: Olga Lucia Zapata
Título Obtenido: Especialista en Estadística
Año: 1999
Director: Juan Carlos Correa Morales, Ph.D


RESUMEN

Se hace una introducción al análisis de regresión, enfocándonos en el caso de la Regresión Poisson, se recopilan generalidades del trabajo que se ha realizado sobre diagnósticos de regresión, outliers y colinealidad en el modelo clásico. Los ejemplos que se usan para ilustrar emplean datos reales, unos recogidos bajo un diseño de experimentos y otros tomados de anuarios estadísticos. Se usan los paquetes estadísticos SAS y S-PLUS para correr modelos de regresión Poisson, para el análisis grafico y para estimar via simulación los efectos de la colinealidad en los parámetros de regresión del modelo Poisson.

Palabras clave: Outliers, regresión poisson, Colinealidad

Inicio

Nombre del trabajo: Análisis Estadístico de la Accidentalidad Víal en la Ciudad de Medellín

Presentado por: Oscar Enrique Cañas Zea
Título Obtenido: Especialista en Estadística
Año: 2000
Director: Juan Carlos Correa Morales, Ph.D


RESUMEN

Dentro de los programas que adelantan las secretarias de tránsito y transporte de los diferentes municipios de l país , es importante que estas cuenten con propósitos confiables que le permitan evaluar y mejorar los programas tendientes a disminuir la accidentalidad en los diferentes sitios de la localidad; es tabién importante para estos organismos identififcar los lugares más críticos en accidentalidad y las principales causas que los proceden. En este trabajo se hace un análisis exploratorio de tallado de la base de datos sobre accidentes que posee la secretaría de transito y transporte de Medellín, con el fin de identificar los lugares más críticos, las horas de mayor accidentalidad así como sus pricipales causas de los accidentes de tránsito ocurridos en la ciudad. Se analiza el riesgo, tanto en pérdidas humanas como económicas, de los sitios identificados como los más críticos. Se hacen cartas de control que permitan en un futuro cercano identificar aquellos sitios que se están alejando del promedio esperado y así poder entrar a corregir estas situaciones.

PALABRAS CLAVES: Función Gamma, Riesgo, índice de accidentalidad, Función Poisson, Carta de control

Inicio

Nombre del trabajo: Regresión no Paramétrica,P P R y Estimación de la Varianza Residual

Presentado por: René Iral Palomino
Título Obtenido: Especialista en Estadística
Año: 2000
Director : Juan Carlos Correa Morales, Ph.D


RESUMEN

En la mayoría de los análisis estadísticos el problema fundamental consiste en determinar algún tipo de relación entre un par de variables. Esta relación nos debe permitir establecer la forma como una de ellas afecta la otra. La idea básica consiste en estimar o predecir el valor esperado de la variable dependiente, dado valores fijos de la variable independiente.Este trabajo pretende mostrar algunas de las herrramientas no paramétricas usadas en la estimación, a nivel univariado o multivariado, de una relación desconocida de regresión y compararlas con una técnica tradicional como mínimos cuadrados. Se quiere mostrar que las técnicas no paramétricas ofrecen una alternativa más flexible a la hora de estimar relaciones desconocidas entre varias variables, imponiendo condiciones más débiles que los métodos paramétricos tradicionalmente usados.


PALABRAS CLAVES: Análisis de regresión, regresión no paramétrica univariada, regresión no paramétrica multivariada

Inicio

Nombre del trabajo: Comparación de las Pruebas Psicológicas de Personalidad PPG.IPG Y 16 PF

Presentado por: Germán Alberto Loaiza Orrego
Título Obtenido: Especialista en Estadística
Año: 2001
Director (es): Juan Carlos Correa, Ph.D, German Cabarcas Iglesias,M.Sc.


RESUMEN

Los inventarios de personalidad son las pruebas psicologicas usadas más ampliamante, entre las cuales se encuentran el Instrumento de personalidad 16PF, que contiene 16 factores de personalidad y el perfil e inventario de personalidad PPG.IPG, que contiene aspectos y rasgos depersonalidad. Se utilizaron dos procedimientos de las técnicas estadisticas multivariadas llamadas Análisis de correlación canonica y Análisis Factorial de correspondencias múltiples para determinar la relación entre las variables utilizadas en las pruebas PPG.IPG y 16 PF y la validez de cada una de las pruebas.


PALABRAS CLAVES: Análisis de correlación canonica, Análisis Factorial de Correspondencias múltiples, Inventarios de personalidad.

Inicio

Nombre del Trabajo: Resumen Procedimientos R para Estimar los Parámetros de la Distribución Weibull

Presentado por: Guillermo A. Fonseca Pacheco
Título obtenido: Especialista en Estadística
Año: 2001
Director: Juan Carlos Correa Morales, Ph.D

RESUMEN

Desarrollo algorítmico utilizando el lenguaje estadístico R, para estimar los parámetros de forma (Beta) y de escala (alpha), de la distribución Weibull, empleando métodos gráficos como el de la probabilidad Weibull y el basado en el riesgo y métodos analíticos como el MLE, estimador de máxima verosimilitud, el MOM, método de los momentos y el LSM, método de mínimos cuadrados y para comprobar el método mas estable, se realizó una simulación con diferentes muestras y diferentes parámetros de forma y de escala. Los datos estudiados corresponden a los índices de indisponibilidad de un período de tiempo en los equipos de uso y de conexión de Interconexión Eléctrica S.A. E.S.P. ISA.

Palabras clave: Weibull, máxima verosimilitud, momentos, mínimos cuadrados, Box-Cox.

Inicio

Nombre del trabajo: Monografía sobre la Técnica X-12 Arima del U.S Census Bureau con Aplicaciones

Presentado por: Jorge Alberto Restrepo Palacio
Título obtenido: Especialista en Estadística
Año: 2002
Director: Juan Carlos Correa Morales, Ph.D

RESUMEN

Esta es una monografía sobre una técnica de ajuste estacional de series de tiempo usada ampliamente por agencias gubernamentales de Estados Unidos y otros países así como por empresas privadas. Esta técnica permite además la elaboración de pronósticos.

El trabajo se divide en tres grandes partes: en la primera parte se presentan definiciones básicas de pronósticos, métodos y medidas de su exactitud. Se hace énfasis en un método en particular, la descomposición de series de tiempo.

En la segunda parte se presenta el Programa de Ajuste Estacional X12-ARIMA desarrollado por el US Census Bureau , oficina del Departamento de Comercio de los Estados Unidos. Aquíse presenta en detalle la estructura del programa y sus diferentes opciones, así como consideraciones técnicas importantes.

La tercera parte contiene aplicaciones concretas de la metodología a series de tiempo económicas recolectadas en nuestro medio.

Se finaliza presentando brevemente otros programas de pronósticos disponibles hoy en el mundo, detallando uno en particular, el DEMETRA, usado por la Unión Europea.


Inicio

Nombre del trabajo: El Problema de la Separación en Regresión Logísitica

Presentado por: Marisol Valencia Cárdenas
Título obtenido: Especialista en Estadística
Año: 2002
Director: Juan Carlos Correa Morales, Ph.D

RESUMEN

El problema de separación en regresión logística aparece con frecuencia en el trabajo aplicado. A menudo investigadores y diversos usuarios se enfrentan a este problema sin lograr una solución clara. La existencia de este problema en regresión logística, implica que los estimadores de máxima verosimilitud de estos modelos no existen, lo cual impide determinar inferencias cuando relacionan variables dicótomas con variables explicatorias por medio de este tipo de modelos. En las referencias estudiadas, no se han explorado ampliamente posibles soluciones, por esta razón en este trabajo se presenta el tema, analizando su gravedad y generando posibles soluciones que permitan determinar inferencias.

PALABRAS CLAVES: Regresión Logística, Estimación de máxima verosimilitud, Separación Completa, sobreposición.

Inicio

Nombre del trabajo: Uso de Técnicas Multivariadas en el Control de Calidad de un Proceso Industrial de Alimentos

Presentado por: Francisco Javier Jaramillo Álvarez
Título Obtenido: Especialista en Estadística
Año: 2003
Director : Sergio Yáñez Canal, M.Sc.


RESUMEN

Para el control de calidad de procesos o productos se deben examinar las causas de variabilidad. Tradicionalmente se hace análisis unidimensional, pero en la práctica cualquier fenómeno está determinado por varios factores que interactúan; por ello, se propondrán en este Trabajo técnicas multivariadas, de tal forma que se dé importancia a la correlación entre las variables y se disminuya la probabilidad de falsas alarmas o de no recibir señal cuando el proceso esté fuera de control.

Es importante, no sólo detectar señales que se salen de control, sino también detectar las causas para que ello suceda. La herramienta más útil para detectar esas causas es la descomposición MYT; otra técnica que puede ayudar es el Análisis de Componentes Principales, especialmente cuando el número de variables incluidas es grande, ya que su objetivo es reducir la dimensionalidad de un problema.


PALABRAS CLAVES: Carta de control, contracorrelación, conjunto de datos históricos, límites de control, carta T2, carta formato de elipse, Descomposición MYT, Componentes Principales

Inicio

Nombre del trabajo: Modelamiento de la Relación entre la Dosis de la Droga Psiquiátrica Clozapina y su Concentración Sanguínea usando Regresión Lineal con Coeficientes Aleatorios

Presentado por: Tulia Esther Rivera Flórez
Título Obtenido: Especialista en Estadística
Año: 2003
Director: Francisco Javier Díaz Ceballos, Ph. D

 

RESUMEN

El objetivo general de este estudio es desarrollar un modelo de regresión lineal con coeficientes aleatorios de la relación entre la concentración sanguínea de la droga psiquiátrica clozapina, la dosis de la droga, el género, el consumo de cigarrillo, y otras variables de interés médico. También se pretende desarrollar una metodología para estimar un índice de actividad metabólica que caracterice pacientes particulares con esquizofrenia y que permita determinar la dosis necesaria para alcanzar concentraciones terapéuticas conocidas de clozapina en la sangre.


PALABRAS CLAVES: Modelos Mixtos, Farmacocinética Lineal, Regresión Lineal

Inicio

Nombre del trabajo: Supervivencia de Pacientes con Trasplante Renal, Enero de 1999 a Junio de 2003

Presentado por: Nora Elena Montoya Restrepo
Título Obtenido: Especialista en Estadística
Año: 2003
Director: Juan Carlos Correa Morales, Ph. D

RESUMEN

El riñón, es el órgano encargado de filtrar toda la sangre que es bombeada por el corazón; excretar los productos de desecho; regular la cantidad de sodio, potasio, fósforo y calcio; y controlar la presión arterial. Cuando aparece la falla renal, es necesario iniciar un tratamiento que sustituya dicha función para evitar complicaciones que, en muchos casos, pueden ocasionar la muerte del paciente; uno de estos tratamientos es el trasplante renal,

Aunque el trasplante renal no es la cura para la insuficiencia renal terminal, se ha visto que de los tratamientos existentes (diálisis y trasplante), es el que produce una mayor supervivencia de los pacientes, ello a pesar de las fallas que se presentan cuando la sangre y los tejidos del donante y del paciente no son bien apareados para evitar que el sistema inmunitario rechace el nuevo riñón, lo cual se registra en un 15% a 50% de los casos, y de características como la edad y el estado de salud del paciente.

Debido a que la insuficiencia renal terminal es uno de los problemas prioritarios en salud, de pronóstico regular y mortal sin tratamiento, y que pone en riesgo el sistema de seguridad social, se diseñó este estudio, el cual permitió estimar la supervivencia (entendida ésta como tiempo hasta que ocurre un retrasplante, hemodiálisis o muerte después del trasplante renal), durante el primer año después del mismo, en una Empresa Promotora de Salud, medida considerada como indicador de severidad de la enfermedad y como pronóstico.

PALABRAS CLAVES: Insuficiencia renal, trasplante renal, probabilidad de falla renal.

Inicio

Nombre del trabajo: Comparación del Consumo de Cafeína y Tabaco en Pacientes Ezquizofrénicos y Controles de la Población General

Presentado por: Hernando Manuel Quintana Ávila
Título Obtenido: Especialista en Estadística
Año: 2003
Director: Francisco Javier Díaz Ceballos, Ph. D

RESUMEN

El consumo de tabaco es un problema común en pacientes esquizofrénicos de todo el mundo. Además, varios estudios sugieren que la ingestión de cafeína es alta en pacientes con esquizofrenia. Algunos estudios sugieren que la cafeína puede contribuir a la sintomatología de la esquizofrenia. Ninguno de estos estudios ha controlado los efectos del cigarrillo, el cual induce el metabolismo de la cafeína. En el estudio hecho por Gurpegui y colaboradores (2003), no se encontró una asociación entre el consumo de cafeína y sintomatología esquizofrénica. En dicho estudio se usaron 250 pacientes esquizofrénicos Españoles y se controló el consumo de tabaco y alcohol. Sin embargo, Gurpegui y colaboradores no compararon el consumo de cafeína y alcohol con sujetos normales. El objetivo de este estudio es completar el análisis de Gurpegui y colaboradores realizando esta comparación. También se comparará la edad de inicio de fumar diariamente de pacientes esquizofrénicos y controles, usando análisis no parametrico de supervivencia. El estudio termina comparando los efectos subjetivos del fumar y las razones por las cuales se fuma en los dos grupos usando pruebas chi-cuadrado de Pearson

PALABRAS CLAVES: Análisis parámetrico de supervivencia, Pruebas Chi-cuadrado de Pearson.

Inicio

Nombre del trabajo: Diseño de Muestreo y Análisis de Datos Categóricos en el proceso de Autoevaluación de un Programa de Pregrado

Presentado por: Claudia Maria Giraldo Velasquez
Título Obtenido: Especialista en Estadística
Año: 2003
Director: Victor Ignacio López, M.Sc.

RESUMEN

En este trabajo se encuentra el desarrollo de la componente estadística del proceso de autoevaluación de un programa de pregrado, teniendo en cuenta los factores propuestos por el Consejo Nacional de Acreditación.

Los elementos desarrollados aquí incluyen determinación del tamaño de la muestra para las diferentes poblaciones, cálculo de las proporciones a favor con sus respectivos intervalos de confianza, cálculo de la probabilidad de éxito de los factores para los diferentes estratos definidos en las poblaciones, cálculo de razones de odds, realización de pruebas de independencia, regresión logística y análisis de correspondencias múltiples.

Finalmente aparece una interpretación de estos elementos estadísticos que permite determinar el estado actual del programa.

PALABRAS CLAVES: Autoevaluación, datos categóricos, muestreo, intervalos de confianza, razón de odds, regresión logística, correspondencias múltiples.

Inicio

Nombre del trabajo: Análisis Estadístico para la Determinación de las Constantes Fenomenológicas en el Modelo de Farouk Civan para Daño de Formaciones Petrolíferas

Presentado por: Marco Antonio Ruiz Serna
Título Obtenido: Especialista en Estadística
Año: 2004
Director: Sergio Yañez Canal. M.Sc.

RESUMEN

Se presenta, en este trabajo, tanto los avances logrados como la relatoria de las dificultades encontradas cuando se quiere aplicar los métodos de estimación por mínimos cuadrados en los modelos de regresión no lineal para evaluar los parámetros del modelo de Civan – Knapp, el cual se utiliza para simular resultados obtenidos en mediciones de laboratorio con pruebas de desplazamiento sobre medios porosos.

Si bien, no se logran resultados definitivos se inclueyen análisis de las distintas alternativas diseñadas para superar las restricciones computacionales que el procedimiento Nlin del programa SAS impone para los casos específicos en que el modelo de regresión propuesto no cuenta con una función de respuesta media de forma explícita conocida y/o sus derivados con respecto a los parámetros no se pueden expreasar con una expresión analítica.

PALABRAS CLAVES: Regresión No Lineal, Mínimos Cuadrados, Procedimiento Nlin, Modelo de Civan, Programación IML.

Inicio

Nombre del trabajo: Aplicación de la Estadística Espacial al Análisis de Datos Georreferenciados: Distribución de los Foramníferos Planctónicos Recientes en la Cuenca de Panamá: Pacífico Colombiano

Presentado por: Carlos H. Cuartas Oquendo
Título Obtenido: Especialista en Estadística
Año: 2004
Director: Juan Carlos Correa Morales, Ph.D.

RESUMEN

El objetivo principal de este trabajo fue el de aplicar la geoestadística, como herramienta teórica, para analizar la manera como se distribuyen espacialmente doce especies de foraminíferos planctónicos encontrados en 31 perforaciones en la Cuenca de Panamá, Pacífico Colombiano. De forma más precisa, se analizó si la presencia de una cantidad determinada de individuos de cada una de las especies, encontrada en una perforación dada, tendría alguna relación espacial, autocorrelación espacial, con la cantidad de individuos encontrada en otra perforación. Para ello se realizó, de manera preliminar, una análisis exploratorio de cada una de las variables en toda el área de estudio, mediante el uso de paquetes dirigidos al análisis exploratorio de variables localizadas geográficamente, incorporados al software R.

El análisis exploratorio y la prueba I de Moran, permitieron determinar aquellas especies que podrían tener autocorrelación y estacionaridad en media. Conceptos, estos, de gran importancia en la aplicación de la geoestadística.Para la especie elegida, Neogloboquadrina dutertrei, se realizó una serie de análisis posteriores con el objeto de definir de manera más clara su distribución espacial en la Cuenca. Se calculó su semivariograma, basado en la semivarianza, el cual fue sometido a modelos de ajuste para encontrar parámetros como el Sill, el Rango y la Varianza Nugget .

PALABRAS CLAVES: Geoestadística, Autocorrelación Espacial, Semivariograma, Sill, Rango, Varianza Nugget, Estacionaridad, Kriging, Foraminífero Planctónico.

Inicio

Nombre del trabajo: Metodología Estadística para Proyectar los Pagos de la Cartera de Créditos de una Cooperativa Financiera

Presentado por : Carlos Eduardo Mira Duque y Sandra Moreno Valencia
Título obtenido: Especialista en Estadística
Año: 2004
Director: Norman Diego Giraldo Gómez. M.Sc.

RESUMEN

Esta monografía presenta una metodología estadística para proyectar los pagos de la cartera de créditos de una entidad financiera, que facilite la generación de reportes indispensables en la actividad financiera como son el cálculo del Valor Económico en Riesgo por Tasa de Interés, la Brecha de Liquidez y el Flujo de Caja.

Se realizó una exploración de la información de los créditos vigentes mensualmente desde enero de 2001 hasta Febrero de 2003, a través de la cual se dan a conocer una serie de comportamientos atípicos en el hábito de pago de los clientes en cada uno de los rangos de morosidad definidos. Se contó con 26 fechas de corte diferentes, en cada una de las cuales se tuvo en cuenta toda la historia de pagos de crédito vigente hasta su cancelación.

PALABRAS CLAVES: Métodos Estadísticos, Crédito, Pagos.

Inicio

Nombre del trabajo: Aplicación de la Teoría de Valores Extremos en la Medición de Riesgo de Portafolios Óptimos Eficientes Conformados con la Teoría de Markowitz para Acciones Colombianas

Presentado por: Alexander Escobar Berdugo
Título obtenido: Especialista en Estadística
Año: 2004
Director: Norman Diego Giraldo Gómez, M.Sc.

RESUMEN

El mercado financiero ha sufrido muchos cambios durante los últimos años y se han incluido muchos tipos de activos financieros los cuales poseen diferentes niveles de riesgo según las características de los mismos. Debido a la necesidad de cuantificar la probabilidad de obtener pérdidas en el sector del mercado financiero, se han utilizado técnicas tales como Valor de Riesgo para controlar éstas.

Esta monografía tiene como objetivo utilizar una alternativa de análisis para este tipo de datos por medio de la Teoría de Valores Extremos, la cual utiliza cierto tipo de familia de distribuciones para el análisis de las colas de este tipo de datos. Esta teoría fue aplicada para dos tipos de portafolios conformados mediante la Teoría de Markowitz que es una técnica de conformación de portafolios la cual busca maximizar los rendimientos y al mismo tiempo minimizar el riesgo. De esta forma, y aplicando esta teoría para la conformación óptima de dos portafolios de acciones colombianas, se determinó que para portafolios con diferentes rendimientos esperados y que cumplen con , se cumple que y además la distribución de los rendimientos negativos son estadísticamente diferentes.

PALABRAS CLAVES: Mercado de Valores, Métodos estadísticos, Riesgo Financiero.

Inicio

Nombre del trabajo: Herramientas Estadísticas Aplicadas a Mercadeo

Presentado por: Sergio Estrada Jiménez
Título obtenido: Especialista en Estadística
Año: 2004
Director: Víctor Ignacio López Ríos, M.Sc.

RESUMEN

El objetivo primordial del trabajo fue mostrar la importancia de la aplicación de modelos estadísticas como herramienta para medir resultados, soportar la toma de decisiones y entender fenómenos, por medio de la exposición del uso y aplicación de diferentes herramientas estadísticas a modelos de mercadeo. Se mostraron modelos aplicados a los comportamiento del consumidor y de los otros puntos críticos se expuso un modelo aplicado.

PALABRAS CLAVES: Investigación de mercados, métodos estadísticos.

Inicio

Nombre del trabajo: Aplicación del Modelo de Regresión Logística a la Valoración Económica de los Bienes y Servicios Ambientales

Presentado por: Carmenza Castiblanco Rozo
Título obtenido: Especialista en Estadística
Año: 2004
Director: Juan Carlos Correa Morales, Ph.D

RESUMEN

El trabajo describe la forma en que se viene aplicando el modelo de regresión logística en los métodos comúnmente utilizado para valorar bienes y servicios ambientales. En este caso se utilizó el método de valoración contingente para estimar una aproximación del valor, expresado en unidades monetarias, de los beneficios de regulación hídrica que presta el Sistema de Paramos y Bosques Alto Andinos del Noroccidente Medio Antioqueño, sistema que ha sido declarado Area de Manejo Especial por parte de las autoridades ambientales. Con el fin de estimar una aproximación a la Disponibilidad a Pagar (DAP), se aplicaron cincuenta encuestas a los promotores ambientales representantes de los municipios que conforman la zona de amortiguamiento. Aunque el estudio describe claramente cada una de las etapas metodológicas que se deben seguir en este tipo de ejercicios, los resultados obtenidos no fueron estadísticamente significativos.

PALABRAS CLAVES: Regresión logística, valoración contingente, bienes y servicios ambientales, disponibilidad a pagar.

Inicio

Nombre del trabajo: Optimización del Portafolio de Inversiones: Una Aplicación del Algoritmo Genético al Modelo CAPM

Presentado por: Daniel Eduardo Loaiza Restano
Título obtenido: Especialista en Estadística
Año: 2004
Director: Juan Carlos Correa Morales, Ph.D

RESUMEN

Cuando un inversionista decide invertir en acciones busca invertir en aquellas que maximicen su rendimiento y minimicen su riesgo. Sin embargo, a menudo el inversionista encuentra que “no siempre la inversión más rentable es la menos riesgosa”. Ante esta situación, el inversionista debe seleccionar el portafolio óptimo de inversión, esto es, decidir qué cantidad de su capital debe invertir en cada activo, de manera que se reduzca el riesgo y se satisfagan sus expectativas de inversión.

Dos economistas, Harry Markowitz y William Sharpe, desarrollaron un modelo (conocido en la actualidad como el modelo CAPM) que permite seleccionar el portafolio óptimo al calcular la cantidad del capital que debe ser invertida en cada activo. En lo que sigue de este escrito, se evalúa el desempeño del Algoritmo Genético frente a los algoritmos del Solver de Microsoft Excel en la solución del problema de la selección óptima del portafolio de inversión al interior del modelo CAPM.

PALABRAS CLAVES: Algoritmos Genéticos, Portafolio de Inversión, Modelo CAPM.

Inicio

Nombre del trabajo: Censo a Instituciones Generadores de Residuos Hospitalarios en el Municipio de Medellín, Ubicadas en las Comunas 10, 11, 12, 14, 15 Y 16.

Presentado por: Liliana Maria López Vásquez
Título obtenido: Especialista en Estadística
Año: 2004
Director: Juan Carlos Correa Morales, Ph.D

RESUMEN

Este trabajo presenta un estudio sobre el manejo adecuado de los residuos sólidos hospitalarios desde el punto de vista de varias etapas como la segregación, almacenamiento, tratamiento, recolección, trasporte y disposición final en instituciones generadoras de residuos hospitalarios de las comunas 10,11,12,14,15 y 16 del Municipio de Medellín. En este estudio se encontró que existe una relación directa entre las instituciones que poseen Manual de Residuos y las instituciones que separan residuos o utilizan el código de colores.

PALABRAS CLAVES: Razón de odds, Tablas de contingencia.

Inicio

Nombre del trabajo: Enfoque Estadístico como Alternativa a la Aproximación Cinética de la Estimación del Tiempo de Vida Útil de un Producto Cosmético

Presentado por: Rafael A. Salamanca F.
Título obtenido: Especialista en Estadística
Año: 2005
Director: Nelfi Gonzalez Álvarez

RESUMEN

En los estudios de durabilidad de productos cosméticos, los métodos probabilísticos son una alternativa metodológica a los cinéticos. En la estimación de la durabilidad de un jabón sólido, cosmético, se presenta análisis gráfico y la aplicación de las técnicas de riesgo a tiempos de falla obtenidos en condiciones fijas de experimentación.

PALABRAS CLAVES: Riesgo, tiempos de falla, análisis gráfico, diseño escalonado, diseño completamente escalonado

Inicio

Nombre del trabajo: Algunos Análisis Multivariados Aplicados en Investigación de Mercados

Presentado por: Adriana Maria Montoya Valencia
Título obtenido: Especialista en Estadística
Año: 2005
Director: Juan Carlos Correa Morales, Ph.D

RESUMEN

Los análisis multivariados de Escalamiento Multidimensional, Correspondencias Simple y Correspondencias Múltiple tienen en común que buscan resumir una gran cantidad de datos en un número reducido de dimensiones, para facilitar de forma gráfica la interpretación de las posibles relaciones existentes entre las variables. Sin embargo cada uno tiene unos requerimientos y una forma determinada de mostrar la posible relación entre las variables. Por ejemplo el Escalamiento Multidimensional es aplicable a muy diversos tipos de datos y a distintas escalas de medidas, mientras que los análisis de Correspondencias Simple y Múltiple sólo usan variables de datos categóricos.

PALABRAS CLAVES: Análisis Múltivariado, Escalamiento Multidimensional, Análisis de Correspondencias Simple, Análisis de Correspondencias Múltiple, Tablas de contingencia, Independencia, Medidas de similaridad y disimiliaridad, Investigación de mercados.

Inicio

Nombre del trabajo: Desarrollo de un Modelo de Pronósticos para el Número de Llamadas Diarias Entrantes a un Centro de Llamadas de una Entidad Financiera

Presentado por: Adriana Congote Sanmiguel y Horacio Andrés Camacho Pulgarin
Título obtenido: Especialista en Estadística
Año: 2005
Director: Norman Diego Giraldo

RESUMEN

La serie que se va a analizar en este trabajo proviene de la empresa Multienlace S.A. la cual es una empresa proveedora de soluciones de Contact Center, cuyo principal objetivo es ser un socio estratégico en la administración y operación de las relaciones de las empresas con sus clientes, distribuidores o proveedores a través de los contactos que estos tengan por medio del canal telefónico. Para lograr esto, uno de los productos principales es el Centro de Contacto. En éste se implementan líneas de servicio al cliente, las cuales tienen como principal característica el ingreso aleatorio de contactos, es decir, llamadas. Esta característica hace que se tenga un proceso en la compañía dedicado al procesamiento de información que se apoya en la utilización de técnicas y herramientas estadísticas básicas, las cuales con base en información histórica cuantitativa y cualitativa, permiten la proyección del ingreso de contactos en un determinado instante, para realizar la asignación adecuada de los recursos.

PALABRAS CLAVES: Series de Tiempo, Análisis Espectral, Estacionalidad, Residuales Recursivos, Selección de Modelos, Descripción de Pronósticos, Calidad de Pronósticos.

Inicio

Nombre del trabajo: Clasificación de Clientes de aaaa-BBB en Coopemsura

Presentado por: Yadila Hernández Marín
Título obtenido: Especialista en Estadística
Año: 2005
Director: René Iral Palomino

RESUMEN

En el presente trabajo se utilizaron los datos reales de clientes, pagos y créditos de la entidad COOPEMSURA registrados entre Enero de 2001 y Diciembre de 2004, el propósito fue elaborar un modelo de clasificación y/o discriminación para determinar como calificar un cliente antiguo o nuevo entre 1 de 5 categorías definidas desde +AAA a –BBB y donde cada una de ellas hace referencia a la probabilidad de cumplimiento del cliente. Para las definiciones se adoptó la terminología del sector de valores y se aplicaron criterios y reglas que establece la Superintendencia Bancaria para determinar los modelos SARC (Sistema de Administración del Riesgo Crediticio) útiles en la definición de probabilidad de incumplimiento.

PALABRAS CLAVES: Árboles de decisión, , regresión logística multinomial

Inicio

Nombre del trabajo: Imputación de Datos en Series Hidrológicas del Oriente Antioqueño

Presentado por: Alberto Lora
Título obtenido: Especialista en Estadística
Año: 2005
Director: René Iral Palomino

RESUMEN

Mediante este trabajo se pretende implementar una metodología automatizada para la imputación y análisis de series meteorológicas e hidrológicas, especialmente del Oriente. Antioqueño. La metodología adoptada es el Holt Winters extendido para intervalos de tiempo irregularmente espaciados, que fue seleccionada por dos razones principales: 1) la mayoría de la series en hidrología y meteorología son estacionales y 2) la fácil implementación y rapidez en la obtención de los resultados. Realizando ciertas pruebas en las que se suprimía aleatoriamente una cantidad determinada de observaciones, que inclusive podría alcanzar casi el 50% de las totales, los modelos con estacionalidad de tipo aditivo o de tipo multiplicativo. Los resultados conllevan a que el implementar el modelo Holt Winters de tipo multiplicativo, por lo general arrojará imputaciones más confiables y robustas, pero en ciertos sucesos inesperados (intervenciones) tendrá bastantes dificultades

PALABRAS CLAVES: Imputación, series meteorológicas e hidrológicas, Holt-Winters extendido para intervalos de tiempo irregularmente espaciados, estacionalidad aditiva, estacionalidad multiplicativa.

Inicio

Nombre del trabajo: Un Modelo Armax para el Efecto de los Saldos de Liquidez sobre la Serie de los Márgenes de Negociación de Inversiones Voluntarias de una Entidad Financiera

Presentado por: Juan Camilo Mayama Blandón
Título obtenido: Especialista en Estadística
Año: 2005
Director: Norman Diego Giraldo

RESUMEN

Las áreas de Tesorería de una entidad financiera buscan optimizar la rentabilidad de los recursos o liquidez que administran en espera de su colaboración en operaciones de crédito. se analizan dos series de tiempo: la primera corresponde a los saldos de liquidez diarios de una entidad financiera, y la segunda al porcentaje de inversiones voluntarias en relación con el saldo de liquidez de dicha firma. Se implementan técnicas para identificar el modelo de cada serie, además de examinar un modelo de función de transferencia (ARMAX).

PALABRAS CLAVES: Series de tiempo con datos financieros, modelo ARMA, modelo ARIMA, función de autocorrelación

Inicio

Nombre del trabajo: Modelo Logístico para la Evaluación de la Eficiencia Administrativa de los Establecimientos de Créditos del Sistema Financiero Colombiano

Presentado por: Alexander Román Zapata y José María Ramírez
Título obtenido: Especialista en Estadística
Año: 2005
Director: Nelfi González

RESUMEN

La metodología presentada en este estudio permite la evaluación del nivel de eficiencia de los establecimientos de crédito del sistema financiero colombiano que son vigiladas por la Superintendencia Bancaria de Colombia, empleando un modelo logístico que establece si la empresa es eficiente o no eficiente a partir de la información contable de cada una de las instituciones y de algunos indicadores de gestión. El modelo pretende establecer un nivel de eficiencia y capacidad instalada, observando los aspectos más relevantes de la actividad económica que realizan estas instituciones.

PALABRAS CLAVES: Eficiencia, A.E.D. (Análisis Exploratorio de Datos), A.C.P. (Análisis de Componentes Principales), Análisis Cluster, Regresión Logística.

Inicio

Nombre del trabajo: Modelación de la Volatilidad de Series Financiera a Través de los Modelos GARCH

Presentado por: Yisel Alexandra Arias Henao y María del Pilar Martínez
Título obtenido: Especialista en Estadística
Año: 2006
Director: Elkin Castaño Vélez

RESUMEN

Este análisis está basado en la metodología de la modelación ARCH y GARCH y su enfoque teórico y práctico se le aplicará a la acción de Suramericana de Inversiones, tomando el precio histórico diario desde el año 2004 hasta comienzos del año 2006; la elección de esta acción se realizó por el recorrido económico relevante que ha tenido ésta a lo largo de los años en nuestra economía y por todos los factores externos que han influido de alguna manera a explicar el comportamiento de ésta.
En el siguiente trabajo se desarrollará, luego de establecer unos conceptos teóricos generales sobre los procesos ARCH y GARCH y algunas extensiones de estos como los procesos I GARCH y ARCH-M, una aplicación medianamente amplia de la metodología ARCH y GARCH a un índice bursátil colombiano, tratando de exponer un procedimiento básico para enfrentar el análisis de una serie financiera a través de la modelación GARCH y ARCH, desde los disgnósticos de estacionaridad, la identificación, selección y estimación del proceso que sigue su media (modelo ARMA) con sus correspondientes diagnósticos hasta la identificación, selección y estimación del proceso que describe el comportamiento de su varianza (Modelo GARCH).

PALABRAS CLAVES: Heteroscedasticidad, estacionaridad, ARMA, GARCH, varianza, rendimientos.

Inicio

Nombre del trabajo: A Methodology to Calculate Value at Risk of Stock Portafolios Using the Kalman Filter

Presentado por: Sandra Hurtado
Título obtenido: Especialista en Estadística
Año: 2005
Director: Norman Diego Giraldo

RESUMEN

En este trabajo de tesis se implementó un nuevo método para el cálculo del Valor en Riesgo ó VaR de un portafolio de acciones. El VaR es un estadístico que mide el riesgo de un portafolio en el sentido de que provee un valor límite por debajo del cual los rendimientos son negativos y representan una pérdida extrema, la cual puede ocurrir con una probabilidad determinada. El concepto de VaR es similar al de percentil de un proceso estocástico. El método propuesto utiliza los betas de las acciones que conforman el portafolio. Los betas son estadísticos que representan el riesgo sistemático ó propio de la acción, y miden en qué medida el precio de una acción reacciona ante los movimientos del total de la economía, representados por los rendimientos de un índice bursátil, el cual se tomó como el IGBC, el Indice de la Bolsa de Colombia. Como se asumen betas variables, no observables, se utilizó el filtro de Kalman para estimarlos de manera recursiva. Para establecer la conexión entre los rendimientos de las acciones, los rendimientos del índice bursátil y los betas, se asumió un modelo de variables de estado consistente en un sistema de dos ecuaciones. La primera es un modelo para la dinámica de los betas, que se asume un proceso AR(1) multivariado, y para la segunda se asume el modelo CAPM, el cual establece la relación entre los procesos mencionados. El filtro de Kalman es un estimador adecuado para este tipo de modelos de variables de estado. Una vez establecido este modelo con su estimador de los betas, se define la propuesta el estimador del VaR. Se partió de la fórmula del VaR conocida como VaR factorial, la cual depende de los betas pero asume que son constantes, así como al volatilidad de los rendimientos del índice de la bolsa. La propuesta de este trabajo consistió en reemplazar esos valores constantes por correspondientes estimadores recursivos. Para la volatilidad de los rendimientos del índice se propuso utilizar un modelo AR(1)-GARCH(1,1) y para los betas los valores estimados por el filtro de Kalman. Ambos tienen expresiones recursivas. Se realizaron cálculos con base en una base de datos cuidadosamente formada por 20 de las acciones de mayor bursatilidad del mercado colombiano. Se comparó el desempeño del estadístico propuesto con el VaR media-varianza, que es el estándar (benchmark), adoptado por los agentes que deben calcular el VaR en el medio profesional. Los resultados mostraron un desempeño superior del estimador propuesto con respecto al de referencia. Adicionalmente, el trabajo incluyó un resumen de nueve pruebas de hipótesis de uso corriente en econometría para detectar heterocedasticidad (pruebas de: White, Breush-Pagan, Ploberger, ARCH, Ljung-Box, cusum, cusum cuadrado, LaMotte-McWhorter y Sunder) en residuos de regresiones, entendida como un signo de coeficientes variables, para justificar la afirmación de betas variables. Las pruebas se aplicaron a las 20 acciones y se obtuvo evidencia sobre la variabilidad significativa de los betas. Los cálculos y programación se realizaron en SAS v8.2. Los datos semanales de las acciones comprendieron el período 1990-2003. La tesis se redactó en inglés.

PALABRAS CLAVES: Valor en riesgo, modelos AR multivariado, heterocedasticidad, procesos estocásticos.

Inicio

Nombre del trabajo: Modelamiento de la Volatilidad para los Activos Financieros Derivados

Presentado por: José Luis Medina López
Título obtenido: Especialista en Estadística
Año: 2006
Director: Eva Cristina Manotas

RESUMEN

Un Buen análisis de volatilidad del activo financiero, podrá predecir un modelo, que permita anticipar la rentabilidad del mismo en un posible período k sin un proceso de intervención, pero hará para el comprador o el vendedor, de un futuro o de una acción una posterior decisión, con más certidumbre a pesar de la volatilidad heteroscedástica de éstos activos.
La volatilidad también se puede simular en el llamado paseo aleatorio, a través del método Montecarlo, si su varianza es constante. En el caso del ejemplo de este trabajo, el análisis descriptivo, nos impide a simple vista utilizar el método, pues se distingue en el tiempo un modelo con heteroscedasticidad.
En el caso de cualquier derivado, es importante tener la certeza del precio en el mercado, el cual se calcula en función de la tasa de rentabilidad, que es la que se analiza en este trabajo.

PALABRAS CLAVES: Volatilidad, Heteroscedasticidad, activos financieros derivados.

Inicio

Nombre del trabajo: Predicción de los Niveles Plasmáticos del Antipsicótico Risperidona a partir de los Niveles de Actividad del CYP2D6

Presentado por: Martha Lucía Orrego Londoño
Título obtenido: Especialista en Estadística
Año: 2006
Director: Francisco Javier Díaz Ceballos

RESUMEN

El citocromo P450 (CYP) es una familia de enzimas, la cual es la principal responsable de la biotransformación oxidativa de una gran variedad de sustratos endógenos, de las drogas de muchas otras sustancias químicas sintéticas. Se identifican principalmente 3 subgrupos genéticos del CPY (CPY1, CPY2 y CPY3) como responsables del metabolismo de la mayoría de las drogas en los humanos.
La actividad de la enzima CPY2D6 ha sido asociada con el metabolismo de la droga antipsicótica risperidona y muchos otros antipsicóticos. La enzima CYP2D6 metaboliza la risperidona en su principal metabolito (9 hidroxirisperidona); la rapidez con la que se metaboliza el medicamento determina, entre otros aspectos, los efectos secundarios que puede producir este.
Más de 50 alelos diferentes del CYP2D6 pueden afectar la actividad enzimática del CPY2D6 e incrementar los genotipos activos en varias combinaciones. Se destacan mínimo tres niveles de actividad: metabolismo ultrarrápido, normal y pobre.
El CPY2D6 se encuentra en algunas áreas del cerebro, particularmente en aquellas áreas ricas en los transportadores de dopamina, y puede desempeñar un papel importante en la protección de ciertas regiones del cerebro que son susceptibles a tóxicos que tienen acceso al sistema nervioso central.
Los individuos que metabolizan lentamente la risperidona tienen más posibilidad de presentar reacciones adversas a este medicamento; por otro lado, los sujetos que metabolizan muy rápido la risperidona tienden a mostrar una respuesta terapéutica muy pobre al medicamento.
Los individuos que tiene 2 alelos CPY2D6 no funcionales y no tienen actividad de la enzima CPY2D6, son usualmente considerados como metabolizadores pobres (PM); este genotipo es la variación del gen del CPY2D6 más significativa clínicamente. Los estudios americanos y europeos sugieren que aproximadamente el 7% de los blancos poseen el genotipo PM, mientras que en otras razas la proporción es del 1 al 2%.
El propósito principal de este trabajo fue verificar el efecto de ciertos polimorfismos genéticos del CYP sobre la farmacocinética de la risperidona, usando el modelo de regresión logística. También se exploró el efecto de ciertos polimorfismos genéticos de la P-glicoproteína, la cual se considera involucrada en el transporte activo de medicamentos en las vísceras y otras partes del organismo.

PALABRAS CLAVES: Nivel plasmático, risperidona, CYP2D6, regresión logística.

Inicio

Nombre del trabajo: Aplicación del Algunos Métodos Estadísticos para la Identificación y Clasificación de Potenciales

Presentado por: Jairo Adolfo Torres Velásquez
Título obtenido: Especialista en Estadística
Año: 2006
Director: Luis Alfonso Vélez Moreno

RESUMEN

Se presenta una aplicación del método de análisis factorial de correspondencias a la base de datos de la encuesta del Sisbén (Sistema de identificación y clasificación de potenciales beneficiarios para programas sociales) del municipio de Itaguí-Antioquia. El método consiste en buscar similaridades en las familias de acuerdo a las características evaluadas en la encuesta con el fin de encontrar tipologías que permitan discriminarlas y diferenciarlas en grupos para tener un conocimiento global de ellas.
El Sisbén en sí ya es un método que califica a las personas menos favorecidas para beneficiarlas con prevendas que el municipio destina en su gasto público. En este trabajo no se pretende determinar un índice que lo reemplace, sino más bien desarrollar un método complementario que sirva como apoyo en la aplicación del mismo. Esta propuesta va dirigida, entonces, a ubicar unas familias según sus características socioeconómicas, dentro de un estrato, comuna, condiciones de vivienda, etc.
El método aquí expuesto, inicialemente presenta una técnica para depurar las variables de la encuesta, ya que son demasiadas y a veces se dificulta la interpretación a nivel multivariado; y es aquí donde el análisis de correspondencias múltiples y los métodos de clasificación juegan un papel importante.
El papel desempeñado por la entidad que proporciona los datos es crucial, porque luego de obtener los resultados es necesario confrontarlos con la realidad para buscar su adecuada interpretación. Es aquí donde se unen la experiencia con la técnica, es decir, una aplicación adecuada del método debe ir acompañada del conocimiento que se tiene acerca de la fuente de información.
Este trabajo no pretende explicar el método de recolección de la información mediante la encuesta, sino el análisis de los datos resultado de ella, los cuales necesitan de una codificación que le permita a los programas estadísticos su procesamiento.

PALABRAS CLAVES: Análisis factorial de correspondencias, Sisbén.

Inicio

Nombre del trabajo: Anaálisis Morfométrico Multivariado de Varias Especies de Ranas en Relación con su Alimentación

Presentado por: Pablo Andrés Guzmán González
Título obtenido: Especialista en Estadística
Año: 2006
Director: Juan Carlos Salazar Uribe

RESUMEN

Se realizó un análisis exploratorio de las relaciones de tamaño y forma entre el predador y la presa para 20 especies de ranas (9 géneros y 5 familias) de la reserva forestal La Forzosa (Anorí, Antioquia, Colombia). En particular se estudió la relación entre el tamaño (longitud rostro cloaca SVL) y peso, el ancho de la cabeza (AC), la altura de la cabeza (ALC) y el largo de la mandíbula (LM) de las ranas y el tamaño (volumen, largo, ancho) de las presas. Se reportan las relaciones bivariadas de alometría para las ranas. En particular, el LM y el AC fueron las variables mejor correlacionadas con el SVL. Se utilizón un análisis de componentes principales para describir la forma de la cabeza de las especies de ranas. La dieta de las ranas se estudió por examen del contenido estomacal y se encontraron principalmente artrópodos y ningún vertebrado. Los insectos y los arácnidos fueron las clases más representativas, mientras que las hormigas (familia Formicidae) fue el grupo de presas que tuvo la mayor frecuencia en las dietas. Se encontró una relación significativa entre el tamaño de las ranas y el volumen medio de presas consumidas, lo cual sugiere que efectivamente ranas más grandes se alimentan de presas más grandes. De otro lado, la forma de la cabeza también parece afectar el tamaño de las presas, puesto que se observó una tendencia, aunque débil, de que ranas con cabezas más anchas y con una mandíbula más larga consuman un mayor volúmen de presa, no obstante, ranas con cabezas más anchas y con mandíbulas más largas ingieren un número promedio menor de presas que ranas con mandíbulas cortas y cabezas angostas. Algunas explicaciones se ofrecen al respecto.

PALABRAS CLAVES: Morfometría, estadística multivariada, biología, ranas.

Inicio

Nombre del trabajo: Evaluación de los Métodos de Estabilidad Fenotípica a través de Validación Cruzada

Presentado por: Jairo Alberto Rueda Restrepo
Título obtenido: Especialista en Estadística
Año: 2006
Director: José Miguel Cotes Torres (Escuela de Agronomía)

RESUMEN

Una de las principales preocupaciones de los mejoradores de plantas es la evaluación de la estabilidad fenotípica mediante la realización de pruebas regionales o multiambiente. Existen numerosos métodos propuestos para el análisis de estas pruebas regionales y la estimación de la estabilidad fenotípica. En este trabajo se compara el método de regresión propuesto por Eberhat & Russell y el de componentes de varianza propuesto por Shukla, siguiendo un esquema de validación cruzada, utilizando como indicador de un mejor modelo el parámetro RDMSP (root of mean squared error of prediction). Adicionalmente, se calculó la cantidad de veces que un modelo fue mejor que otro, en el esquema de validación cruzada. Fueron utilizados datos provenientes de 20 pruebas multiambiente de maíz, cada una con nueve genotipos, plantadas bajo un DBCA (diseño en bloques completos al azar) con cuatro repeticiones. Se encontró que, según el RDMSP, el mejor modelo para predecir el rendimiento futuro de un genotipo es el método de Eberhat & Russell, lo cual ocurrió el 90.6% de las veces evaluadas.

PALABRAS CLAVES: Interacción genotipo - ambiente, adaptabilidad fenotípica, varianza de Shukla, pruebas regionales

Inicio

Nombre del trabajo: Aplicación de un Diseño de Experimentos para la Optimización de una Formulación Farmacéutica

Presentado por: Alba Lucía Ceballos Maya
Título obtenido: Especialista en Estadística
Año: 2006
Director: Carlos Mario Lopera Gómez

RESUMEN

El desarrollo y formulación de formas farmacéuticas, en particular las formas sólidas, han experimentado un cambio rápido y avance en las últimas décadas principalmente debido a la aparición de los medicamentos genéricos y de alto consumo de éstos en el mundo. Gracias a este crecimiento tan acelerado, los diseños de experimentos empleando optimización estadística para propuestas de preformulación y formulación de fármacos en cada una de las etapas del desarrollo del producto, han sido ampliamente usados en vez del método tradicional ensayo-error, mediante el empleo ycontrol de algunas variables en estudio, pudiendo sugerir expectativas para la formulación "óptima" de un producto en particular. Tales diseños implican una correcta selección y combinación de los niveles de los excipientes con el principio activo, planes de mezclas, entre otros. Lo anterior, además de economizar tiempo, equipos y recursos hace que el producto sea más efectivo y competitivo, cumpliendo con estándares de calidad ya asignados mundial o nacionalmente.
En este trabajo se desarrolla un diseño de experimentos factorial fraccionado y una metodología de optimización basado en superficies de respuesta que permitan al investigador o formulador de medicamentos, encontrar de una forma aproximada, rápida y segura las respuestas deseadas de un fármaco basadas en el perfil de disolución de su forma farmacéutica, con base en una serie de variables estudiadas a través del tiempo de disolución del fármaco (prueba in-vitro), como característica de calidad fundamental de los medicamentos y como predictor específico de la biodisponibilidad de un fármaco in-vivo

PALABRAS CLAVES: Diseño de experimentos, optimización, fármacos.

Inicio

Nombre del trabajo: Indice Global para Evaluar a los Docentes de la Universidad de Medellín

Presentado por: John Fredy López Ossa
Título obtenido: Especialista en Estadística
Año: 2006
Director: René Iral Palomino

RESUMEN

En cualquier área en particular, cuando se pretende analizar los datos, la utilización de la estadística es de gran beneficio, sin embargo para optimizar y lograr profundizar en dicha información la utilización de la estadística descriptiva no es suficiente y se debe utilizar análisis más complejos como los análisis multivariados.
La información con la cual se da inicio al presente análisis corresponde a la encuesta realizada a los estudiantes de la Universidad de Medellín la cual hace referencia a la evaluación de los docentes de pregrado correspondientes al segundo semestre del año 2005.
Las variables para el análisis fueron 20, las cuales hacen referencia a la evaluación de aspectos tales como: saber específico, metodología, evaluación y relación con los estudiantes.
Se pretende con el actual trabajo profundizar en dicho análisis, utilizando para ello métodos de análisis estadístico multivariados: componentes principales y análisis de cluster, para crear un índice global el cual permita evaluar los docentes de la Universidad de Medellín.
Además se puede establecer como una metodología la cual pueda ser aplicada en las continuas evaluaciones a los docentes de pregrado.

PALABRAS CLAVES: Análisis multivariado, componentes principales, análisis de cluster, índice.

Inicio

Nombre del trabajo: Análisis de Componentes Principales para Ocho Marcas de Salsa de Tomate.

Presentado por: Dora Elsy López Ramírez.
Título obtenido: Especialista en Estadística
Año: 2006
Director: Sergio Yáñez Canal

RESUMEN

El análisis sensorial se convierte en una herrmienta importante para la idustria alimenticia ya que evalúa las características de determinados productos ya no desde el punto de vista de sus componentes químicos sino desde los estímulos que producen sobre los órganos de los sentidos, pudiendo determinar el nivel de agrado del consumidor final. Este trabajo busca indagar sobre las características de ocho marcas de salsa de tomate disponibles en el mercado, se toma para ello los resultados arrojados por un panel de expertos, en la segunda parte se trata de establecer grupos de salsas que tengan características semejantes.

PALABRAS CLAVES: Industria alimenticia, componentes principales, análisis sensorial.

Inicio

Nombre del trabajo: Estudio del Índice General de la Bolsa de Valores de Colombia IGBC, Mediante un Modelo ARIMA (p,d,q)

Presentado por: Luis Eduardo Cardona
Título obtenido: Especialista en Estadística
Año: 2006
Director: Eva Cristina Manotas

RESUMEN

En la determinación de un modelo estadístico para explicar el IGBC se empieza con análisis del comportamiento de ese indicador durante el período comprendido entre marzo 02/2005 y junio 03/2006. Dicho análisis expone los cambios que ha sufrido dicho indicador durante este preíodo. Por otro lado pero paralelamente se ha investigado con expertos en el mercado accionario acerca de las posibles fuentes de variación o factores que puedan de alguna manera afectar el comportamiento del IGBC.
Con el análisis del IGBC y de la información obtenida de los expertos se pasa a tratar este indicador como un proceso estocástico, lo cual da paso a la aplicación de la teoría de modelos ARIMA para encontrar un modelo que pueda ser apto para explicar dicho indicador.
Se pretende que este modelo sea apto como una herramienta para inversionistas extranjeros ya que sirve para modelar la tendencia de un valor futuro del IGBC, con lo cual se concluye que el modelo es cortoplacista. Es decir, se utiliza este modelo para pronosticar un valor futuro del IGBC teniendo las última 29 observaciones reales pasadas.

PALABRAS CLAVES: IGBC, mercado accionario, fuentes de variación, modelo ARIMA, pronóstico, PACF, ACF, Inversionista, corto plazo.

Inicio

Nombre del trabajo: Elaboración de una Formulación Farmaceutica a través de un Diseño Experimental de Mezclas

Presentado por: Juan Fernando Pinillos Madrid
Titulo obtenido: Especialista en Estadística
Año: 2008
Director: Carlos Mario Lopera Gómez

RESUMEN

El objetivo principal de este trabajo fue aplicar el diseño experimental de mezclas a la formulación de una forma farmacéutica sólida (ibuprofeno) a través del estudio de sus excipientes y la proporción de estos en la formulación, además de mostrar como el personal de investigación y desarrollo en las empresas farmacéuticas nacionales pueden utilizar las herramientas estadísticas como el diseño de mezclas para obtener un producto con las características requeridas partiendo desde el conocimiento de la función de los excipientes y posteriormente la optimización de un producto adecuado reduciendo no sólo los costos de investigación sino los costos de producción y generando mayor confianza por parte de los consumidores con productos que puedan competir al mismo nivel de los medicamentos innovadores. En este estudio se evaluaron parámetros farmacotécnicos relacionados con los procesos de desarrollo y producción que permitieran garantizar que una tableta de ibuprofeno medicamento genérico cumpla con los requerimientos de calidad y fabricación adecuados acorde con las exigencias dadas por las Buenas Prácticas de Manufactura (BPM) bajo un diseño experimental de mezclas con restricciones caracterizando una superficie de respuesta que permitió un eficiente aprovechamiento de esta metodología para la resolución del problema de formulación.


Palabras claves: Diseño experimental de mezclas, investigación y desarrollo, medicamentos innovadores, medicamento genérico, parámetros farmacotécnicos, BPM, superficie de respuesta.

Inicio

Nombre del trabajo: Caracterización de la Población Estudiantil del  Colegio Colombo-BritánicoUsando Variables Socioeconómicas Y de Dedicación al Estudio Envigado - 2008

Presentado por: Sandra Edilma Velásquez Jiménez
Titulo obtenido: Especialista en Estadística
Año: 2008
Director: Juan Carlos Correa Morales

RESUMEN

Este trabajo pretende obtener una caracterización de la población estudiantil de las secciones de primaria y bachillerato, del Colegio Colombo-Británico pues, “tanto en instituciones educativas, como en muchas otras, se hace necesario disponer de información global y actualizada sobre las personas que la integran, ya que ésta se constituye en una herramienta fundamental para desarrollar aspectos tales como:

Sirve de base para establecer un perfil confiable de los estudiantes con los que se cuenta.
Generación de procesos de evaluación interna.
Creación de soportes de información para el Plan Educativo Institucional.
Consolidación de documentos históricos confiables.

Inicio

Nombre del trabajo: Creación de Índices de Gestión por Calidad para las Organizaciones de Salud Mediante Técnicas de Análisis Multivariado. Acp.

Presentado por: José Bareño Silva
Título obtenido: Especialista en Estadística
Año: 2008
Director: Juan Carlos Correa Morales

RESUMEN

Dar a conocer la propuesta experimental de índices de gestión por calidad para las organizaciones de salud, como recurso de homologación y estandarización de aquellos índices cuya agrupación, bondad de ajuste e interrelación carecen de antecedentes en la literatura científica especializada, no obstante su importancia para nuestras instituciones. Métodos: 1. Revisión bibliográfica y sustentación de la información considerada relevante. 2. Diseño de una matriz que contenga los seis índices escogidos: Oportunidad, Riesgo, Costo/Efectividad, Satisfacción, Innovación e Impacto Ambiental, para un total de catorce indicadores, relativos a estructura, procesos y resultados en cada una de tres áreas clave de la organización tipo: Asistencial, Estratégico/Administrativa y Laboral, la que se somete a consideración como paso previo a la… 3. Simulación del Sistema mediante la técnica estadística multivariable descriptiva de Análisis de Componentes Principales ACP. Resultados: Se espera que el modelo en su conjunto permita el manejo eficiente de la copiosa y cada vez más compleja información sectorial, así como la cualificación, comparación y utilización de los datos para el mejoramiento y la gestión general de las instituciones. Conclusión: Es necesario que con la información recopilada y procesada se puedan tomar decisiones útiles. El trabajo aspira a superar esta necesidad y, de ser posible, a trascenderla.

Palabras clave: gestión por calidad, índices, homologación/estandarización, salud, propuesta experimental.  

Inicio  

Nombre del trabajo: Propuesta de una Metodología de Estimación de Demanda de Accesorios de Joyería, en una Empresa de Venta Directa Colombiana

Presentado por: Anabel María García Tabares
Titulo obtenido: Especialista en Estadística
Año: 2008
Director: Juan Carlos Correa Morales

RESUMEN

Las compañías que operan bajo el canal de venta directa y ofrecen sus productos a través de catálogo, requieren contar con sistemas de predicción de demanda eficientes para cumplirle a sus clientes con la entrega oportuna de sus pedidos, manteniendo de esta manera la relación de confianza que permite la continuidad de las ventas y por ende, el sostenimiento y crecimiento de la compañía.
Estas organizaciones deben garantizar el abastecimiento de los productos a sus clientes con un adecuado control de inventarios, para ello es necesario contar con estimaciones precisas de los diferentes productos que ofrece la compañía cada campaña, evitando los sobre costos por exceso de producción y los agotados por una subestimación.

Inicio

Nombre del trabajo: Productos Antioqueños Exportados a Estados Unidos: Un Anaálisis de Clúster

Presentado por: Sergio Echeverry López
Titulo obtenido: Especialista en Estadística
Año: 2009
Director: Juan Carlos Correa Morales

RESUMEN

Los tratados de libre comercio son una realidad de la economía colombiana, especialmente por la futura aprobación del TLC con los Estados Unidos. En este marco de globalización, las pequeñas y medianas empresas, PYMES, requieren realizar esfuerzos significativos para integrarse a economías de mercado a escala mundial.

En este contexto, los procesos de exportaciones e importaciones dentro de una cadena logística integral toman un papel de primer orden en la planeación estratégico a mediano plazo.

Estados Unidos es el mercado más grande del mundo y su capacidad de compra es un verdadero reto para los países latinoamericanos que pretendan lograr niveles de crecimiento económico sostenible. Países como Chile, México y Costa Rica han aumentado significativamente su ingreso per-cápita y en general, todos sus indicadores macroeconómicos presentan un crecimiento exponencial a partir de la apertura de fronteras con los Estados Unidos, que permite a los exportadores locales ser más competitivos en este exigente mercado.

Inicio

Nombre del trabajo: Técnica de Valoración de un Seguro de Vida con dos Supuestos de Riesgos Competitivos

Presentado por: Luis David Arcila Hoyos
Título obtenido: Especialista en Estadística
Año: 2008
Director: Norman Diego Giraldo Gómez

RESUMEN

La téncia de valoración de de un seguro de vida o Asset Share bajo dos supuestos de riesgos competitivos, es una herramiesta y necesaria en la administración de una compañía aseguradora ya que permite analizar el resultados de un seguro de vida bajo la influencia de diferencies variables, generando el resultado del negocio año tras año.

Dentro de la valoración se pueden presentar dos supuestos de riesgos competitivos. o doble decrementos, los cuales permiten evaluar la interacción entre la probabilidad de muerte y la probabilidad de cancelación del producto, dichos supuestos están asociados a dos distribuciones de probabilidad, distribución uniforme y distribución exponencial.

Inicio

Nombre del trabajo: Implementación de una Metodología de Pronósticos Aplicada al Área de Ventas de Productos a Base de Chocolate para la Compañía Nacional de Chocolates

Presentado por: Gina Andrea Beltrán y Marcela Zuluaga Duque
Titulo obtenido: Especialista en Estadística
Año: 2008
Director Juan Carlos Salazar Uribe

RESUMEN

Este documento presenta una metodología paso a paso para la elaboración de pronósticos de ventas en productos a base de chocolate utilizando métodos cuantitativos.

El pronóstico de ventas define las metas en pesos y en kilos por mes que la compañía proyecta alcanzar en el período de un año. La importancia de los pronósticos radican en que éstos soportan importantes decisiones de tipo estratégico ( a largo plazo) y operativo (a corto plazo), que involucra diversas áreas como: ventas, mercadeo, producción y financiera, algunos ejemplos de estas decisiones son: crecimiento y utilidad, planeación de la producción, planeación de las compras, requerimiento de mano de obra, compra de nuevos equipos, manejo de inventarios, salarios de la fuerza de ventas, recursos para invertir en clientes, entre otros. Así, el pronóstico de ventas se convierte en información muy valiosa y determinante para alcanzar las metas en la organización.

Inicio

 

TESIS DE MAESTRÍA

 

Comparación entre Regresión Logística y Discriminación Cuadrática.
A Methodology to Calculate Value at Risk of Stock Portfolios using the Kalman Filter
Datos Extremos y Distribuciones de Cola Pesada
Comparación entre la Discriminación Normal -Lineal y Cuadrática- y la Regresión Logística para Clasificar Vectores en dos Poblaciones
Incorporación de Mediciones Previas de Concentraciones Plasmátias de una Droga en un Algoritmo de Individualización Basado en un Modelo Lineal con Intercepto Aleatorior
Estimación por el Método de Momentos Eficiente en un Modelo de Volatilidad Estocástica con Asimetría
Estimación de Funciones de Intensidad en un Modelo de Markov de Tres Estados Bajo el Efecto de Covariables con Datos Longitudinales
Estimación de Funciones de Intensidad en un Modelo de Tres Estados en Presencia de Censura Arbitraria
Estimación y Comparación del Efecto de Asimetría en Modelos GJR, con Aplicaciones
Efecto de la Agregación de Ventas y Reclamos en Bases de Datos de Garantía , en el Estimador de la Tasa de Reclamos Agregada y su Varianza
Estimación Robusta en la T2 de Hotelling en Alta Dimensión
La Función de Correlación Cruzada en Series no Estacionarias: Identificación, Tendencias Determinísticas y Raíces Unitarias
Comparación entre Análisis Discriminante no Métrico y Regresión Logística
Extensión del análisis gráfico del modelo lineal general a los modelos lineales generalizados Poisson y Gamma
Comparación entre análisis discriminante no métrico y regresión logística multinomial
Efecto en las estimaciones bajo distintas formas distribucionales del término aleatorio en un modelo lineal mixto adaptado a una cadena de Markov con espacio de estados ordinal
Distribución Predictiva Bayesiana para Modelos de Pruebas de Vida Vía MCMC
Robustez de un Modelo de Markov de Tres Estados Bajo Distintas Especificaciones Distribucionales de los Tiempos de Transición
Estimación en los modelos SETAR con base en Métodos de Momentos Generalizados.
Comparación de 4 Procedimientos FDR para la Selección de Parámetros en Regresión Poisson

Generalización de un Algoritmo de Individualización de la Dosis de una Droga Usando un Modelo Lineal Mixto.

Control Multivariado de Procesos con Variables Binomiales Bivariadas
Clasificación Jerárquica de Objetos a Partir de Experimentos de Comparaciones Pareadas.
Estimación de un Modelo de Difusión con Saltos con Distribución de Error Generalizada asimétrica Usando Algoritmos Evolutivos
Comparación de Árboles de Regresión y Clsificación y Regresión Logística

 

Nombre de la Tesis: Datos Extremos y Distribuciones de Cola Pesada.

Presentado por: Francisco Javier Díaz
Título obtenido: Magister en Estadística
Año: 1996
Director: Norman Giraldo

RESUMEN

Se define una clase particular de distribuciones, la clase E, que tiene la propiedad siguiente: si X está en E y tiene una función de distribución F entonces existe un número real q en el intervalo (0,1] tal que el límite inferior del cociente P(Xx+t)/P(Xt), cuando t tiende a infinito es una función de x, g(x), tal que esta función tiende a q cuando x tiende a su vez a infinito. El caso q=1 es bien conocido en la literatura. Se conocen propiedades de esta clase tales como el ser cerrada por convolución. Esta propiedad es extendida al caso E, al igual que otras propiedades. También se prueba un teorema de caracterización de la clase E con base en los cuantiles residuales, definidos como los cuantiles de la distribución residual de X en un valor x=t, es decir, la función Ft(x)=1-P(Xx+t)/P(Xt), t 0. Los estimadores de estos cuantiles para varias probabilidades p = 0.1, ..., 0.9, permiten definir un método gráfico para determinar el tipo de distribución de los datos con respecto pertenecer o no a la clase E. El gráfico conjunto de tales cuantiles se denominó "ramillete de cuantiles residuales". Se mostraron varias aplicaciones del método con datos reales y simulados.

Palabras Clave: Distribuciones de cola pesada, clase E, ramillete de cuantiles residuales.

Inicio

Nombre de la Tesis: Elementos para una Teoría de Estimación de Procesos Impulsibos con Aplicaciones en Telecomunicaciones

Presentado por: Juan G. Gonzalez Cuartas
Título obtenido: Magister en Estadística.
Año: 1997
Director: Juan Carlos Correa Morales

RESUMEN

En esta Tesis introducimos los elementos fundamentales para una teoría estadística aplicada a procesos impulsivos o con colas pesadas.
Es bastante reconocido que la teoría clásica, centrada alrededor de los procesos Gaussianos y de segundo orden, no es adecuada para caracterizar procesos que presenten datos contaminados o "outliers". Los métodos de estimación estándar basados en la media y varianza muestrales, presentan un desempeño bastante pobre cuando las colas de las distribuciones se hacen ligeramente más pesadas que las colas Gaussianas. Existen procesos impulsivos generados por fenómenos naturales, cuya distribución probabilística es bastante alejada de una ley Gaussiana. Este caso es bastante evidente en ciertos sistemas de comunicaciones, donde los procesos de ruido ocasionados por ejemplo por tormentas eléctricas o por interferencias tipo "ráfagas" tales como las observadas en telefonía celular, hacen que las colas de las distribuciones sean significativamente pesadas. Dadas las limitaciones de la teoría clásica en muchos tipos de procesos impulsivos encontrados en la práctica, es necesario construir un marco teórico bajo el cual todo tipo de proceso, impulsivo o no, pueda ser tratado. La construcción de dicho marco teórico es el principal objetivo de esta Tesis. Para definir nuestro escenario de trabajo, introducimos primero la clase de procesos de orden logarítmico. De la misma forma como un proceso de segundo orden se caracteriza por poseer una potencia finita (EX2 < ), los procesos de orden logarítmico se caracterizan por poseer un momento logarítmico finito (Elog|X| < ). Además de incluir a todos los procesos de segundo orden, la familia de procesos de orden logarítmico incluye una importante clase de procesos con varianza infinita. Como es de esperarse, la alta variabilidad generada por las varianzas infinitas hace que estos procesos jueguen un papel fundamental en el modelaje de fenómenos impulsivos. Con base en el momento de orden logarítmico, introducimos entonces la
potencia geométrica, como un indicador de escala asociado a la fortaleza o intensidad de un proceso. Este nuevo parámetro ha de jugar un papel central en el desarrollo de nuestra teoría, y como demostraremos en este trabajo, cumple propiedades importantes que incluyen la multiplicatividad y ciertas desigualdades del tipo Chebyshev. Con base en la potencia geométrica definiremos la dispersión y la localización
de orden cero, los cuales jugarán, dentro del marco de los procesos de orden logarítmico, un papel similar al jugado por la desviación estándar y la media en la teoría de segundo orden. Basados en las propiedades de estos parámetros, derivaremos una de las principales contribuciones en esta Tesis: el estimador de localización de orden cero, del cual probaremos propiedades de optimalidad cuando los procesos presentan altos índices de impulsividad. Esta Tesis abre una nueva teoría. Como cualquier nueva área, quedan muchas preguntas abiertas y trabajos por desarrollar. Esperamos que nuestro trabajo sirva como "mecha" que inicie un fuego que se expanda y brinde bases sólidas a los Estadísticos de Orden Cero.

Palabras Clave: Procesos impulsivos, procesos con cola pesada, desigualdad de tipo Chebyshev

Inicio

Nombre de la Tesis: Efectos de las Observaciones Outliers en Modelos de Estructura de Covarianza

Presentado por: Carlos Mario Parra Mesa
Título obtenido: Magister en Estadística
Año: 1998
Director: Juan Carlos Correa Morales

RESUMEN

En el trabajo se analiza la incidencia que tienen las observaciones outliers o atípicas en la estimación de parámetros de un modelo de estructura de covarianza. Se definió un modelo recursivo de la clase de modelos LISREL completos, que consta de 2 variables latentes endógenas y una exógena, cada una de las cuales tiene asociada 3 variables medibles cuyos errores de medición están incorrelacionados. Además, se generaron 10000 observaciones independientes de N9 (O, S) a travéz del procedimiento IML del SAS; se escogió el método de estoimación de máxima verosimilitud y se ajustó el modelo a travéz del procedimiento CALIS del SAS. Las estimaciones de los parámetros a partir de tal muestra se tomaron como valores de referencia y frente a ellos se evaluaron los resultados de las estimaciones de los mismos parámetros cuando la muestra fué contaminada por cambios preestablecidos en una de las componentes de la observación multivariada y en número de 1, 100, 500 y 1000 observaciones.
Empleando métodos heurísticos, se analizaron la dirección de los cambios en las estimaciones según los factores de control, así como el impacto en las ecuaciones estructurales que resultaron afectadas.

Palabras Clave: Modelo Lisrel, Outlier, Simulación, Modelos de estructura de covarianza

Inicio

Nombre de la Tesis: Comparación entre la Discriminación Normal - Lineal y Cuadrática- y la Regresión Logística para Clasificar Vectores en dos Poblaciones

Presentado por: Francisco Javier Castrillón Meneses
Título obtenido: Magister en Estadística
Año: 1998
Director: Juan Carlos Correa Morales

RESUMEN

La clasificación de vectores está basada en la estimación de los parámetros de la ecuación de la frontera entre las dos poblaciones también conocida como Función Discriminante de Fisher. Si la estimación se hace por máxima verosimilitud a partir de una muestra correctamente asignada, el método es conocido como Procedimiento de Discriminación Normal. Pero si se hace condicionalmente sobre los vectores observados, el método se conoce como Procedimiento de Regresión Logística.

El Procedimiento de Discriminación Normal lineal -que se da cuando las
varianzas son iguales- es mejor que el de Regresión Logística como lo muestra el cálculo de la Eficiencia Asintótica Relativa o ARE entre ambos, que indica los tamaños apropiados de las muestras que deben ser tomadas por los dos procedimientos para lograr la misma eficiencia en la clasificación. En cambio, si las matrices poblacionales son diferentes, el Procedimiento de discriminación es cuadrático y es menos eficiente que
el de regresión logística como se prueba vía simulación.

Palabras Clave: Clasificación de vectores, función discriminante de Fisher, regresión logístca, discriminación normal-lineal y cuadrática, ARE

Inicio

Nombre de la Tesis: Projection Pursuit Discreta

Presentado por: Juan Carlos Salazar Uribe
Título obtenido: Magister en Estadística
Año: 1998
Director: Juan Carlos Correa Morales

RESUMEN

Projection Pursuit es una técnica exploratoria ideada para trabajar con datos de alta dimensión. Projection Pursuit realiza una búsqueda intensa entre muchas proyecciones de los datos buscando aquellas que muestren facetass interesantees del conjunto de datos originales.

este trabajo pretende mostrar algunos usos prácticos de la técnica P.P. Discreta usando diferentes tipos de proyecciones; la elección de estas proyecciones depende de la estructura de los datos. Projection Pursuit Discreta permie obtener proyecciones que pueden representar ciertos comportamientos de los datos.

Uno de los aspectos importantes de Projection Pursuit Discreta es que permite la reducción de la dimensionalidad del problema, pues las proyecciones usualmente se hacen a una, dos o tres dimensiones. Una vez se obtienen estas proyecciones se debe trataar de encontrar aspectos interesantes de la geometría p-dimensional de los datos. También se trata de resaltar la importancia de la transformada de Radon en el contexto de P.P. Discreta y la forma como se obtienen proyecciones con ella.

Se expone un algoritmo para implementar la técnica, cuando se tiene no datos referentes a conteos organizados en forma matricial.

Este último es uno de los aportes más importantes de este trabajo y subraya la importancia de P.P. Discreta como técnica exploratoria.

Adicionalmente se revisan algunas de las formulaciones más importantes de la Entropía; Se mostrará una aplicación de P.P. Discreta para explorar tablas de contingencia, exactamente en el ejemplo referente a pruebas Icfes; cabe anotar que en este ejemplo, se plantea un método para trasladar esas tablas de contingencia, al espacio vectorial , donde m es el número de tablas que particionan la población y n es el número de celdas de cada tabla; esto facilita el cálculo de la trasformada de Radon; en otro ejemplo se compara la técnica con un vínculo simple, que utiliza la distancia del vecino más cercano; también hay aplicaciones de P.P. discreta en pruebas de selección múltiple y en estudios de ordenamientos, resaltando la importancia de conjuntos tales como y en el marco de P.P. discreta.

Palabras Clave: Projection Pursuit, Transformada de Radon, métodos jerárquicos, tablas de contingencia.

Inicio

Nombre de la Tesis: Comparación de Algunas Medidas Multivariadas de Asimetría y Kurtosis y su Utilización en Pruebas de Multinormalidad

Presentado por: Mario César Jaramillo Elorza.
Título obtenido: Magister en Estadística.
Año: 1999
Director: Sergio Yañez Canal

RESUMEN

El trabajo germinal de Mardia (1970) da definiciones multivariadas de Asimetría y Kurtosis que son usadas en pruebas de multinormalidad, y ha dado origen a gran variedad de extensiones y formalizaciones. Se hace una revisión de dichos conceptos y de las comparaciones entre ellos en cuanto a su potencia. Se muestra como los tests formales de bondad de ajuste basados en el principio Score de Rao y la noción de tests suaves de Neyman no son mejores que los basados en estadísticos que generalizan las nociones de asimetría y kurtosis.

Palabras Clave: Asimetría, kurtosis, multinormalidad, afin invariantes, dependientes de coordenadas, principio Score de Rao, tests suaves de Neyman, estudios de potencia

Inicio

Nombre de la Tesis: Una Transformación de Simetría, Vía Marginal y la Media Retransformada para el Caso Bivariado

Presentado por: Juan Delgado Lastra
Título obtenido: Magister en Estadística.
Año: 1999
Director: Elkin Castaño Vélez

RESUMEN

Muy a menudo en el análisis estadístico de datos multivariados es neresario realizar transformaciones sobre los datos debido a la presencia de valores atípicos o a la asimetría de su distribución.

Para el análisis de esta clase de datos, este trabajo de grado presenta un estimador de la transformación de potencia vía marginal que los simetriza y, un estimador de baja sesgo de la media retransformada bivariada sin hacer uso del supuesto de normalidad bivariada.

A través de la técnica de bootstrap se obtuvo tanto la matriz de var-covarianzas del estimador de la transformación, como el de la media retransformada bivariada. Los resultados obtenidos a través de simulación muestran que el procedimiento propuesto parece ser un competidor del método de Máxima verosimilitud en distribuciones como la lognormal, gama tipo I y pareto bivariadas, aunque no ocurrió lo mismo con la distribución Beta Stacy, pues en este caso no fue posible simetrizar la muestra vía marginal, supuesto básico en la aplicación de este método, muy posiblemente por la situación de dependencia entre las dos variables.

Palabras Clave: Técnica Bootstrap, Retransformada Bivariada, Distribución lognormal, gama tipo I y paralelo bivariada.

Inicio

Nombre de la Tesis: Detección de Outliers Multivariables Mediante Projection Pursuit

Presentado por: Victor Ignacio López Rios
Título obtenido: Magister en Estadística
Año: 1999
Director: Juan Carlos Correa Morales

RESUMEN

En este trabajo presentamos la revisión de algunos métodos para la detección de outliers multivariables e implementamos una nueva técnica utilizando el enfoque por "Projection Pursuit" (P.P.) (búsqueda de proyecciones). Con el fin de evaluar las proyecciones construímos dos índices: Uno de ellos es una versión del índice radial unidimensional y el otro se basa en la diferencia media de Gini. Mediante simulaciones mostramos situaciones particulares en las cuales la técnica P.P. detecta los outliers multivariables en forma exitosa, mientras que el método más utilizado de los revisados, el de componentes principales, no los detecta.
Por último, ilustramos la metodología P.P. con un conjunto de medidas antropométricas.

Palabras Clave: Outliers multivariables, Projection Pursuit, Indices de Projection Pursuit, Diferencia media de Gini, Indice Radial y componentes Principales.

Inicio

Nombre de la Tesis: Identificación de Grupos de Datos Influenciales en Regresión Logística Mediante Clusters

Presentado por: Carlos Mario Lopera Gómez
Título obtenido: Magíster en Estadística
Año: 2002
Director: Juan Carlos Correa Morales

RESUMEN

La detección de grupos de datos influenciales es ampliamente utilizada en regresión lineal. Este trabajo pretende extender al caso de tener una regresión logística, un método de identificación de grupos de datos influenciales en regresión lineal basado en clusters propuesto por J. B. Gray y R. F. Ling (1984). Para cumplir con este objetivo se definen a partir de medidas para grupos de datos influenciales útiles en regresión lineal, medidas de influencia similares en el caso logístico, de igual forma se presenta una técnica basada en clusters que permitirá identificar grupos de datos influenciales en el caso logístico, y posteriormente, se evaluará el desempeño del procedimiento mediante simulación de configuraciones contaminantes en regresión logística, lo cual permite establecer las fortalezas y debilidades de la técnica. La evaluación de la efectividad se hace utilizando las medidas de influencia generalizadas al caso logístico acompañadas de gráficos donde se puede ratificar si aquellos grupos de datos candidatizados a influenciales por la técnica propuesta en realidad lo son o no se deben tener en cuenta en el análisis y esos mismos gráficos permitirán candidatizar nuevos grupos de datos.

Palabras Clave: Regresión Logística, Análisis de Clusters, Identificación de Grupos de Datosinfluenciales.

Inicio

Nombre de la Tesis: Carta T2 con Base en Estimadores Robustos de los Parámetros

Presentado por: Nelfi Gertrudis Gonzalez
Título obtenido: Magíster en Estadística
Año: 2003
Director: Sergio Yáñez

RESUMEN

Una causa de estado de fuera de control en la primera etapa de implementación de un sistema de control estadístico multivariado, usando la carta T2 de Hotelling con n observaciones históricas individuales, consiste en la presencia de k outliers multivariados ubicados arbitrariamente en dicho conjunto de datos. La carta T2 basada en los estimadores insesgados usuales del vector de medias y de la matriz de varianzas covarianzas carece de robustez ante la presencia de este tipo de observaciones. En este trabajo se pretende utilizar procedimientos desarrollados en detección de outliers multivariados y estimación robusta con el fin de subsanar esta deficiencia de la carta T2. El procedimiento propuesto consiste en el uso de estimaciones robustas del vector de medias y de la matriz de varianzas covarianzas en la construcción del estadístico T2. Se prueba con estimadores MVE (Elipsoide de Mínimo Volumen), estimadores S biponderados y estimadores Stahel - Donoho y mediante simulación se comparan estos procedimientos frente a diversos niveles de contaminación con outliers provenientes de tres modelos contaminantes; el desempeño es establecido con base en cuatro medidas obtenidas como promedio de las simulaciones y para la comparación se recurre a gráficos de las curvas de respuesta de cada medida, en cada nivel y modelo de contaminación. Los resultados señalan que los procedimientos basados en estimadores S y MVE son consistentemente los mejores para la detección de outliers provenientes de perturbaciones en el vector de medias y/o la matriz de varianzas covarianzas, y en particular el procedimiento basado en estimadores S resulta ser el mejor.

Palabras Clave: Control multivariado, T2 de Hotelling, estimadores robustos, outliers multivariados

Inicio

Nombre de la Tesis: El Efecto de la Dependencia entre los Tiempos de Falla en la Estimación de la Confiabilidad de un Sistema con Dos Modos de Falla

Presentado por: Eva Cristina Manotas
Título obtenido: Magíster en Estadística
Año: 2003
Director: Sergio Yáñez

RESUMEN

En esta investigación el objetivo central es identificar el efecto de la dependencia entre tiempos de falla en la estimación de la confiabilidad de un sistema con dos modos de falla. Esto implica obtener la función de confiabilidad del tiempo mínimo entre tiempos de falla. La metodología tradicional asume independencia entre tiempos de falla. Este trabajo pretende medir el grado de error que dicho supuesto conlleva, para ello se hacen simulaciones que obtienen tiempos bivariados asociados a diferentes distribuciones Lognormales y Weibull, ya que éstas son de amplio uso y aplicación. Cada escenario de simulación contiene 6 situaciones diferentes, asociadas a 6 valores del parámetro de dependencia entre los tiempos de cada modo de falla; la dependencia es medida por el coeficiente de correlación en el caso lognormal, y el parámetro de dependencia? en el caso Weibull. Se obtienen así las medidas pertinentes para cada una de las situaciones estudiadas, y se aprecia de los resultados analíticos que cuando se ignora la dependencia, hay diferencias considerables entre la función de confiabilidad verdadera y la estimada

Palabras Clave: Confiabilidad, Dos modos de falla, Distribución del tiempo mínimo, Lognormal bivariada, Weibull bivariada, parámetro de dependencia.

Inicio

Nombre de la Tesis: Modelos y Análisis para Datos de Degradación

Presentado por: Ronald Andrés Granada Galvis
Título obtenido: Magíster en Estadística
Año: 2004
Director: Sergio Yáñez

RESUMEN

La degradación es un deterioro progresivo que eventualmente puede causar la falla (e.g, el desgaste que sufren los neumáticos de un automóvil). Cuando es posible medirla, ésta puede proporcionar mayor información que los datos de tiempo de falla, para propósitos de determinación y mejoramiento de la confiabilidad de un producto. Se desarrollan técnicas propuestas por Meeker y Escobar (1998)) hoy en la frontera de la Teoría de Confiabilidad (Lawless (2000)). En este trabajo se compara el análisis aproximado de degradación con el modelo de degradación explicito. Estos últimos modelos implican la utilización de modelos físicos de degradación a los cuales se les introducen efectos aleatorios. Se implementan las técnicas para la estimación de modelos mixtos en S-PLUS siguiendo a Pinheiro y Bates (2000) y con métodos bootstrap se calculan los intervalos de confianza. Se utiliza la simulación para comparar las dos metodologías propuestas y hacer recomendaciones relativas a su utilización.

Palabras Clave: Metodologías para el Análisis de Datos de Degradación,

Inicio

Nombre de la Tesis: Propiedades Estadísticas de un Algoritmo Adaptable para Individualizar la Dosificación en un Esayo Clínico Controlado por Concentración

Presentado por: Tulia Esther Rivera Flórez
Título obtenido: Magíster en Estadística
Año: 2004
Director: Francisco Javier Díaz Ceballos

RESUMEN

Un problema fundamental de la farmacología clínica, es el determinar la dosificación óptima de una droga que producirá una concentración plasmática deseada de la droga, o que producirá una concentración que esté dentro de un rango de concentraciones deseado, para un paciente determinado. Para resolver este problema, se ha propuesto el uso de la estimación Bayesiana empírica, en combinación con modelos farmacocinéticos poblacionales mixtos y medidas repetidas de concentraciones. El objetivo de esta tesis es sugerir como individualizar la dosificación de una droga en un paciente particular, o en un sujeto experimental, cuando el logaritmo de la razón concentración/dosificación de una droga en el estado estable puede describirse con un modelo lineal con intercepto aleatorio. El modelo puede incluir covariables tales como la edad, el género, el peso corporal, el uso concomitante del cigarrillo u otras drogas, estados de enfermedad y demás variables relevantes, clínicas o demográficas. Nuestra propuesta implementa un algoritmo adaptable con retroalimentación Bayesiana empírica, con el fin de determinar la dosificación óptima correspondiente a un rango de concentraciones deseado sugiriendo un criterio de optimalidad para detener la búsqueda de la dosificación y mostrando expresiones que permiten calcular el número mínimo de pasos del algoritmo necesarios para obtener la dosificación óptima.

Palabras Clave: Algoritmo con Retroalimentación Bayesiana, Clozapina, Individualización de la dosis, Modelo lineal mixto con intercepto aleatorio, Ensayos clínicos controlados por Concentración, Concentración Estable, Ventana Terapéutica.

Inicio

Nombre de la Tesis: Bandas de Confianza de Percentiles Relativos entre Poblaciones Lognormales, con Aplicación a Tiempos de Supervivencia de Pacientres con Sida

Presentado por: Fidel Ernesto Castro Morales
Título obtenido: Magíster en Estadística
Año: 2004
Director: Francisco Javier Díaz Ceballos

RESUMEN

En esta tesis se desarrolla la banda de confianza de tiempos relativos para comparar las funciones de supervivencia de dos poblaciones lognormales, en presencia de censura a derecha, controlando el efecto de posibles variables confundentes y sin asumir necesariamente un parámetro de escala homogéneo entre las poblaciones. Con el fin de comparar esta tesis, con el trabajo realizado por Muñoz y Sunyer (1996); también, se describe la banda de confianza de tiempos relativos para comparar las funciones de supervivencia de dos poblaciones Weibull. Como aplicación, se usa una muestra de 405 hombres homosexuales con SIDA diagnosticados con neumonía P. Carinii obtenida en un estudio multicentro realizado en cuatro centros médicos en los Estados Unidos, entre los años de 1984 y 1992. En esta aplicación, se usan los tiempos relativos para medir el efecto producido por la introducción de diferentes terapias antivirales, en el tiempo de supervivencia (medido desde el momento del diagnóstico de neumonía P. Carinii hasta la muerte del sujeto) controlando la edad al momento del diagnóstico, el conteo de CD4, la raza y el tabaquismo. Asumiendo los modelos lognormal y Weibull para los tiempos de supervivencia, se determinó que sólo la edad y el conteo de CD4 tienen un efecto significativo sobre el tiempo de supervivencia. Por otro lado, los tiempos relativos asumiendo ambos modelos permitieron concluir que el tiempo de supervivencia de los sujetos es alargado con el uso de las nuevas terapias introducidas después de 1987. Como conclusión, se muestra que la estimación e inferencia de los tiempos relativos para comparar funciones de supervivencia de poblaciones lognormales, requiere de procedimientos sencillos y proporcionan una interpretación directa. Además, se muestra que los tiempos relativos son un procedimiento útil para comparar dos poblaciones lognormales sin asumir necesariamente un parámetro de escala homogéneo entre éstas.

Palabras Clave: Percentiles relativos, distribución lognormal, Bandas de confianza, comparación de poblaciones, variables de confusión.

Inicio

Nombre de la Tesis: Diagnósticos de Convergencia para algoritmos MCMC en la Estimación de Modelos Jerárquicos Bayesianos

Presentado por: Mauricio Zapata Cuartas
Título obtenido: Magíster en Estadística
Año: 2005
Director: Juan Carlos Correa Morales

RESUMEN

Se presentan dos nuevas rutinas de diagnóstico de convergencia sobre los métodos MCMC (Markov Chain Monte Carlo), especialmente de los generados con muestreadores de Gibbs cuando se aplican a estimación de modelos bayesianos de alta dimensionalidad. Un aspecto importante en la aplicación de estos método es determinar cuándo se debe parar de muestrear y cuantas iteraciones son suficientes para estimar características de las distribuciones de interés. La nueva propuesta presentada aquí es una combinación de métodos de diagnóstico gráficos y cuantitativos reportados en la literatura que operan secuencialmente sobre la salida de los muestreadores y la combinación entre ellos complementan un adecuado diagnóstico. Para efectos de poner en práctica las propuestas de diagnóstico se presentan dos casos de ejemplo. el primero es un caso de estimación de un modelo normal trivariado simulado con alta correlación (de baja dimensionalidad), el segundo es un caso de estimación de un modelo jerárquico con datos longitudinales reales (alta dimensionalidad). La primera rutina de diagnóstico opera sobre salidas con una cadena y prueba en que momento la muestra proviene de una distribución estacionaria. La segunda rutina opera sobre salidas con múltiples cadenas e intenta probar cuándo las cadenas simultáneamente provienen de una distribución estacionaria. Con los ejemplos se muestra que las dos nuevas rutinas de diagnóstico son consistentes con los parámetros estimados, pero pueden presentan grandes diferencias en cuanto a la longitud de cadenas de Markov necesarias y los requerimientos de tiempo de cómputo. Se recomienda la primera rutina de diagnóstico por su fácil ejecución y por ser la que menos tiempo y memoria de cómputo requiere. Todos los procedimientos utilizados se pueden implementar en software gratuito y existen para algunas de las rutinas códigos disponibles.

Inicio

Nombre del trabajo: Incorporación de Mediciones Previas de Concentraciones Plasmáticas de una Droga en un Algoritmo de Individualización Basado en un Modelo Lineal con Intercepto Aleatorio

Presentado por: Diego Mauricio Rendón
Título obtenido: Magíster en Estadística
Año: 2007
Director: Francisco Javier Díaz Ceballos

RESUMEN

El presente trabajo popone, mediante la generalización de algunos resultados, proporcionar una metodología para la incorporación de mediciones previas de pares dosis-concentración, en un algoritmo de individualización de droga propuesto por Díaz et al. (2006) y que asume un modelo lineal con intercepto aleatorio. Igualmente, también se calcula el número de observaciones (tamaño muestral) que se requiere para generar, con un algoritmo o procedimiento diferente al propuesto por Díaz et al. (2006), dosis que produzcan, con la máxima probabilidad obtenible, concentraciones de droga dentro de un rango objetivo.

PALABRAS CLAVES: Retroalimentación bayesiana, individualización de dosis de droga, concentración óptima

Inicio

Nombre del trabajo: Estimación por el Método de Momentos Eficientes en un Modelo de Volatilidad Estocástica con Asimetría

Presentado por: Mauricio Lopera Castaño
Título obtenido: Magíster en Estadística
Año: 2007
Director: Norman Diego Giraldo Gómez

RESUMEN

En este trabajo se realiza un estudio Monte Carlo sobre las propiedades de los métodos de estimación GMM y EMM en un modelo de volatilidad estocástica asimétrico. El método de estimación GMM usa esperanzas incondicionales como condiciones poblacionales para hallar estimaciones. Por otro lado, EMM usa la esperanza bajo el modelo estructural del score de un modelo auxiliar como condiciones poblacionales.
Se utilizan densidades paramétricas y semi-paramétricas permitiendo estructuras heteroscedásticas del tipo GARCH y EGARCH. Como se verá EMM supera muy notablemente a GMM en cuanto a error cuadrático medio, sesgo y tasa de convergencia, no sólo en grandes sino también en muestras pequeñas.
Para tamaños muestrales a partir de n=2000, las propiedades del procedimiento de estimación EMM en los parámetros del modelo de volatilidad estocástica asimétrico son robustas. Además de esto, los errores estándares de los estimadores EMM son bastante bajos por lo cual este procedimiento de inferencia es bastante exacto sobre los parámetros poblacionales.


PALABRAS CLAVES: Método de Momentos Eficiente (EMM), Modelo de volatilidad estocástica, asimetría.

Inicio

Nombre del trabajo: Estimación de Funicones de Intensidad en un Modelo de Markov de Tres Estados Bajo el Efecto de Covariables con Datos Longitudinales

Presentado por: René Iral Palomino
Título obtenido: Magíster en Estadística
Año: 2007
Director: Juan Carlos Salazar Uribe

RESUMEN

Los modelos de estados múltiples han demostrado ser de utilidad para el análisis de datos longitudinales, particularmente aquellos que involucran información acerca de la prograsión de una enfermedad a través del tiempo, Kay (1986). En este trabajo se considera un proceso de Markov con tres estados que pueden representar los estados de una enfermedad: Sano, Declarado y Muerte, por ejemplo. El objetivo primordial es poder modelar las tasas de transición entre estados y estimar los parámetros asociados a dichas tasas. Por medio de un estudio de simulación se obtienen condiciones óptimas para tamaños de muestra y número de mediciones repetidas de los individuos involucrados para estimar las tasas de transición de un estado a otro, a través de la cobertura de los respectivos intervalos de confianza estimados. Posteriormente considerando dichas condiciones óptimas se mide el efecto de introducir covariables en el modelo en la estimación de las tasas de transición al contrastarlas con aquellas obtenidas sin tener en cuenta las covariables, evaluado a través del sesgo relativo. El algoritmo utilizado en ambos casos, requiere la estimación de las varianzas de las tasas de transición, las cuales son estimadas usando el método delta, Van der Vaart (2000), y el cual constituye el aporte más significativo de este trabajo. La técnica se ilustra usando datos de la CIB (Corporación para Investigaciones Biológicas CIB, Medellín) acerca del daño de las articulaciones de manos y pies de un paciente con artritis reumatoide (AR).


PALABRAS CLAVES: Funciones de intensidad, modelo de Markov de tres estados, datos longitudinales

Inicio

Nombre del trabajo: Estimación de Funciones de Intensidad en un Modelo de Tres Estados en Presencia de Censura Arbitraria

Presentado por: Luisa Fernanda Rosales Cerquera
Título obtenido: Magíster en Estadística
Año: 2007
Director: Juan Carlos Salazar Uribe

RESUMEN

Los modelos de estados múltiples conforman una importante familia de herramientas estadísticas que sirven para modelar la dinámica de procesos recurrentes a través del tiempo o algún fenómeno cambiante en el tiempo. En este trabajo se estudia una metodología para estimar funciones de intensidad dependientes del tiempo en presencia de censura de intervalo y censura a derecha cuando se considera un modelo de tres estados del estilo enfermedad - muerte como el propuesto por Harezlak, Gao & Hui (2003). Esta metodología constituye una generalización de la propuesta por Joly & Commenges (1999) para estimar las funciones de intensidad. Adicionalmente, se deduce matemáticamente la función de verosimilitud, la cual incorpora información que ha sido recolectada longitudinalmente, así como los diferentes modos de censura. Esta verosimilitud se debe optimizar numéricamente con la ayuda de una cuadratura de Gauss ya que en dicha expresión aparece una integral que se relaciona con unidades censuradas. Se explora, por medio de un estudio de simulación, un método basado en funciones por tramos (Faddy 1976) para obtener una estimación de las intensidades. Finalmente, se ilustra la metodología usando datos reales.

PALABRAS CLAVES: Funciones de intensidad, modelo de tres estados, censura arbitraria

Inicio

Nombre del trabajo: Estimación y Comparación del Efecto de Asimetría en Modelos GJR, con Aplicaciones

Presentado por: Alejandro Regino Gómez
Título obtenido: Magíster en Estadística
Año: 2006
Director: Norman Diego Giraldo Gómez

RESUMEN

En este trabajo se hace un recorrido sobre la evolución de los modelos de tipo ARCH generalizados (GARCH) para capturar el comportamiento de la volatilidad de los rendimientos de ciertos activos financieros y se estiman los estimadores cuasi-máximo verosímiles (QMLE) a partir del trabajo de Bollerslew y Wooldridge (1987).
Se encontró que la distribución asintótica de los parámetros estimados de los modelos GJR(1,1) por QMLE es normal, con base en los resultados de consistencia fuerte y normalidad asintótica para el modelo AGARCH(1,1) según los resultados de Mikosch y Straumann (2003) y con el método Delta. Con estos resultados se construyó un estadístico de prueba para comparar el parámetro estimado responsable de la asimetría de dos modelos GJR (1,1) y se estudió su potencia y nivel de significancia nominal. Se propone para la estimación de Var(v1-v2) verificar si la Cov(v1,v2) es significativa. En el caso de no serlo, la Var(v1-v2) se estima con base en los resultados de Var(v1) y Var(v2) del proceso de estimación de los modelos GJR. En el caso de ser significativo se estima con base en un procedimiento Bootstrap de series de tiempo estacionarias, según el algoritmo de Politis y Romano (1994); para determinar la significancia de la Cov(v1,v2) también se realiza con este mismo algoritmo.
Se analizaron 36 series de acciones y 4 índices bursátiles, las acciones corresponden a las usadas en el cálculo del índice de la Bolsa de Colombia (IGBC) en el período octubre a diciembre de 2005 y las series de tiempo van desde el 02 de enero de 1998 al 10 de noviembre de 2005. Se estimó el modelo GJR(1,1) y se encontró que en el índice de la Bolsa de Medellín (IBOMED), Bogotá (IBBO) y tres acciones tuvieron el parámetro responsable de la asimetría v significativo y positivo, con lo que un modelo GJR(1,1) es apropiado. Se encontró que el v del IBBO es mayor a los de las acciones BAVARIA, BOGOTA y PFCORFIVAL y el v de la acción de BOGOTA es diferente a PFCORFIVAL.

PALABRAS CLAVES: Modelos GJR, asimetría

Inicio

Nombre del trabajo: Efecto de la Agregación de Ventas y Reclamos en Bases de Datos de Garantía en el Estimador en el Estimador de la Tasa de Reclamos Agregada y su Varianza

Presentado por: Jorge Mario Obando López
Título obtenido: Magíster en Estadística
Año: 2006
Director: Sergio Yáñez Canal

RESUMEN

Los datos de garantía tratados de una manera estadística adecuada son útiles para la predicción de reclamos futuros, comparaciones entre reclamosde productos, estimación de la confiabilidad e identificación de mejoras del producto. Este análisis requiere de disponibilidad de información diaria que, muchas veces, sólo se tiene en totales semanales o mensuales (agregación de datos) debido a la logística de la empresa.
En el presente trabajo se estudia el efecto que presenta la agregación de datos en los resultados del análisis de datos de garantía, mediante la simulación de escenarios en los que se controlan: el proceso de generación de reclamos, la distribución de ventas diarias y la distribución de retraso en el reporte de los reclamos.

PALABRAS CLAVES: Confiablidad, análisis de datos de garantía, procesos de conteo, tasa de intensidad

Inicio

Nombre del trabajo: Comparación entre Análisis Discriminante no Métrico y Regresión Logística

Presentado por: Olga Cecilia Úsuga Manco
Título obtenido: Magíster en Estadística
Año: 2006
Director: Juan Carlos Correa Morales

RESUMEN

Se presenta una comparación entre el análisis discriminante no métrico y la regresión logística en términos de tasas de clasificación errónea para dos poblaciones. El análisis discriminante no métrico es un procedimiento no paramétrico que no tiene supuestos de distribuciones específicas y por lo tanto tiene amplia aplicación en diversas distribuciones. Este método obtuvo tasas de clasificación errónea similares a la regresión logística en el caso de dos poblaciones provenientes de distribuciones normales multivariadas con matrices de covarianzas iguales, mostrando un mejor comportamiento cuando el tamaño de las muestras aumenta; además, para muestras desbalanceadas se observó un comportamiento similar en los dos procedimientos. Para el caso de dos poblaciones provenientes de distribuciones normales multivariadas con matrices de covarianzas diferentes se observa un comportamiento similar, mejorando su desempeño con respecto a la regresión logística a medida que el tamaño muestral aumenta. Finalmente, para variables binarias, la regresión logística muestra un comportamiento superior al análisis discriminante no métrico.

PALABRAS CLAVES: Análisis discriminante no métrico, regresión logística

Inicio

Nombre del trabajo: Extensión del Análisis Gráfico del Modelo Lineal General a los Modelos Lineales Generalizados Poisson y Gamma

Presentado por: Jairo Arturo Angel Guzmán
Título obtenido: Magíster en Estadística
Año: 2007
Diirector: Juan Carlos Correa Morales

RESUMEN

En la actualidad es importante, dentro del campo de la estadística aplicada, al usar los modelos lineales generalizados Poisson y Gamma, los diagnósticos gráficos que se puedan dar al proponer justificadamente cualquiera de estos modelos como una solución a un problema de interés.
La metodología gráfica propuesta por Bern y Booth (1995) permiten el uso de diagnósticos en el modelo lineal general, gráficos como: "Added variable", gráfico residual parcial, Augmented, CERES, AMONE y AMALL permiten visulaizar violación de supuestos y la detección de funciones de las covariables adicionadas a los modelos propuestos.
En el presente trabajo se presenta una extensión de estos gráficos a modelos más complejos como lo son los modelos lineales generalizados Poisson y Gamma, se pretende proponer una metodología que permita diagnósticar gráficamente la violación de algunos de los supuestos, la identificación de una función de una covariable que ha sido adicionada a los modelos lineales Poisson y Gamma. La propuesta de las estimaciones de las funciones se fundamenta en las ideas planteadas por Cay y Tsay (1999), nuestro aporte significativo se basa en la presentación de las bandas de confianza simultáneas para las funciones estimadas. Se mostrarán las ventajas y desventajas al hacer la extensión a este tipo de modelos más complejos. Finalmente, la propuesta metodológica se ilustra con datos reales.

PALABRAS CLAVES: GLMs, Added variable, gráfico residual parcial, Augmented, CERES, AMONE, AMALL

Inicio

Nombre del trabajo: Comparación entre el Análisis Discriminante no Métrico y Regresión Logística Multinomial

Presentado por: Freddy Hernández Barajas
Título obtenido: Magíster en Estadística
Año: 2007
Director: Juan Carlos Correa Morales

RESUMEN

En este trabajo se presenta un estudio de comparación entre las técnicas de clasificación análisis discriminante no métrico, regresión logística multinomial; adicionalmente, se considera la técnica tradicional análisis discriminante lineal ya que la función de clasificación de ésta sirve como punto de partida para análisis discriminante no métrico. Los escenarios bajo los cuales se llevó a cabo el estudio fueron los siguientes: tres grupos distribuidos normal bivariado con matrices de varianza y covarianza iguales y diferentes, siete grupos distribuidos normal con tres variables y matrices de varianza y covarianza diferentes, tres grupos distribuidos Logitnormal, Lognormal y Sinh-1-normal con dos variables. Los desempeños de las técnicas fueron medidos con la tasa de clasificación errónea. Las técnicas de Regresión Logística Multinomial y Análisis Discriminante Lineal obtuvieron tasas de clasificación errónea muy similares en todo el estudio e inferiores que Análisis Discriminante no Métrico. Se construyeron funciones en el programa R para implementar el algoritmo propuesto por Choulakian y Almhana (2001) para técnica Análisis Discriminante no Métrico. Se llevó a cabo una aplicación de las tres técnicas utilizando una base de datos real sobre datos antropométricos de trabajadores colombianos.
En esta aplicación se encontró que las mejores clasificaciones fueron obtenidas por Regresión Logística Multinomial y Análisis Discriminante Lineal al clasificar personas en tres grupos predeterminados por el índice de masa corporal. Finalmente, del estudio se recomienda la utilización de las técnicas regresión logística multinomial y análisis discriminante lineal para realizar clasificaciones en situaciones donde la distribución de los datos sea próxima a la distribución normal multivariada con variables explicativas cuantitativas.

PALABRAS CLAVES: Análisis discriminante no métrico, regresión logística multinomial

Inicio

Nombre del trabajo: Crecimiento del Activo Productivo con Base en la Calidad de Cartera Óptima: Evaluación de una Compañía de Leasing Mediante Series de Tiempo no Lineales

Presentado por: Isabel Cristina Zuluaga Garces
Título obtenido: Especialista en Estadística
Año: 2007
Director: Norman Diego Giraldo Gómez

RESUMEN

Modelación de un modelo que permita establecer las proyecciones de crecimiento de una Compañía a través de Modelos autorregresivos con umbral que permiten establecer un modelo diferente según las condiciones de mercado o las esperadas por la Compañía de Leasing con el fin de mantener unos buenos indicadores de cartera y crecer sostenidamente,

PALABRAS CLAVES: SETAR, TAR, Crecimiento, Calidad de Cartera, Modelación, Umbral

Inicio

Nombre del trabajo: Efecto en las Estimaciones bajo Distintas Formas Distribucionales del Término Aleatorio en un Modelo Lineal Adaptado a una Cadena de Markov con Espacio de Estados Ordinales

Presentado por: Roger Jesús Tovar Falón
Título obtenido: Magister en Estadística
Año: 2008
Director: Juan Carlos Salazar Uribe

RESUMEN

Los modelos lineales mixtos pueden ser utilizados conjuntamente con la teoría de procesos estocásticos usando cadenas de Markov de estados múltiples para modelar datos provenientes de estudios longitudinales, teniendo en cuenta posibles fuentes de variabilidad que se pueden presentar entre sujetos y dentro de los sujetos.

En este trabajo se estudia una metodología para estimar los efectos de las covariables en un modelo lineal mixto con intercepto aleatorio y respuesta policótoma categórica ordinal, bajo distintas especificaciones distribucionales de dicho efecto aleatorio. Esta metodología constituye una extensión de la propuesta hecha por Salazar, Schmitt, Yu, Mendiondo & Kryscio (2007).

En este trabajo se considera una cadena de Markov de k + 2 estados con dos estados absorbentes que compiten entre sí y k estados transitorios, se deriva matemáticamente la función de verosimilitud de los datos y se obtienen, por medio de un estudio de simulación, las estimaciones de los efectos de las covariables sobre las distintas transiciones, cuando el proceso puede ser visto como un modelo de regresión logística policótoma con efectos aleatorios y respuesta categórica ordinal. La maximización de la función de verosimilitud se lleva a cabo numéricamente utilizando el método de la cuadratura de Gauss y el algoritmo de Newton-Raphson (ver Abramowitz & Stegun (1972)). Finalmente, se ilustra la metodología usando datos reales, sobre los promedios acumulados de una muestra de estudiantes de la Universidad Nacional de Colombia, Sede Medellín.

PALABRAS CLAVES: Datos longitudinales, modelos de estados múltiples, cadenas de Markov, regresión logística policótoma, cuadratura de Gauss

Inicio

Nombre del trabajo: Distribución Predictiva Bayesiana para Modelos de Pruebas de Vida MCMC

Presentado por: Carlos Javier Barrera Causil
Título obtenido: Magíster en Estadística
Año: 2008
Director: Juan Carlos Correa Morales

RESUMEN

En este trabajo se presenta un estudio de comparación entre las técnicas de clasificación análisis discriminante no métrico, regresión logística multinomial; adicionalmente, se considera la técnica tradicional análisis discriminante lineal ya que la función de clasificación de ésta sirve como punto de partida para análisis discriminante no métrico. Los escenarios bajo los cuales se llevó a cabo el estudio fueron los siguientes: tres grupos distribuidos normal bivariado con matrices de varianza y covarianza iguales y diferentes, siete grupos distribuidos normal con tres variables y matrices de varianza y covarianza diferentes, tres grupos distribuidos Logitnormal, Lognormal y Sinh-1-normal con dos variables. Los desempeños de las técnicas fueron medidos con la tasa de clasificación errónea. Las técnicas de Regresión Logística Multinomial y Análisis Discriminante Lineal obtuvieron tasas de clasificación errónea muy similares en todo el estudio e inferiores que Análisis Discriminante no Métrico. Se construyeron funciones en el programa R para implementar el algoritmo propuesto por Choulakian y Almhana (2001) para técnica Análisis Discriminante no Métrico. Se llevó a cabo una aplicación de las tres técnicas utilizando una base de datos real sobre datos antropométricos de trabajadores colombianos.
En esta aplicación se encontró que las mejores clasificaciones fueron obtenidas por Regresión Logística Multinomial y Análisis Discriminante Lineal al clasificar personas en tres grupos predeterminados por el índice de masa corporal. Finalmente, del estudio se recomienda la utilización de las técnicas regresión logística multinomial y análisis discriminante lineal para realizar clasificaciones en situaciones donde la distribución de los datos sea próxima a la distribución normal multivariada con variables explicativas cuantitativas.

PALABRAS CLAVES: Análisis discriminante no métrico, regresión logística multinomial.

Inicio

Nombre del trabajo: Robustez de un Modelo de Markov de Tres Estados Bajo Distintas Especificaciones Distribucionales de los Tiempos de Transición

Presentado por: Armando Baena Zapata
Título obtenido: Magister en Estadística
Año: 2008
Director: Juan Carlos Salazar Uribe

RESUMEN

Los modelos de Markov de estados múltiples resultan de gran utilidad y aplicación en diferentes campos de la investigación dado que la estructura de dependencia de las observaciones longitudinales es simple. Estos modelos se basan en el supuesto de que la función de probabilidad del tiempo de transición es la Exponencial. Bajo este supuesto, la estimación de las funciones de intensidad es más sencilla dado que corresponden al parámetro de la distribución exponencial de la respectiva transición, luego, las intensidades no dependen del tiempo ya que el parámetro es una constante. La importancia de las funciones de intensidad se debe a que éstas proporcionan valiosa información sobre el riesgo inmediato o instantáneo de pasar de un estado i a un estado j, donde i y j pertenecen a cierto conjunto de índices, lo cual es de gran interés y utilidad en el estudio del riesgo en diversos fenómenos. Sin embargo, al tratarse de una variable aleatoria, la distribución del tiempo podría ser Gamma, Weibull, Pareto, Lognormal o cualquier otra distribución asociada a variables aleatorias positivas, y de esta manera la estimación de dichas intensidades sería mucho más compleja ya que éstas quedarían dependiendo del tiempo.
Vía simulación, se estudia el efecto sobre la estimación de los parámetros de las covariables asociadas a las funciones de intensidad cuando los tiempos de transición en un modelo de Markov de tres estados no necesariamente siguen una distribución exponencial. Como ilustración, se utilizan datos longitudinales reales sobre Artritis Reumatoide recolectados por la Corporación para Investigaciones Biológicas, CIB.

PALABRAS CLAVES: Procesos de Markov, Riesgo, Funciones de Intensidad, Análisis de Supervivencia, Artritis Reumatoide.

Inicio

Nombre del trabajo: Estimación en los Modelos Setar con Base en Métodos de Momentos Generalizados

Presentado por: Lucinia Rojas Peña
Título obtenido: Magister en Estadística
Año: 2008
Director: Norman Diego Giraldo


RESUMEN


En este trabajo se utiliza un procedimiento de optimización con restricciones utilizando algoritmos genéticos, aplicado al problema de estimación de series de tiempo no lineal Setar, por medio del método de momentos simulados. En los modelos Setar el proceso evoluciona en el espacio de estados de manera discontinua, cambiando de regimenes. En el proceso de estimación tales cambios generan discontinuidades en la función objetivo y los métodos de optimización basados en gradientes pueden tener dificultades cuando la función objetivo es discontinua, por lo que se utilizaron algoritmos genéticos.
Se investiga la identificabilidad de modelos no lineales Setar mediante momentos de orden alto tipo cumulantes. Se presenta un resultado sobre la invarianza de los momentos del proceso SETAR(1,1) con respecto a cierta translación lineal de la función skeleton.


Palabras Claves: Método generalizado de momentos (GMM), método simulado de momentos (SMM), estimación, modelo SETAR, cumulantes.

Inicio

Nombre del trabajo: Comparación de 4 Procedimientos FDR para la Selección de Parámetros en Regresión Poisson

Presentado por: Jorge Iván Vélez Valbuena
Título obtenido: Magister en Estadística
Año: 2008
Director: Juan Carlos Correa Morales

RESUMEN

En este trabajo se comparan, vía simulación, 4 procedimientos basados en la Tasa de Falsos Descubrimientos o False Discovery Rate (FDR) de Benjamini & Hochberg (1995), descritos en Nguyen (2005), para la selección de parámetros en Regresión Poisson. El desempeño de cada uno de los 4 procedimientos, así como el de los procedimientos t y Bonferroni, también evaluados, se determinó a través de la tasa de rechazos medida como el porcentaje de veces que, en el total de simulaciones realizadas para cada escenario, el coeficiente de regresión fue considerado estadísticamente diferente de cero para un nivel nominal a = 0.05.

Se construyeron funciones en R (R Development Core Team, 2007) para la comparación de los procedimientos y la presentación gráfica de los resultados y se realizaron varias aplicaciones de los procedimientos evaluados que incluyen: (i) el modelamiento de la tasa de menores de edad con hijos nacidos vivos en el Departamento de Antioquia a partir de información del Anuario Estadístico de Antioquia – 1993, (ii) la selección de coeficientes de correlación y (iii) la determinación de genes diferencialmente expresados (Golub et al., 1999). En estas aplicaciones se encontró que, en general, los procedimientos basados en la FDR tienen un mejor desempeño que el procedimiento basado en la prueba t.

Finalmente se recomienda utilizar el procedimiento t para la selección de parámetros significativos en Regresión Poisson cuando el número de variables regresoras sea menor o igual a 2, y los procedimientos FDR de Benjamini & Hochberg (1995) y menos conservador (o Least
Conservative (LC)) de Nguyen (2005), en otro caso.

PALABRAS CLAVES: Comparaciones Múltiples, False Discovery Rate (FDR), Modelo Lineal Generalizado, Regresión Poisson

Inicio

Nombre del trabajo: Generalización de un Algoritmo de Individualización de la Dosis de Droga usando un Modelo Lineal Mixto

Presentado por: Miladys Rocío Cogollo
Título obtenido: Magister en Estadística
Año: 2008
Director: Francisco Javier Díaz Ceballos

RESUMEN

En esta tesis se estudian las propiedades matemáticas y estadísticas de un algoritmo de individualización de la dosis de una droga, cuando el logaritmo de la concentración plasmática de la droga se describe a través de un modelo lineal con covariables que tienen efectos aleatorios. El modelo usa el logaritmo de la dosis como una covariable. Este algoritmo constituye una generalización de un algoritmo propuesto por Díaz et al.(2007), el cual asume que no hay covariables con efectos aleatorios y que solo hay un intercepto aleatorio. Se generalizan los teoremas de Díaz et al., los cuales permiten obtener dosis óptimas, un estimador óptimo de los efectos aleatorios, y el mínimo número de pasos necesarios en el algoritmo generalizado para alcanzar la dosificación óptima.
Posteriormente se estudia el desempeño del algoritmo a especificaciones erróneas de la distribución de los efectos aleatorios. Finalmente, se examina la viabilidad de la metodología propuesta usando datos relacionados con la droga clozapina, la cual se usa para tratar pacientes con esquizofrenia severa.
Referencia: Diaz, F.J., Rivera, T.E., Josiassen, R.C., de Leon, J. (2007). Individualizing drug dosage by using a random intercept linear model. Statistics in Medicine, Vol. 26, 2052-2073.

PALABRAS CLAVES:Modelo Lineal Mixto, Individualización de la dosis de una droga, Mezcla de distribuciones, Clozapina

Inicio

Nombre del trabajo: Control Multivariado de Procesos con Variables Binomiales Bivariadas

Presentado por: Carolina Ospina Hincapié
Título obtenido: Magister en Estadística
Año: 2009
Director: Sergio Yáñez Canal

RESUMEN

Muchos procesos industriales son de naturaleza multivariada dado que la calidad de un producto depende de más de una variable. El control multivariado de procesos captura la relación en las variables asociadas al proceso , si se ignora esta correñaco+pm y se utilizan gráficos de control univariados para cada variable por separado se puede concluir erróneamente acerca del estado del proceso. En variables continuas correlacionadas se han realizado muchas investigaciones, sin embargo, se envuentran pocos trabajos que traten sobre atributos correlacionados. En este trabajo se comparan tres cartas de control para variables aleatorias binomiales bivariadas, correlacionadas entre sí, las cuales miden atributos, las cartas son: la carta T2 de Hotelling basada en la aproximación de la distribución binomial multivariada a la distribución normal. La carta MNP la cual es una extensión np univariadad, y la carta r que es una metodología no paramétrica basada en el índice de profundidad de Mahalanobis. La comparación se hace vía similitud utilizando como medida de comparación , la longitud promedio de racha (ARL). De los resultados se aprecia, en términos generlaes que la carta MNP es la mejor tanto en control como fuera de control.

Inicio

Nombre del trabajo: Clasificación Jerárquica de Objetos a Partir de Experimentos de Comparaciones Pareadas.

Presentado por: Iris Viloria Salazar
Título obtenido: Magister en Estadística
Año: 2009
Director: Juan Carlos Correa Morales

RESUMEN

En muchas situaciones se hace necesario ordenar un conjunto de objetos de acuerdo con ciertas caracaterísticas de común que no pueden ser medidas en alguna escala de medición numérica, a partir de la evaluación subjetiva de personas expertas. Bradley & Terry (1952) propuesieron un modelo para ordenar las preferencias de un número de jueces a partir de comparaciones pares de objetos evaluadas por dichos jueces. Diferentes extensiones a este modelo han sido presentadas posteriormente en la literatura:
Davidson & Beaver (1977) presentaron una extensión al modelo Bradley-Terry, para considerar empates y el llamadao "efecto de orden", Saaty (1980) definió un escala numérica para describir las comparaciones pareadas realizadas por varios jueces. Critchlow & Fligner (1993) estudiaron la relación de covariables con los scores de preferencia de los objetos, modelando los scores en términos de covariables disponibles para el análisis. Muy recientemente, Causeura & Hussona (2005) propusieron una extensión en 2 dimensiones del modelo Bradley-Terry que considera las interacciones entre los objetos comparados.

En este trabajo se presenta una nueva metodología para la clasificación jerárquica de objetos a partir de comparaciones pareadas realizadas entre los objetos por varios jueces o expertos. A diferencia de las metodologías existentes, en las que el proceso de comparación entre los objetos se lleva a cabo efectuando todas las comparaciones posibles de dos en dos, en esta nueva metodología el proceso de comparación se realiza evaluando cad aobjeto de cierta permutación únicamente con el inmediatamente anterior. Una extensa revisión bibliográfica sobre las diferentes aproximaciones existentes en la literatura para la clasificación jerárquica u ordenamiento de objetos a partir de experimentos de comparaciones pareadas, el desarrollo analítico de un nuevo estimador y del error estándar asociado y un estudio de simulación para comparar la clasificación jerárquica de los objetos resultante al aplicar el estimador obtenido analíticamnete con los resultados obtenidos al aplicar el modelo propueso por Bradley & Terry (1952) son presentados.

La nueva propuesta presenta ventajas sobre la metodología Bradley-Terry en cuanto al número de comparaciones a realizar, en la nueva propuesta el número de comparaciones a realizar es mucho menor , lo que reduce el posible sesgo por fatiga de los jueces y hace más bajo el costo de experimentación.

PALABRAS CLAVES: Clasificación jerárquica, Modelos Bradley-Terry, Ranking, Comparaciones Pareadas, Ordenamiento.

Inicio

Nombre del trabajo: Estimación de un Modelo de Difusión con Saltos con Distribución de Error Generalizada asimétrica Usando Algoritmos Evolutivos

Presentado por: Juan David Ospina Arango
Título obtenido: Magister en Estadística
Año: 2009
Director: Norman Diego Giraldo Gómez

RESUMEN

En este trabajo se considera el problema de estimar los parámetros de un proceso de difusión con saltos (jump-diffusion) donde la magnitud de los saltos se asume dada por una variable aleatoria que se distribuye bajo la distribución de error generalizada asimétrica (SGED). Se aproxima la densidad de los rendimientos del proceso utilizando la aproximación Bernoulli-Poisson y recurriendo a la transformada rápida de Fourier (FFT). Con la densidad aproximada se encuentra, vía máxima verosímilitud, los parámetros del proceso usando varias técnicas de optimización para encontrar el óptimo de la log-verosimilitud, entre las cuales el mejor desempeño lo brinda la Evolución Diferencial (DE).

PALABRAS CLAVES: Procesos de Difusión con Saltos, distribución de error generalizada asimétrica, transformada rápida de Fourier, máxima verosimilitud, evolución diferencial.

Inicio

Nombre del trabajo: Comparación de Árboles de Regresión y Clsificación y Regresión Logística

Presentado por: Sandra Carolina Serna Pineda
Título obtenido: Magister en Estadística
Año: 2009
Director: Juan Carlos Correa Morales

RESUMEN

El problema de la clasificación de individuos u objetos en grupos o poblaciones conocidas es de gran interés en estadística, por esta razón se han desarrollado varias técnicas para cumplir este proposito. En este trabajo se presenta la comparación, mediante simulación Monte Carlo, de dos técnicas estadísticas de clasificación: Árboles de Regresión y Clasificación ( CART) y Regresión Logística. El comportamiento de las técnicas fue medido con la Tasa de Mala Clasificación (TMC). En general, la Regresión Logística presentó una Tasa de Mala Clasificación más baja que los Árboles de Clasificación. Se presenta una aplicación a la Encuesta de Innovación y Desarrollo Tecnológico, utilizando las técnicas estudiadas, para contribuir a un mejor conocimiento del sistema nacional de innovación en Colombia

PALABRAS CLAVES: Clasificación CART: Árboles de clasificación y Regresión, Regresión Logística, Simulación, Tasa de mala clasificación.

Inicio

Nombre del trabajo: Prueba de Levene Multivariada para la Comparación de Matrices de Covarianza en Presencia de Datos Faltantes

Presentado por: Mario José Pacheco López
Título obtenido: Magister en Estadística
Año: 2009
Director: Juan Carlos Correa Morales

RESUMEN

El método para comparar matrices de covarianzas más citado en la literatura es la prueba de Bartlett, la cual es una prueba de razón de verosimilitud modicada, pero esta prueba es sensible a violaciones del supuesto de normalidad multivariada.  Otro procedimiento para la comparación de matrices.  Otro procedimiento para la comparación de matrices de covarianzas es la extensión, la cual consiste en dos generalizaciones multivariadas para la homogeneidad de varianzas;  estas son robustas a desviaciones del supuesto de normalidad, con la ventaja adicional de la simplicidad computacional inducida por el procedimiento univariado de prueba.  En el siguiente trabajo se examina el comportamiento de la prueba de Levene multivariada en presencia de datos faltantes; un estudio de simulación es llevado a cabo para evaluar el comportamiento en comparación a la prueba de razón de verosimilitud modicada en términos de los niveles de significancia nominal y real.  Se encuentra que la prueba de Levene tiene un buen comportamiento para los datos normales y no normales en muestras pequeñas y grandes, como en la presencia de datos faltantes.

PALABRAS CLAVES: Datos faltantes, Pruebas de homogeneidad de matrices de covarianzas;  Prueva de Levene, Prueba de razón de verosimilitud.

 

 

 

 

 

 

 


 

 

 

 

 


 

 

 

 

 

 

 

 

 

 

 


 

 



 

 

 

 

 

 

 


 


 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 



 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Universidad Nacional de Colombia
Calle 59A No 63-20 - Núcleo El Volador
Medellín - Colombia
Gobierno en LíneaAgencia de Noticias UN
PBX: 4309000
webmaster@unalmed.edu.co

Aviso Legal - Copyright