![]() |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Egresados de Especialización Egresados de Maestría
EGRESADOS DE LA ESPECIALIZACIÓN
EGRESADOS DE LA MAESTRÍA
Presentado por: Hugo Grisales Romero RESUMEN Usualmente la extensión de las inferencias de los modelos de regresión lineal al caso no lineal se han hecho obviando el grado de no linealidad y la importancia de la bondad de ajuste en muestras pequeñas. En este trabajo se analizan las medidas de Bates y Watts (1980) y Hougaard (1985) para la validación de la extensión inferencial confrontando esta última con la de Box (1971). Se desarrolló un software (RENOL: Regresión No Lineal) para el hallazgo de estas medidas y con su uso se evaluaron dos conjuntos de datos utilizados en sendas investigaciones exponiéndose las conclusiones pertinentes. Palabras Clave: Regresión no Lineal, Medidas de Bates, Watts, Hougaard, y Box. Nombre del Trabajo: "Estudio de Asociación entre el examen admisicón de la Universidad Nacional y el Examen Icfes Primera Aproximación"
RESUMEN Aquí se presenta un primer estudio sobre el grado de asociación entre el puntaje que obtuvieron los estudiantes que se presentaron a la Universidad Nacional de Colombia (Sede Medellfn) y el puntaje obtenido por éstos en las pruebas del estado (pruebas del ICFES). El objetivo principal era tratar de sugerir la posibilidad de reemplazar el examen de admisión por el examen del estado. El estudio de asociación se realizó utilizando, por un lado, mínimos cuadrados ordinarios (OLS) y por otro lado, regresión logística. Los resultados nos muestran que hay una relación estadísticamente significativa entre tales pruebas. Sin embargo, el grado de asociación que obtuvimos no nos pareció satisfactorio y por tanto, el estudio no fue concluyente. Palabras Clave: Mínimos cuadrados ordinarios, Regresión logística, Medidas de asociación. Nombre del Trabajo: "Desagregación de Series de Tiempo. Aplicación de una Nueva Metodología a Algunos Casos de la Economía Colombiana"
RESUMEN Es comun en el trabajo de series de tiempo que los datos se presenten en forma agregada en el tiempo y que se quiera conocer la serie en períodos de tiempo de longitud menor, es decir desagregada. En particular es usual encontrar series económicas anuales que deben ser desagregadas mensual o trimestralmente. En este trabajo se buscó conocer e implementar una metodología reciente, en ese momento, año l994, para la desagregación temporal de series de tiempo y aplicarla a una serie en la economía Colombiana. La serie desagregada fue el PIB de Antioquia para los años 1982-1990. En serie, anual, fue desagregada mensualmente. Este trabajo se fundamentó en dos artículos: Guerrero, V. M (1990). Temporal Disaggregation of Time Series: An ARIMA-based Approach. International Statistical Review 58, 29-46. Guerrero, V. M. and Martínez Jorge (1993).A Recursive ARIMA-based Procedure for disaggregating a Time Series Variable Using Concurrernt Data. Documento de trabajo. Palabras Clave: Series de Tiempo, Desagregación. Nombre del Trabajo: Pruebas de Homogeneidad e Intervalos de Confianza para Proyeccciones con Matrices de Transición Presentado por: Amparo del Carmén Chamorro Gómez RESUMEN Se introduce la aplicación del concepto de Tiempo de Absorción en cadenas de Markov finitas con un estado absorbente, a los modelos de crecimiento con matrices de transición de especies forestales, las cuales pueden interpretarse como ejemplos de tales tipos de cadenas. Además, se introducen pruebas de homogeneidad para la comparación de k matrices de transición como generalizaciones de pruebas jicuadrado. Se examinan también los tiempos de absorción para k matrices pero no se llega a un estadístico con base en los mismos. Finalmente, con base en la aproximación normal a la binomial se logra una expresión para intervalos de confianza aproximados para las predicciones con base en las matrices de transición. Este resultado se había tratado de obtener en un trabajo de grado anterior con base en simulación. Palabras Clave: Matrices de transición, Pruebas de homogeneidad. Nombre del Trabajo: Aplicación de Técnicas de Estadísticas en la Evaluación Sensorial del Alimento Presentado por: Esner Valencia Valencia RESUMEN En este trabajo se discute el uso de algunas técnicas estadísticas en la evaluación sensorial de los alimentos. En primer lugar, se introducen algunos elementos metodológicos básicos y posterirmente se hace uso de datos relaes provenientes de las industrias de los jugos, las aguas envasadas y las cervezas para discutir la aplicación rigurosa de métodos estadísticos usuales en pruebas discriminatorias, de análisis descriptivo, y de aceptación o preferencia. En especial se estudian problemas en los cuales se realizan experiemntos binomiales, y diseños experimentales. Palabras Clave: Atributos sensoriales, medición de respuesta, pruebas discriminatorias, comparaciones múltiples, diseño aleatorizado, bloques completos e incompletos. Nombre del Trabajo: Comparación entre la Regresión Logística y el Análisis Discriminante
RESUMEN La clasificación es un problema que aparece en una gran cantidad de contextos y tiene mucha aplicabilidad en procesos científicos; es un problema multivariado; intuitivamente, entre más grande sea el conjunto de características, más fácil es la clasificación mientras que el problema de usar pocas variables usualmente conduce a obtener resultados pobres. El análisis discriminante es una técnica que se basa principalmente en la suposición de que las dos poblaciones en las que se va a clasificar un nuevo objeto se distribuyen normalmente con igual matriz de varianzas y covarianzas, lo que da origen a una frontera de separación lineal. Por otro lado, la Regresión Logística no tiene ninguna clase de suposiciones sobre la forma distribucional de las poblaciones, hecho que como procedimiento de clasificación puede favorecerla más que el análisis discriminante en muchas aplicaciones particulares. Palabras Clave: Regresión Logística, Análisis discriminante, Clasificación. Nombre del Trabajo: Método de Riesgos Proporcionales para Tiempo de Recurrencia en Leishmaniasis Presentado por: Luis Fernando Grajales Hernández RESUMEN Entre los años de 1983 y 1989, CIDEM lideró un estudio de cohorte con más de 400 pacientes de Tumaco, Cali y zonas aledañas, con diagnóstico de leishmaniasis tegumentaria, los cuales se trataron con Glucantime hasta la curación completa de las lesiones. Por medio de seguimientos, se establecen los tiempos de supervivencia para los pacientes recurrentes y censurados. El objetivo principal de este trabajo es hallar factores de riesgo asociados a la recurrencia. Utilizando Tablas de vida y Riesgos Proporcionales de Cox se obtienen resultados relacionados con el tiempo de supervivencia, explicada por las variables asociadas al tratamiento, respuesta inmune, subespecie infectante y exposición del paciente a la picadura del vector. Palabras Clave: Leishmaniasis, supervivencia, Riesgos Proporcionales. Nombre del Trabajo: Proyección Pursuit Continua con Aplicaciones Presentado por: Miguel Darío Ospina Valencia RESUMEN Projection Pursuit, es un método utilizado para el análisis exploratorio de datos multivariados, buscando estructuras no lineales. Se estudia el algoritmo de esta proyección que puede ser aplicada a un conjunto de datos multivariados y que consiste en un proyección de los datos a una o dos dimensiones, buscando aquellas proyecciones que pueden ser consideradaas como "interesantes", deacuerdo al valor de un índice numérico asociado a la proyección, ccomparándola con distribución normal (caso continuo) para decidir cuando es interesante o no. Se estudia el algoritmo compuesto por Friedman (1987) para encontrar determinada "información" en un conjunto de datos de tipo continuo para obtener los diferentes índices y se observan algunas aplicaciones. Además, se implementa el Algoritmo computacional, mediante la utilización del programa S-PLUS, dando como resultado un sistema gráfico. Palabras Clave: Proyección Pursuit, Análisis exploratorio, Análisis Multivariado. Nombre del Trabajo:El Litio como Profiláctico de la Psicosis Maníaco-Depresiva en Tratamientos a Corto y Largo Plazo Presentado por: Luis Felipe Cogollo Negrete RESUMEN La psicosis maniaco depresiva , que es un trastorno de altísima prevalencia, es sin duda el padecimiento psiquiatrico más frecuente diagnosticado en nuestro medio. Con este trabajo se quiere realizar un estudio con pacientes que sufren esta enfermedad y a los cuales se les suministra dosis de sales de litio, que nos permita tomar una decisión acertada acerca del manejo a largo plazo de los pacientes con sales de litio. Para ello, se realizó una regresión logística o un análisis de tablas de contingencia, además de la estadística descriptiva y de métodos muultivariables Palabras Clave: Aplicación de regresión logística, tablas de contingencia, psicosis maniaco depresiva (PMD) Nombre del Trabajo: "Caracterización del Rendimiento Académico de los Estudiantes de la Universidad Nacional Sede Medellín, Según Variables Socio-Demográficas y Dedicación al Estudio" Presentado por: Guillermo León Arias Pineda. RESUMEN En este trabajo se utiliza el Análisis Factorial de Correspondencias Múltiples y métodos de Clasificación Jerárquica para estudiar la información recogida a través de una encuesta aplicada a estudiantes de la Universidad Nacional de Colombia, Sede Medellín matriculados en el segundo semestre de 1995. Estas técnicas permiten establecer tipologías de estudiantes y luego asociarlas con varios indicadores de rendimiento. Los métodos estadísticos de carácter exploratorio usados aquí son discutidos y confrontados con prácticas más artesanales de análisis que no toman en cuenta el carácter multivariado de la información. Los resultados se presentan finalmente en tablas de resumen. Palabras Clave: Tablas de contingencia, Análisis de Correspondencias Simples y Múltiples. Planos y coordenadas factoriales, inercias, particiones. . Nombre del Trabajo: Proyecciones de Demanda de Energía a Corto Plazo para el Sistema Eléctrico Colombiano (SEC)
RESUMEN En este trabajo se aplicaron los modelos ARIMA en el pronóstico de la demanda de energía para los submercados en que Interconexión Eléctrica S.A. (ISA) ha dividido el país. Los submercados son: Empresa de Energía de Bogotá EEB (Comprende las demandas de Bogotá, Meta y Cundinamarca), Empresas Públicas de Medellín EEPPM (Comprende las demandas de Medell(n, Antioquia y Chocó), Corporación Eléctrica de la Costa Atlántica CORELCA (Comprende las demandas de Córdoba, Sucre, Bolívar, Magdalena, Cesar y Guajira), Central Hidroeléctrica de Caldas CHEC (Comprende las demandas de Caldas, Risaralda, Quindío, Tolima, Huila y Caquetá), NORDESTE (Comprende las demandas de Boyacá, Santander y Norte de Santander) y Corporación Regional del Valle del Cauca CVC (Comprende las demandas de Cali y Valle del Cauca). Los datos usados, en la mayoría de los casos, consideraron la demanda de energía en el período 1975 a 1996, e incluyen los racionamientos ocurridos en ese período, los cuales fueron modelados. Los resultados de las proyecciones fueron comparados con las realizadas por ISA, la Unidad de planeación Minero Energética UPME y los datos reales durante 1997. Para la mayoría de los submercados, las proyecciones obtenidas tuvieron menor error que las otras proyecciones, al compararlas con los datos reales de 1997. Palabras Clave: Modelos ARIMA. Nombre del Trabajo: Medidas de Asociación en Tablas de Contigencias Presentado por: Darío Alberto Rico Higuita RESUMEN La monografía presenta un resumen que incluye la formulación, clasificación y descripción de las más importantes propiedades de un representativo número de Medidas de Asociación aplicadas a Tablas de Contingencia de doble entrada, en las cuales se trata de determinar qué clase de medidas son aplicables en distintos casos, según el tipo de variables categóricas involucradas y la forma de la relación específica que se trata de establecer entre ellas. Estas medidas son en general, parámetros estadísticos que se formulan a partir de la evaluación de las probabilidades conjuntas, marginales y condicionales de la información cruzada de dos variables en una tabla y tratan de resumir en un solo valor la información contenida en ésta; por este mismo carácter, son deducibles parámetros para la variación y distribuciones aproximadas para sus estadísticos muestrales. Los alcances de la inferencia de estas medidas se perfilan más allá de los tradicionales test para determinar independencia, pero son más limitados que las posibilidades que ofrece la construcción de modelos categóricos para describir en forma más completa la estructura de la asociación entre dos variables. Palabras clave: Medidas de Asociación, Tablas de Contingencia, Variables Categóricas. Nombre del Trabajo: Modelo de Regresión Logístico para Maximizar la Probabilidad de Obtener un Producto Dentro de Especificación Presentado por: Omar de J. Vera Arbeláez RESUMEN Empleando datos reales de un proceso y que se registran durante la producción de un tipo especial de resina, se utiliza una herramienta estadística tal como la regresión logística (modelo logit), para construir un modelo cuadrático que relacione la probabilidad de obtener un producto dentro de especificación y las covariables que se piensa pueden contribuir a la determinación de esta probabilidad. Para la selección de las variables, se utilizan criterios propios del campo de la industria de procesos químicos, en combinación con fundamentos matemáticos. Se utiliza el SAS para realizar el ajuste del modelo, a través del PROC LOGISTIC y su comando MODEL. 0btenido un modelo, se hace un completo análisis de diagnósticos del mismo, mediante la opción IPLOTS. Así, se llega a replantear el modelo y a aceptar este último. Palabras clave: Regresión Logística, Diagnósticos en regresión Logística, Funciones de Enlace, Selección de un Modelo Logistico. Nombre del Trabajo: Modelamiento Estadístico para la Determinación de la Actividad de Insecticidas de Contacto
RESUMEN La estimación de la Dosis Letal Mediana (LD5O) es un problema importante en el estudio de la eficacia de insecticidas. En este trabajo utilizamos la metodología del Modelo de Regresión Logística para su estimación. Se presenta también una revisión del proceso de estimación por el método de Máxima Verosimilitud usando el método iterativo de Newton-Rapshon. Además se presentan las medidas de diagnóstico para determinar la bondad del ajuste del modelo, lo anterior basado en el trabajo de Pregibon (1981). Palabras clave: Función logit, Razón de Odds, Modelo logístico, LD5O, Diagnósticos de Regresión Logística. Nombre del Trabajo: Modelo Lineal Generalizado, Análisis de Datos Categóricos y Cartas de Control para Construcción e Interpretación de Indicadores de Impacto en Accidentalidad Laboral
RESUMEN Con el objeto de conocer con precisión la frecuencia con que ocurren los accidentes de trabajo y la severidad de las lesiones que causan en los individuos se precesó información de la accidentalidad laboral de una Administradora de Riesgos Profesionales Privada y de una Estatal. Se realizó Análisis Exploratorio de Datos, estudio de tendencia de los indicadores usados con más frecuencia en el medio y modelación a través de regresión poisson para explicar accidentalidad en los dos tipos de operadores del Sistema General de Riesgos Profesionales es muy similar, pero se aprecian algunas diferencias cualitativas en el manejo de los datos. La información es insuficiente para llevar a cabo una modelación adecuada que explique la ocurrencia del fenómeno. No se logra evidenciar el impacto de las acciones preventivas en los indicadores de accidentalidad. Palabras clave: Datos cualitativos, accidentalidad, riesgos profesionales, Análisis exploratorio. Nombre del Trabajo: Modelación de la Distribución y Abundancia de las Larvas de Mariposa Plutella en los Parches de Brassica Olearacea, una Aplicación de los Modelos Multinivel. Presentado por: Juan de Jesús Sandoval RESUMEN En estudios de reforestación de bosques se observa que árboles o arbustos están agrupados en parches de vegetación y estos parches a su vez en bloques más grandes debido tal vez al terreno, a estos árboles se les puede medir una característica a diferentes fechas, cuando deseamos contar el número de larvas presentes en sus hojas o el número de animales que buscan refugio en los árboles, en la técnica de muestreo se debe usar alguna forma jerárquica para el conteo. Se ha considerado el problema de los parches de vegetación y se ha intentado la modelación estadística del conteo de larvas de Plutella xillostella (Mariposa punta de Diamante) en los parches de Brassica O (Repollo común), especialmente desarrollando modelos jerárquicos, en nuestro caso utilizando un modelo de tres niveles de jerarquía, dentro del cual se desarrolló un modelo con polinomio cuadrático en el tercer nivel y lineales en los otros dos, algunos de ellos fueron modelos de coeficientes aleatorios y otros pendientes cambiantes no aleatorias. Palabras clave: Modelos jerárquicos, coeficientes aleatorios, pendientes cambiantes no aleatorias, parches de vegetación, plutella X, Brassica O. Nombre del Trabajo: Caracterización de la Población en el Tecnológico de Antioquia Presentado por: Leonardo Ceballos Urrego RESUMEN Tomando como base los datos aportados por una encuesta diseñada con criterios pedagógicos, bajo nueve aspectos diferentes que cubren varias dimensiones del ser humano, y la cual fue aplicada a 357 estudiantes del Tecnológico de Antioquia, se pretende con este trabajo caracterizar y/o tipificar a la población estudiantil de tal institución matriculada para el semestre 99-01, utilizando para ello la aplicación en secuencia de los siguientes Métodos de Análisis Estadístico Multivariado: 1o. Análisis Factorial de Correspondencia Múltiples (A.F.C.M.); 2o. A partir de los factores obtenidos en el método anterior, se aplican Métodos de Clasificación, en particular el análisis de Clusters o Grupos y dentro de éste la técnica de Clasificación Jerárquica Ascendente; 3o. Análisis de Tablas de Contingencia para las nuevas variables generadas con la ejecución de los dos métodos anteriores y 4o. Análisis Factorial Simple sobre las parejas de variables cuyas modalidades presentan mayor probabilidad de asociación dentro de las distintas tablas obtenidas, de acuerdo con el criterio del mayor Chi2. Este proceso con los 4 tipos de análisis, no solo conduce a la obtención de los objetivos propuestos para este trabajo ( De donde proceden?, Quienes son?, y Que pretenden?); sino que se puede consolidar como una metodología de análisis para estudios de la misma naturaleza, en los que predominen las variables cualitativas. Palabras clave: Análisis Factorial de Correspondencias Múltiples (A.F.C.M. y A.F.S.). Histograma de Valores Propios. Modalidades Activas e Ilustrativas. Factores.Ejes Factoriales.Planos Factoriales.Contribuciones a la Inercia.Tipologías de Individuos. Nombre del Trabajo: Diagnósticos en Regresión Poisson Presentado por: Olga Lucia Zapata
Se hace una introducción al análisis de regresión, enfocándonos en el caso de la Regresión Poisson, se recopilan generalidades del trabajo que se ha realizado sobre diagnósticos de regresión, outliers y colinealidad en el modelo clásico. Los ejemplos que se usan para ilustrar emplean datos reales, unos recogidos bajo un diseño de experimentos y otros tomados de anuarios estadísticos. Se usan los paquetes estadísticos SAS y S-PLUS para correr modelos de regresión Poisson, para el análisis grafico y para estimar via simulación los efectos de la colinealidad en los parámetros de regresión del modelo Poisson. Palabras clave: Outliers, regresión poisson, Colinealidad Nombre del trabajo: Análisis Estadístico de la Accidentalidad Víal en la Ciudad de Medellín Presentado por: Oscar Enrique Cañas Zea
Dentro de los programas que adelantan las secretarias de tránsito y transporte de los diferentes municipios de l país , es importante que estas cuenten con propósitos confiables que le permitan evaluar y mejorar los programas tendientes a disminuir la accidentalidad en los diferentes sitios de la localidad; es tabién importante para estos organismos identififcar los lugares más críticos en accidentalidad y las principales causas que los proceden. En este trabajo se hace un análisis exploratorio de tallado de la base de datos sobre accidentes que posee la secretaría de transito y transporte de Medellín, con el fin de identificar los lugares más críticos, las horas de mayor accidentalidad así como sus pricipales causas de los accidentes de tránsito ocurridos en la ciudad. Se analiza el riesgo, tanto en pérdidas humanas como económicas, de los sitios identificados como los más críticos. Se hacen cartas de control que permitan en un futuro cercano identificar aquellos sitios que se están alejando del promedio esperado y así poder entrar a corregir estas situaciones. PALABRAS CLAVES: Función Gamma, Riesgo, índice de accidentalidad, Función Poisson, Carta de control Nombre del trabajo: Regresión no Paramétrica,P P R y Estimación de la Varianza Residual Presentado por: René Iral Palomino
En la mayoría de los análisis estadísticos el problema fundamental consiste en determinar algún tipo de relación entre un par de variables. Esta relación nos debe permitir establecer la forma como una de ellas afecta la otra. La idea básica consiste en estimar o predecir el valor esperado de la variable dependiente, dado valores fijos de la variable independiente.Este trabajo pretende mostrar algunas de las herrramientas no paramétricas usadas en la estimación, a nivel univariado o multivariado, de una relación desconocida de regresión y compararlas con una técnica tradicional como mínimos cuadrados. Se quiere mostrar que las técnicas no paramétricas ofrecen una alternativa más flexible a la hora de estimar relaciones desconocidas entre varias variables, imponiendo condiciones más débiles que los métodos paramétricos tradicionalmente usados.
Nombre del trabajo: Comparación de las Pruebas Psicológicas de Personalidad PPG.IPG Y 16 PF Presentado por: Germán Alberto Loaiza Orrego
Los inventarios de personalidad son las pruebas psicologicas usadas más ampliamante, entre las cuales se encuentran el Instrumento de personalidad 16PF, que contiene 16 factores de personalidad y el perfil e inventario de personalidad PPG.IPG, que contiene aspectos y rasgos depersonalidad. Se utilizaron dos procedimientos de las técnicas estadisticas multivariadas llamadas Análisis de correlación canonica y Análisis Factorial de correspondencias múltiples para determinar la relación entre las variables utilizadas en las pruebas PPG.IPG y 16 PF y la validez de cada una de las pruebas.
Nombre del Trabajo: Resumen Procedimientos R para Estimar los Parámetros de la Distribución Weibull Presentado por: Guillermo A. Fonseca Pacheco RESUMEN Desarrollo algorítmico utilizando el lenguaje estadístico R, para estimar los parámetros de forma (Beta) y de escala (alpha), de la distribución Weibull, empleando métodos gráficos como el de la probabilidad Weibull y el basado en el riesgo y métodos analíticos como el MLE, estimador de máxima verosimilitud, el MOM, método de los momentos y el LSM, método de mínimos cuadrados y para comprobar el método mas estable, se realizó una simulación con diferentes muestras y diferentes parámetros de forma y de escala. Los datos estudiados corresponden a los índices de indisponibilidad de un período de tiempo en los equipos de uso y de conexión de Interconexión Eléctrica S.A. E.S.P. ISA. Palabras clave: Weibull, máxima verosimilitud, momentos, mínimos cuadrados, Box-Cox. Nombre del trabajo: Monografía sobre la Técnica X-12 Arima del U.S Census Bureau con Aplicaciones Presentado por: Jorge Alberto Restrepo Palacio RESUMEN Esta es una monografía sobre una técnica de ajuste estacional de series de tiempo usada ampliamente por agencias gubernamentales de Estados Unidos y otros países así como por empresas privadas. Esta técnica permite además la elaboración de pronósticos. El trabajo se divide en tres grandes partes: en la primera parte se presentan definiciones básicas de pronósticos, métodos y medidas de su exactitud. Se hace énfasis en un método en particular, la descomposición de series de tiempo. En la segunda parte se presenta el Programa de Ajuste Estacional X12-ARIMA desarrollado por el US Census Bureau , oficina del Departamento de Comercio de los Estados Unidos. Aquíse presenta en detalle la estructura del programa y sus diferentes opciones, así como consideraciones técnicas importantes. La tercera parte contiene aplicaciones concretas de la metodología a series de tiempo económicas recolectadas en nuestro medio. Se finaliza presentando brevemente otros programas de pronósticos disponibles hoy en el mundo, detallando uno en particular, el DEMETRA, usado por la Unión Europea. Nombre del trabajo: El Problema de la Separación en Regresión Logísitica Presentado por: Marisol Valencia Cárdenas RESUMEN El problema de separación en regresión logística aparece con frecuencia en el trabajo aplicado. A menudo investigadores y diversos usuarios se enfrentan a este problema sin lograr una solución clara. La existencia de este problema en regresión logística, implica que los estimadores de máxima verosimilitud de estos modelos no existen, lo cual impide determinar inferencias cuando relacionan variables dicótomas con variables explicatorias por medio de este tipo de modelos. En las referencias estudiadas, no se han explorado ampliamente posibles soluciones, por esta razón en este trabajo se presenta el tema, analizando su gravedad y generando posibles soluciones que permitan determinar inferencias. PALABRAS CLAVES: Regresión Logística, Estimación de máxima verosimilitud, Separación Completa, sobreposición. Nombre del trabajo: Uso de Técnicas Multivariadas en el Control de Calidad de un Proceso Industrial de Alimentos Presentado por: Francisco Javier Jaramillo Álvarez
Para el control de calidad de procesos o productos se deben examinar las causas de variabilidad. Tradicionalmente se hace análisis unidimensional, pero en la práctica cualquier fenómeno está determinado por varios factores que interactúan; por ello, se propondrán en este Trabajo técnicas multivariadas, de tal forma que se dé importancia a la correlación entre las variables y se disminuya la probabilidad de falsas alarmas o de no recibir señal cuando el proceso esté fuera de control. Es importante, no sólo detectar señales que se salen de control, sino también detectar las causas para que ello suceda. La herramienta más útil para detectar esas causas es la descomposición MYT; otra técnica que puede ayudar es el Análisis de Componentes Principales, especialmente cuando el número de variables incluidas es grande, ya que su objetivo es reducir la dimensionalidad de un problema.
Nombre del trabajo: Modelamiento de la Relación entre la Dosis de la Droga Psiquiátrica Clozapina y su Concentración Sanguínea usando Regresión Lineal con Coeficientes Aleatorios Presentado por: Tulia Esther Rivera Flórez
RESUMEN El objetivo general de este estudio es desarrollar un modelo de regresión lineal con coeficientes aleatorios de la relación entre la concentración sanguínea de la droga psiquiátrica clozapina, la dosis de la droga, el género, el consumo de cigarrillo, y otras variables de interés médico. También se pretende desarrollar una metodología para estimar un índice de actividad metabólica que caracterice pacientes particulares con esquizofrenia y que permita determinar la dosis necesaria para alcanzar concentraciones terapéuticas conocidas de clozapina en la sangre.
Nombre del trabajo: Supervivencia de Pacientes con Trasplante Renal, Enero de 1999 a Junio de 2003 Presentado por: Nora Elena Montoya Restrepo RESUMEN El riñón, es el órgano encargado de filtrar toda la sangre que es bombeada por el corazón; excretar los productos de desecho; regular la cantidad de sodio, potasio, fósforo y calcio; y controlar la presión arterial. Cuando aparece la falla renal, es necesario iniciar un tratamiento que sustituya dicha función para evitar complicaciones que, en muchos casos, pueden ocasionar la muerte del paciente; uno de estos tratamientos es el trasplante renal, Aunque el trasplante renal no es la cura para la insuficiencia renal terminal, se ha visto que de los tratamientos existentes (diálisis y trasplante), es el que produce una mayor supervivencia de los pacientes, ello a pesar de las fallas que se presentan cuando la sangre y los tejidos del donante y del paciente no son bien apareados para evitar que el sistema inmunitario rechace el nuevo riñón, lo cual se registra en un 15% a 50% de los casos, y de características como la edad y el estado de salud del paciente. Debido a que la insuficiencia renal terminal es uno de los problemas prioritarios en salud, de pronóstico regular y mortal sin tratamiento, y que pone en riesgo el sistema de seguridad social, se diseñó este estudio, el cual permitió estimar la supervivencia (entendida ésta como tiempo hasta que ocurre un retrasplante, hemodiálisis o muerte después del trasplante renal), durante el primer año después del mismo, en una Empresa Promotora de Salud, medida considerada como indicador de severidad de la enfermedad y como pronóstico. PALABRAS CLAVES: Insuficiencia renal, trasplante renal, probabilidad de falla renal. Nombre del trabajo: Comparación del Consumo de Cafeína y Tabaco en Pacientes Ezquizofrénicos y Controles de la Población General Presentado por: Hernando Manuel Quintana Ávila RESUMEN El consumo de tabaco es un problema común en pacientes esquizofrénicos de todo el mundo. Además, varios estudios sugieren que la ingestión de cafeína es alta en pacientes con esquizofrenia. Algunos estudios sugieren que la cafeína puede contribuir a la sintomatología de la esquizofrenia. Ninguno de estos estudios ha controlado los efectos del cigarrillo, el cual induce el metabolismo de la cafeína. En el estudio hecho por Gurpegui y colaboradores (2003), no se encontró una asociación entre el consumo de cafeína y sintomatología esquizofrénica. En dicho estudio se usaron 250 pacientes esquizofrénicos Españoles y se controló el consumo de tabaco y alcohol. Sin embargo, Gurpegui y colaboradores no compararon el consumo de cafeína y alcohol con sujetos normales. El objetivo de este estudio es completar el análisis de Gurpegui y colaboradores realizando esta comparación. También se comparará la edad de inicio de fumar diariamente de pacientes esquizofrénicos y controles, usando análisis no parametrico de supervivencia. El estudio termina comparando los efectos subjetivos del fumar y las razones por las cuales se fuma en los dos grupos usando pruebas chi-cuadrado de Pearson PALABRAS CLAVES: Análisis parámetrico de supervivencia, Pruebas Chi-cuadrado de Pearson. Nombre del trabajo: Diseño de Muestreo y Análisis de Datos Categóricos en el proceso de Autoevaluación de un Programa de Pregrado Presentado por: Claudia Maria Giraldo Velasquez RESUMEN En este trabajo se encuentra el desarrollo de la componente estadística del proceso de autoevaluación de un programa de pregrado, teniendo en cuenta los factores propuestos por el Consejo Nacional de Acreditación. Los elementos desarrollados aquí incluyen determinación del tamaño de la muestra para las diferentes poblaciones, cálculo de las proporciones a favor con sus respectivos intervalos de confianza, cálculo de la probabilidad de éxito de los factores para los diferentes estratos definidos en las poblaciones, cálculo de razones de odds, realización de pruebas de independencia, regresión logística y análisis de correspondencias múltiples. Finalmente aparece una interpretación de estos elementos estadísticos que permite determinar el estado actual del programa. PALABRAS CLAVES: Autoevaluación, datos categóricos, muestreo, intervalos de confianza, razón de odds, regresión logística, correspondencias múltiples. Nombre del trabajo: Análisis Estadístico para la Determinación de las Constantes Fenomenológicas en el Modelo de Farouk Civan para Daño de Formaciones Petrolíferas Presentado por: Marco Antonio Ruiz Serna RESUMEN Se presenta, en este trabajo, tanto los avances logrados como la relatoria de las dificultades encontradas cuando se quiere aplicar los métodos de estimación por mínimos cuadrados en los modelos de regresión no lineal para evaluar los parámetros del modelo de Civan – Knapp, el cual se utiliza para simular resultados obtenidos en mediciones de laboratorio con pruebas de desplazamiento sobre medios porosos. Si bien, no se logran resultados definitivos se inclueyen análisis de las distintas alternativas diseñadas para superar las restricciones computacionales que el procedimiento Nlin del programa SAS impone para los casos específicos en que el modelo de regresión propuesto no cuenta con una función de respuesta media de forma explícita conocida y/o sus derivados con respecto a los parámetros no se pueden expreasar con una expresión analítica. PALABRAS CLAVES: Regresión No Lineal, Mínimos Cuadrados, Procedimiento Nlin, Modelo de Civan, Programación IML. Nombre del trabajo: Aplicación de la Estadística Espacial al Análisis de Datos Georreferenciados: Distribución de los Foramníferos Planctónicos Recientes en la Cuenca de Panamá: Pacífico Colombiano Presentado por: Carlos H. Cuartas Oquendo RESUMEN El objetivo principal de este trabajo fue el de aplicar la geoestadística, como herramienta teórica, para analizar la manera como se distribuyen espacialmente doce especies de foraminíferos planctónicos encontrados en 31 perforaciones en la Cuenca de Panamá, Pacífico Colombiano. De forma más precisa, se analizó si la presencia de una cantidad determinada de individuos de cada una de las especies, encontrada en una perforación dada, tendría alguna relación espacial, autocorrelación espacial, con la cantidad de individuos encontrada en otra perforación. Para ello se realizó, de manera preliminar, una análisis exploratorio de cada una de las variables en toda el área de estudio, mediante el uso de paquetes dirigidos al análisis exploratorio de variables localizadas geográficamente, incorporados al software R. El análisis exploratorio y la prueba I de Moran, permitieron determinar aquellas especies que podrían tener autocorrelación y estacionaridad en media. Conceptos, estos, de gran importancia en la aplicación de la geoestadística.Para la especie elegida, Neogloboquadrina dutertrei, se realizó una serie de análisis posteriores con el objeto de definir de manera más clara su distribución espacial en la Cuenca. Se calculó su semivariograma, basado en la semivarianza, el cual fue sometido a modelos de ajuste para encontrar parámetros como el Sill, el Rango y la Varianza Nugget . PALABRAS CLAVES: Geoestadística, Autocorrelación Espacial, Semivariograma, Sill, Rango, Varianza Nugget, Estacionaridad, Kriging, Foraminífero Planctónico. Nombre del trabajo: Metodología Estadística para Proyectar los Pagos de la Cartera de Créditos de una Cooperativa Financiera Presentado por : Carlos Eduardo Mira Duque y Sandra Moreno Valencia RESUMEN Esta monografía presenta una metodología estadística para proyectar los pagos de la cartera de créditos de una entidad financiera, que facilite la generación de reportes indispensables en la actividad financiera como son el cálculo del Valor Económico en Riesgo por Tasa de Interés, la Brecha de Liquidez y el Flujo de Caja. Se realizó una exploración de la información de los créditos vigentes mensualmente desde enero de 2001 hasta Febrero de 2003, a través de la cual se dan a conocer una serie de comportamientos atípicos en el hábito de pago de los clientes en cada uno de los rangos de morosidad definidos. Se contó con 26 fechas de corte diferentes, en cada una de las cuales se tuvo en cuenta toda la historia de pagos de crédito vigente hasta su cancelación. PALABRAS CLAVES: Métodos Estadísticos, Crédito, Pagos. Nombre del trabajo: Aplicación de la Teoría de Valores Extremos en la Medición de Riesgo de Portafolios Óptimos Eficientes Conformados con la Teoría de Markowitz para Acciones Colombianas Presentado por: Alexander Escobar Berdugo RESUMEN El mercado financiero ha sufrido muchos cambios durante los últimos años y se han incluido muchos tipos de activos financieros los cuales poseen diferentes niveles de riesgo según las características de los mismos. Debido a la necesidad de cuantificar la probabilidad de obtener pérdidas en el sector del mercado financiero, se han utilizado técnicas tales como Valor de Riesgo para controlar éstas. Esta monografía tiene como objetivo utilizar una alternativa de análisis para este tipo de datos por medio de la Teoría de Valores Extremos, la cual utiliza cierto tipo de familia de distribuciones para el análisis de las colas de este tipo de datos. Esta teoría fue aplicada para dos tipos de portafolios conformados mediante la Teoría de Markowitz que es una técnica de conformación de portafolios la cual busca maximizar los rendimientos y al mismo tiempo minimizar el riesgo. De esta forma, y aplicando esta teoría para la conformación óptima de dos portafolios de acciones colombianas, se determinó que para portafolios con diferentes rendimientos esperados y que cumplen con , se cumple que y además la distribución de los rendimientos negativos son estadísticamente diferentes. PALABRAS CLAVES: Mercado de Valores, Métodos estadísticos, Riesgo Financiero. Nombre del trabajo: Herramientas Estadísticas Aplicadas a Mercadeo Presentado por: Sergio Estrada Jiménez RESUMEN El objetivo primordial del trabajo fue mostrar la importancia de la aplicación de modelos estadísticas como herramienta para medir resultados, soportar la toma de decisiones y entender fenómenos, por medio de la exposición del uso y aplicación de diferentes herramientas estadísticas a modelos de mercadeo. Se mostraron modelos aplicados a los comportamiento del consumidor y de los otros puntos críticos se expuso un modelo aplicado. PALABRAS CLAVES: Investigación de mercados, métodos estadísticos. Nombre del trabajo: Aplicación del Modelo de Regresión Logística a la Valoración Económica de los Bienes y Servicios Ambientales Presentado por: Carmenza Castiblanco Rozo RESUMEN El trabajo describe la forma en que se viene aplicando el modelo de regresión logística en los métodos comúnmente utilizado para valorar bienes y servicios ambientales. En este caso se utilizó el método de valoración contingente para estimar una aproximación del valor, expresado en unidades monetarias, de los beneficios de regulación hídrica que presta el Sistema de Paramos y Bosques Alto Andinos del Noroccidente Medio Antioqueño, sistema que ha sido declarado Area de Manejo Especial por parte de las autoridades ambientales. Con el fin de estimar una aproximación a la Disponibilidad a Pagar (DAP), se aplicaron cincuenta encuestas a los promotores ambientales representantes de los municipios que conforman la zona de amortiguamiento. Aunque el estudio describe claramente cada una de las etapas metodológicas que se deben seguir en este tipo de ejercicios, los resultados obtenidos no fueron estadísticamente significativos. PALABRAS CLAVES: Regresión logística, valoración contingente, bienes y servicios ambientales, disponibilidad a pagar. Nombre del trabajo: Optimización del Portafolio de Inversiones: Una Aplicación del Algoritmo Genético al Modelo CAPM Presentado por: Daniel Eduardo Loaiza Restano RESUMEN Cuando un inversionista decide invertir en acciones busca invertir en aquellas que maximicen su rendimiento y minimicen su riesgo. Sin embargo, a menudo el inversionista encuentra que “no siempre la inversión más rentable es la menos riesgosa”. Ante esta situación, el inversionista debe seleccionar el portafolio óptimo de inversión, esto es, decidir qué cantidad de su capital debe invertir en cada activo, de manera que se reduzca el riesgo y se satisfagan sus expectativas de inversión. Dos economistas, Harry Markowitz y William Sharpe, desarrollaron un modelo (conocido en la actualidad como el modelo CAPM) que permite seleccionar el portafolio óptimo al calcular la cantidad del capital que debe ser invertida en cada activo. En lo que sigue de este escrito, se evalúa el desempeño del Algoritmo Genético frente a los algoritmos del Solver de Microsoft Excel en la solución del problema de la selección óptima del portafolio de inversión al interior del modelo CAPM. PALABRAS CLAVES: Algoritmos Genéticos, Portafolio de Inversión, Modelo CAPM. Nombre del trabajo: Censo a Instituciones Generadores de Residuos Hospitalarios en el Municipio de Medellín, Ubicadas en las Comunas 10, 11, 12, 14, 15 Y 16. Presentado por: Liliana Maria López Vásquez RESUMEN Este trabajo presenta un estudio sobre el manejo adecuado de los residuos sólidos hospitalarios desde el punto de vista de varias etapas como la segregación, almacenamiento, tratamiento, recolección, trasporte y disposición final en instituciones generadoras de residuos hospitalarios de las comunas 10,11,12,14,15 y 16 del Municipio de Medellín. En este estudio se encontró que existe una relación directa entre las instituciones que poseen Manual de Residuos y las instituciones que separan residuos o utilizan el código de colores. PALABRAS CLAVES: Razón de odds, Tablas de contingencia. Nombre del trabajo: Enfoque Estadístico como Alternativa a la Aproximación Cinética de la Estimación del Tiempo de Vida Útil de un Producto Cosmético Presentado por: Rafael A. Salamanca F. RESUMEN En los estudios de durabilidad de productos cosméticos, los métodos probabilísticos son una alternativa metodológica a los cinéticos. En la estimación de la durabilidad de un jabón sólido, cosmético, se presenta análisis gráfico y la aplicación de las técnicas de riesgo a tiempos de falla obtenidos en condiciones fijas de experimentación. PALABRAS CLAVES: Riesgo, tiempos de falla, análisis gráfico, diseño escalonado, diseño completamente escalonado Nombre del trabajo: Algunos Análisis Multivariados Aplicados en Investigación de Mercados Presentado por: Adriana Maria Montoya Valencia RESUMEN Los análisis multivariados de Escalamiento Multidimensional, Correspondencias Simple y Correspondencias Múltiple tienen en común que buscan resumir una gran cantidad de datos en un número reducido de dimensiones, para facilitar de forma gráfica la interpretación de las posibles relaciones existentes entre las variables. Sin embargo cada uno tiene unos requerimientos y una forma determinada de mostrar la posible relación entre las variables. Por ejemplo el Escalamiento Multidimensional es aplicable a muy diversos tipos de datos y a distintas escalas de medidas, mientras que los análisis de Correspondencias Simple y Múltiple sólo usan variables de datos categóricos. PALABRAS CLAVES: Análisis Múltivariado, Escalamiento Multidimensional, Análisis de Correspondencias Simple, Análisis de Correspondencias Múltiple, Tablas de contingencia, Independencia, Medidas de similaridad y disimiliaridad, Investigación de mercados. Nombre del trabajo: Desarrollo de un Modelo de Pronósticos para el Número de Llamadas Diarias Entrantes a un Centro de Llamadas de una Entidad Financiera Presentado por: Adriana Congote Sanmiguel y Horacio Andrés Camacho Pulgarin RESUMEN La serie que se va a analizar en este trabajo proviene de la empresa Multienlace S.A. la cual es una empresa proveedora de soluciones de Contact Center, cuyo principal objetivo es ser un socio estratégico en la administración y operación de las relaciones de las empresas con sus clientes, distribuidores o proveedores a través de los contactos que estos tengan por medio del canal telefónico. Para lograr esto, uno de los productos principales es el Centro de Contacto. En éste se implementan líneas de servicio al cliente, las cuales tienen como principal característica el ingreso aleatorio de contactos, es decir, llamadas. Esta característica hace que se tenga un proceso en la compañía dedicado al procesamiento de información que se apoya en la utilización de técnicas y herramientas estadísticas básicas, las cuales con base en información histórica cuantitativa y cualitativa, permiten la proyección del ingreso de contactos en un determinado instante, para realizar la asignación adecuada de los recursos. PALABRAS CLAVES: Series de Tiempo, Análisis Espectral, Estacionalidad, Residuales Recursivos, Selección de Modelos, Descripción de Pronósticos, Calidad de Pronósticos. Nombre del trabajo: Clasificación de Clientes de aaaa-BBB en Coopemsura Presentado por: Yadila Hernández Marín RESUMEN En el presente trabajo se utilizaron los datos reales de clientes, pagos y créditos de la entidad COOPEMSURA registrados entre Enero de 2001 y Diciembre de 2004, el propósito fue elaborar un modelo de clasificación y/o discriminación para determinar como calificar un cliente antiguo o nuevo entre 1 de 5 categorías definidas desde +AAA a –BBB y donde cada una de ellas hace referencia a la probabilidad de cumplimiento del cliente. Para las definiciones se adoptó la terminología del sector de valores y se aplicaron criterios y reglas que establece la Superintendencia Bancaria para determinar los modelos SARC (Sistema de Administración del Riesgo Crediticio) útiles en la definición de probabilidad de incumplimiento. PALABRAS CLAVES: Árboles de decisión, , regresión logística multinomial Nombre del trabajo: Imputación de Datos en Series Hidrológicas del Oriente Antioqueño Presentado por: Alberto Lora RESUMEN Mediante este trabajo se pretende implementar una metodología automatizada para la imputación y análisis de series meteorológicas e hidrológicas, especialmente del Oriente. Antioqueño. La metodología adoptada es el Holt Winters extendido para intervalos de tiempo irregularmente espaciados, que fue seleccionada por dos razones principales: 1) la mayoría de la series en hidrología y meteorología son estacionales y 2) la fácil implementación y rapidez en la obtención de los resultados. Realizando ciertas pruebas en las que se suprimía aleatoriamente una cantidad determinada de observaciones, que inclusive podría alcanzar casi el 50% de las totales, los modelos con estacionalidad de tipo aditivo o de tipo multiplicativo. Los resultados conllevan a que el implementar el modelo Holt Winters de tipo multiplicativo, por lo general arrojará imputaciones más confiables y robustas, pero en ciertos sucesos inesperados (intervenciones) tendrá bastantes dificultades PALABRAS CLAVES: Imputación, series meteorológicas e hidrológicas, Holt-Winters extendido para intervalos de tiempo irregularmente espaciados, estacionalidad aditiva, estacionalidad multiplicativa. Nombre del trabajo: Un Modelo Armax para el Efecto de los Saldos de Liquidez sobre la Serie de los Márgenes de Negociación de Inversiones Voluntarias de una Entidad Financiera Presentado por: Juan Camilo Mayama Blandón RESUMEN Las áreas de Tesorería de una entidad financiera buscan optimizar la rentabilidad de los recursos o liquidez que administran en espera de su colaboración en operaciones de crédito. se analizan dos series de tiempo: la primera corresponde a los saldos de liquidez diarios de una entidad financiera, y la segunda al porcentaje de inversiones voluntarias en relación con el saldo de liquidez de dicha firma. Se implementan técnicas para identificar el modelo de cada serie, además de examinar un modelo de función de transferencia (ARMAX). PALABRAS CLAVES: Series de tiempo con datos financieros, modelo ARMA, modelo ARIMA, función de autocorrelación Nombre del trabajo: Modelo Logístico para la Evaluación de la Eficiencia Administrativa de los Establecimientos de Créditos del Sistema Financiero Colombiano Presentado por: Alexander Román Zapata y José María Ramírez RESUMEN La metodología presentada en este estudio permite la evaluación del nivel de eficiencia de los establecimientos de crédito del sistema financiero colombiano que son vigiladas por la Superintendencia Bancaria de Colombia, empleando un modelo logístico que establece si la empresa es eficiente o no eficiente a partir de la información contable de cada una de las instituciones y de algunos indicadores de gestión. El modelo pretende establecer un nivel de eficiencia y capacidad instalada, observando los aspectos más relevantes de la actividad económica que realizan estas instituciones. PALABRAS CLAVES: Eficiencia, A.E.D. (Análisis Exploratorio de Datos), A.C.P. (Análisis de Componentes Principales), Análisis Cluster, Regresión Logística. Nombre del trabajo: Modelación de la Volatilidad de Series Financiera a Través de los Modelos GARCH Presentado por: Yisel Alexandra Arias Henao y María del Pilar Martínez RESUMEN Este análisis está basado en la metodología de la modelación ARCH y GARCH y su enfoque teórico y práctico se le aplicará a la acción de Suramericana de Inversiones, tomando el precio histórico diario desde el año 2004 hasta comienzos del año 2006; la elección de esta acción se realizó por el recorrido económico relevante que ha tenido ésta a lo largo de los años en nuestra economía y por todos los factores externos que han influido de alguna manera a explicar el comportamiento de ésta. PALABRAS CLAVES: Heteroscedasticidad, estacionaridad, ARMA, GARCH, varianza, rendimientos. Nombre del trabajo: A Methodology to Calculate Value at Risk of Stock Portafolios Using the Kalman Filter Presentado por: Sandra Hurtado RESUMEN En este trabajo de tesis se implementó un nuevo método para el cálculo del Valor en Riesgo ó VaR de un portafolio de acciones. El VaR es un estadístico que mide el riesgo de un portafolio en el sentido de que provee un valor límite por debajo del cual los rendimientos son negativos y representan una pérdida extrema, la cual puede ocurrir con una probabilidad determinada. El concepto de VaR es similar al de percentil de un proceso estocástico. El método propuesto utiliza los betas de las acciones que conforman el portafolio. Los betas son estadísticos que representan el riesgo sistemático ó propio de la acción, y miden en qué medida el precio de una acción reacciona ante los movimientos del total de la economía, representados por los rendimientos de un índice bursátil, el cual se tomó como el IGBC, el Indice de la Bolsa de Colombia. Como se asumen betas variables, no observables, se utilizó el filtro de Kalman para estimarlos de manera recursiva. Para establecer la conexión entre los rendimientos de las acciones, los rendimientos del índice bursátil y los betas, se asumió un modelo de variables de estado consistente en un sistema de dos ecuaciones. La primera es un modelo para la dinámica de los betas, que se asume un proceso AR(1) multivariado, y para la segunda se asume el modelo CAPM, el cual establece la relación entre los procesos mencionados. El filtro de Kalman es un estimador adecuado para este tipo de modelos de variables de estado. Una vez establecido este modelo con su estimador de los betas, se define la propuesta el estimador del VaR. Se partió de la fórmula del VaR conocida como VaR factorial, la cual depende de los betas pero asume que son constantes, así como al volatilidad de los rendimientos del índice de la bolsa. La propuesta de este trabajo consistió en reemplazar esos valores constantes por correspondientes estimadores recursivos. Para la volatilidad de los rendimientos del índice se propuso utilizar un modelo AR(1)-GARCH(1,1) y para los betas los valores estimados por el filtro de Kalman. Ambos tienen expresiones recursivas. Se realizaron cálculos con base en una base de datos cuidadosamente formada por 20 de las acciones de mayor bursatilidad del mercado colombiano. Se comparó el desempeño del estadístico propuesto con el VaR media-varianza, que es el estándar (benchmark), adoptado por los agentes que deben calcular el VaR en el medio profesional. Los resultados mostraron un desempeño superior del estimador propuesto con respecto al de referencia. Adicionalmente, el trabajo incluyó un resumen de nueve pruebas de hipótesis de uso corriente en econometría para detectar heterocedasticidad (pruebas de: White, Breush-Pagan, Ploberger, ARCH, Ljung-Box, cusum, cusum cuadrado, LaMotte-McWhorter y Sunder) en residuos de regresiones, entendida como un signo de coeficientes variables, para justificar la afirmación de betas variables. Las pruebas se aplicaron a las 20 acciones y se obtuvo evidencia sobre la variabilidad significativa de los betas. Los cálculos y programación se realizaron en SAS v8.2. Los datos semanales de las acciones comprendieron el período 1990-2003. La tesis se redactó en inglés. PALABRAS CLAVES: Valor en riesgo, modelos AR multivariado, heterocedasticidad, procesos estocásticos. Nombre del trabajo: Modelamiento de la Volatilidad para los Activos Financieros Derivados Presentado por: José Luis Medina López RESUMEN Un Buen análisis de volatilidad del activo financiero, podrá predecir un modelo, que permita anticipar la rentabilidad del mismo en un posible período k sin un proceso de intervención, pero hará para el comprador o el vendedor, de un futuro o de una acción una posterior decisión, con más certidumbre a pesar de la volatilidad heteroscedástica de éstos activos. PALABRAS CLAVES: Volatilidad, Heteroscedasticidad, activos financieros derivados. Nombre del trabajo: Predicción de los Niveles Plasmáticos del Antipsicótico Risperidona a partir de los Niveles de Actividad del CYP2D6 Presentado por: Martha Lucía Orrego Londoño RESUMEN El citocromo P450 (CYP) es una familia de enzimas, la cual es la principal responsable de la biotransformación oxidativa de una gran variedad de sustratos endógenos, de las drogas de muchas otras sustancias químicas sintéticas. Se identifican principalmente 3 subgrupos genéticos del CPY (CPY1, CPY2 y CPY3) como responsables del metabolismo de la mayoría de las drogas en los humanos. PALABRAS CLAVES: Nivel plasmático, risperidona, CYP2D6, regresión logística. Nombre del trabajo: Aplicación del Algunos Métodos Estadísticos para la Identificación y Clasificación de Potenciales Presentado por: Jairo Adolfo Torres Velásquez RESUMEN Se presenta una aplicación del método de análisis factorial de correspondencias a la base de datos de la encuesta del Sisbén (Sistema de identificación y clasificación de potenciales beneficiarios para programas sociales) del municipio de Itaguí-Antioquia. El método consiste en buscar similaridades en las familias de acuerdo a las características evaluadas en la encuesta con el fin de encontrar tipologías que permitan discriminarlas y diferenciarlas en grupos para tener un conocimiento global de ellas. PALABRAS CLAVES: Análisis factorial de correspondencias, Sisbén. Nombre del trabajo: Anaálisis Morfométrico Multivariado de Varias Especies de Ranas en Relación con su Alimentación Presentado por: Pablo Andrés Guzmán González RESUMEN Se realizó un análisis exploratorio de las relaciones de tamaño y forma entre el predador y la presa para 20 especies de ranas (9 géneros y 5 familias) de la reserva forestal La Forzosa (Anorí, Antioquia, Colombia). En particular se estudió la relación entre el tamaño (longitud rostro cloaca SVL) y peso, el ancho de la cabeza (AC), la altura de la cabeza (ALC) y el largo de la mandíbula (LM) de las ranas y el tamaño (volumen, largo, ancho) de las presas. Se reportan las relaciones bivariadas de alometría para las ranas. En particular, el LM y el AC fueron las variables mejor correlacionadas con el SVL. Se utilizón un análisis de componentes principales para describir la forma de la cabeza de las especies de ranas. La dieta de las ranas se estudió por examen del contenido estomacal y se encontraron principalmente artrópodos y ningún vertebrado. Los insectos y los arácnidos fueron las clases más representativas, mientras que las hormigas (familia Formicidae) fue el grupo de presas que tuvo la mayor frecuencia en las dietas. Se encontró una relación significativa entre el tamaño de las ranas y el volumen medio de presas consumidas, lo cual sugiere que efectivamente ranas más grandes se alimentan de presas más grandes. De otro lado, la forma de la cabeza también parece afectar el tamaño de las presas, puesto que se observó una tendencia, aunque débil, de que ranas con cabezas más anchas y con una mandíbula más larga consuman un mayor volúmen de presa, no obstante, ranas con cabezas más anchas y con mandíbulas más largas ingieren un número promedio menor de presas que ranas con mandíbulas cortas y cabezas angostas. Algunas explicaciones se ofrecen al respecto. PALABRAS CLAVES: Morfometría, estadística multivariada, biología, ranas. Nombre del trabajo: Evaluación de los Métodos de Estabilidad Fenotípica a través de Validación Cruzada Presentado por: Jairo Alberto Rueda Restrepo RESUMEN Una de las principales preocupaciones de los mejoradores de plantas es la evaluación de la estabilidad fenotípica mediante la realización de pruebas regionales o multiambiente. Existen numerosos métodos propuestos para el análisis de estas pruebas regionales y la estimación de la estabilidad fenotípica. En este trabajo se compara el método de regresión propuesto por Eberhat & Russell y el de componentes de varianza propuesto por Shukla, siguiendo un esquema de validación cruzada, utilizando como indicador de un mejor modelo el parámetro RDMSP (root of mean squared error of prediction). Adicionalmente, se calculó la cantidad de veces que un modelo fue mejor que otro, en el esquema de validación cruzada. Fueron utilizados datos provenientes de 20 pruebas multiambiente de maíz, cada una con nueve genotipos, plantadas bajo un DBCA (diseño en bloques completos al azar) con cuatro repeticiones. Se encontró que, según el RDMSP, el mejor modelo para predecir el rendimiento futuro de un genotipo es el método de Eberhat & Russell, lo cual ocurrió el 90.6% de las veces evaluadas. PALABRAS CLAVES: Interacción genotipo - ambiente, adaptabilidad fenotípica, varianza de Shukla, pruebas regionales Nombre del trabajo: Aplicación de un Diseño de Experimentos para la Optimización de una Formulación Farmacéutica Presentado por: Alba Lucía Ceballos Maya RESUMEN El desarrollo y formulación de formas farmacéuticas, en particular las formas sólidas, han experimentado un cambio rápido y avance en las últimas décadas principalmente debido a la aparición de los medicamentos genéricos y de alto consumo de éstos en el mundo. Gracias a este crecimiento tan acelerado, los diseños de experimentos empleando optimización estadística para propuestas de preformulación y formulación de fármacos en cada una de las etapas del desarrollo del producto, han sido ampliamente usados en vez del método tradicional ensayo-error, mediante el empleo ycontrol de algunas variables en estudio, pudiendo sugerir expectativas para la formulación "óptima" de un producto en particular. Tales diseños implican una correcta selección y combinación de los niveles de los excipientes con el principio activo, planes de mezclas, entre otros. Lo anterior, además de economizar tiempo, equipos y recursos hace que el producto sea más efectivo y competitivo, cumpliendo con estándares de calidad ya asignados mundial o nacionalmente. PALABRAS CLAVES: Diseño de experimentos, optimización, fármacos. Nombre del trabajo: Indice Global para Evaluar a los Docentes de la Universidad de Medellín Presentado por: John Fredy López Ossa RESUMEN En cualquier área en particular, cuando se pretende analizar los datos, la utilización de la estadística es de gran beneficio, sin embargo para optimizar y lograr profundizar en dicha información la utilización de la estadística descriptiva no es suficiente y se debe utilizar análisis más complejos como los análisis multivariados. PALABRAS CLAVES: Análisis multivariado, componentes principales, análisis de cluster, índice. Nombre del trabajo: Análisis de Componentes Principales para Ocho Marcas de Salsa de Tomate. Presentado por: Dora Elsy López Ramírez. RESUMEN El análisis sensorial se convierte en una herrmienta importante para la idustria alimenticia ya que evalúa las características de determinados productos ya no desde el punto de vista de sus componentes químicos sino desde los estímulos que producen sobre los órganos de los sentidos, pudiendo determinar el nivel de agrado del consumidor final. Este trabajo busca indagar sobre las características de ocho marcas de salsa de tomate disponibles en el mercado, se toma para ello los resultados arrojados por un panel de expertos, en la segunda parte se trata de establecer grupos de salsas que tengan características semejantes. PALABRAS CLAVES: Industria alimenticia, componentes principales, análisis sensorial. Nombre del trabajo: Estudio del Índice General de la Bolsa de Valores de Colombia IGBC, Mediante un Modelo ARIMA (p,d,q) Presentado por: Luis Eduardo Cardona RESUMEN En la determinación de un modelo estadístico para explicar el IGBC se empieza con análisis del comportamiento de ese indicador durante el período comprendido entre marzo 02/2005 y junio 03/2006. Dicho análisis expone los cambios que ha sufrido dicho indicador durante este preíodo. Por otro lado pero paralelamente se ha investigado con expertos en el mercado accionario acerca de las posibles fuentes de variación o factores que puedan de alguna manera afectar el comportamiento del IGBC. PALABRAS CLAVES: IGBC, mercado accionario, fuentes de variación, modelo ARIMA, pronóstico, PACF, ACF, Inversionista, corto plazo. Nombre del trabajo: Elaboración de una Formulación Farmaceutica a través de un Diseño Experimental de Mezclas Presentado por: Juan Fernando Pinillos Madrid RESUMEN El objetivo principal de este trabajo fue aplicar el diseño experimental de mezclas a la formulación de una forma farmacéutica sólida (ibuprofeno) a través del estudio de sus excipientes y la proporción de estos en la formulación, además de mostrar como el personal de investigación y desarrollo en las empresas farmacéuticas nacionales pueden utilizar las herramientas estadísticas como el diseño de mezclas para obtener un producto con las características requeridas partiendo desde el conocimiento de la función de los excipientes y posteriormente la optimización de un producto adecuado reduciendo no sólo los costos de investigación sino los costos de producción y generando mayor confianza por parte de los consumidores con productos que puedan competir al mismo nivel de los medicamentos innovadores. En este estudio se evaluaron parámetros farmacotécnicos relacionados con los procesos de desarrollo y producción que permitieran garantizar que una tableta de ibuprofeno medicamento genérico cumpla con los requerimientos de calidad y fabricación adecuados acorde con las exigencias dadas por las Buenas Prácticas de Manufactura (BPM) bajo un diseño experimental de mezclas con restricciones caracterizando una superficie de respuesta que permitió un eficiente aprovechamiento de esta metodología para la resolución del problema de formulación.
Nombre del trabajo: Caracterización de la Población Estudiantil del Colegio Colombo-BritánicoUsando Variables Socioeconómicas Y de Dedicación al Estudio Envigado - 2008 Presentado por: Sandra Edilma Velásquez Jiménez RESUMEN Este trabajo pretende obtener una caracterización de la población estudiantil de las secciones de primaria y bachillerato, del Colegio Colombo-Británico pues, “tanto en instituciones educativas, como en muchas otras, se hace necesario disponer de información global y actualizada sobre las personas que la integran, ya que ésta se constituye en una herramienta fundamental para desarrollar aspectos tales como: Sirve de base para establecer un perfil confiable de los estudiantes con los que se cuenta. Nombre del trabajo: Creación de Índices de Gestión por Calidad para las Organizaciones de Salud Mediante Técnicas de Análisis Multivariado. Acp. Presentado por: José Bareño Silva RESUMEN Dar a conocer la propuesta experimental de índices de gestión por calidad para las organizaciones de salud, como recurso de homologación y estandarización de aquellos índices cuya agrupación, bondad de ajuste e interrelación carecen de antecedentes en la literatura científica especializada, no obstante su importancia para nuestras instituciones. Métodos: 1. Revisión bibliográfica y sustentación de la información considerada relevante. 2. Diseño de una matriz que contenga los seis índices escogidos: Oportunidad, Riesgo, Costo/Efectividad, Satisfacción, Innovación e Impacto Ambiental, para un total de catorce indicadores, relativos a estructura, procesos y resultados en cada una de tres áreas clave de la organización tipo: Asistencial, Estratégico/Administrativa y Laboral, la que se somete a consideración como paso previo a la… 3. Simulación del Sistema mediante la técnica estadística multivariable descriptiva de Análisis de Componentes Principales ACP. Resultados: Se espera que el modelo en su conjunto permita el manejo eficiente de la copiosa y cada vez más compleja información sectorial, así como la cualificación, comparación y utilización de los datos para el mejoramiento y la gestión general de las instituciones. Conclusión: Es necesario que con la información recopilada y procesada se puedan tomar decisiones útiles. El trabajo aspira a superar esta necesidad y, de ser posible, a trascenderla. Palabras clave: gestión por calidad, índices, homologación/estandarización, salud, propuesta experimental. Nombre del trabajo: Propuesta de una Metodología de Estimación de Demanda de Accesorios de Joyería, en una Empresa de Venta Directa Colombiana Presentado por: Anabel María García Tabares RESUMEN Las compañías que operan bajo el canal de venta directa y ofrecen sus productos a través de catálogo, requieren contar con sistemas de predicción de demanda eficientes para cumplirle a sus clientes con la entrega oportuna de sus pedidos, manteniendo de esta manera la relación de confianza que permite la continuidad de las ventas y por ende, el sostenimiento y crecimiento de la compañía. Nombre del trabajo: Productos Antioqueños Exportados a Estados Unidos: Un Anaálisis de Clúster Presentado por: Sergio Echeverry López RESUMEN Los tratados de libre comercio son una realidad de la economía colombiana, especialmente por la futura aprobación del TLC con los Estados Unidos. En este marco de globalización, las pequeñas y medianas empresas, PYMES, requieren realizar esfuerzos significativos para integrarse a economías de mercado a escala mundial. En este contexto, los procesos de exportaciones e importaciones dentro de una cadena logística integral toman un papel de primer orden en la planeación estratégico a mediano plazo. Estados Unidos es el mercado más grande del mundo y su capacidad de compra es un verdadero reto para los países latinoamericanos que pretendan lograr niveles de crecimiento económico sostenible. Países como Chile, México y Costa Rica han aumentado significativamente su ingreso per-cápita y en general, todos sus indicadores macroeconómicos presentan un crecimiento exponencial a partir de la apertura de fronteras con los Estados Unidos, que permite a los exportadores locales ser más competitivos en este exigente mercado. Nombre del trabajo: Técnica de Valoración de un Seguro de Vida con dos Supuestos de Riesgos Competitivos Presentado por: Luis David Arcila Hoyos RESUMEN La téncia de valoración de de un seguro de vida o Asset Share bajo dos supuestos de riesgos competitivos, es una herramiesta y necesaria en la administración de una compañía aseguradora ya que permite analizar el resultados de un seguro de vida bajo la influencia de diferencies variables, generando el resultado del negocio año tras año. Dentro de la valoración se pueden presentar dos supuestos de riesgos competitivos. o doble decrementos, los cuales permiten evaluar la interacción entre la probabilidad de muerte y la probabilidad de cancelación del producto, dichos supuestos están asociados a dos distribuciones de probabilidad, distribución uniforme y distribución exponencial. Nombre del trabajo: Implementación de una Metodología de Pronósticos Aplicada al Área de Ventas de Productos a Base de Chocolate para la Compañía Nacional de Chocolates Presentado por: Gina Andrea Beltrán y Marcela Zuluaga Duque RESUMEN Este documento presenta una metodología paso a paso para la elaboración de pronósticos de ventas en productos a base de chocolate utilizando métodos cuantitativos. El pronóstico de ventas define las metas en pesos y en kilos por mes que la compañía proyecta alcanzar en el período de un año. La importancia de los pronósticos radican en que éstos soportan importantes decisiones de tipo estratégico ( a largo plazo) y operativo (a corto plazo), que involucra diversas áreas como: ventas, mercadeo, producción y financiera, algunos ejemplos de estas decisiones son: crecimiento y utilidad, planeación de la producción, planeación de las compras, requerimiento de mano de obra, compra de nuevos equipos, manejo de inventarios, salarios de la fuerza de ventas, recursos para invertir en clientes, entre otros. Así, el pronóstico de ventas se convierte en información muy valiosa y determinante para alcanzar las metas en la organización.
TESIS DE MAESTRÍA
Presentado por: Francisco Javier Díaz RESUMEN Se define una clase particular de distribuciones, la clase E, que tiene la propiedad siguiente: si X está en E y tiene una función de distribución F entonces existe un número real q en el intervalo (0,1] tal que el límite inferior del cociente P(Xx+t)/P(Xt), cuando t tiende a infinito es una función de x, g(x), tal que esta función tiende a q cuando x tiende a su vez a infinito. El caso q=1 es bien conocido en la literatura. Se conocen propiedades de esta clase tales como el ser cerrada por convolución. Esta propiedad es extendida al caso E, al igual que otras propiedades. También se prueba un teorema de caracterización de la clase E con base en los cuantiles residuales, definidos como los cuantiles de la distribución residual de X en un valor x=t, es decir, la función Ft(x)=1-P(Xx+t)/P(Xt), t 0. Los estimadores de estos cuantiles para varias probabilidades p = 0.1, ..., 0.9, permiten definir un método gráfico para determinar el tipo de distribución de los datos con respecto pertenecer o no a la clase E. El gráfico conjunto de tales cuantiles se denominó "ramillete de cuantiles residuales". Se mostraron varias aplicaciones del método con datos reales y simulados. Palabras Clave: Distribuciones de cola pesada, clase E, ramillete de cuantiles residuales. Nombre de la Tesis: Elementos para una Teoría de Estimación de Procesos Impulsibos con Aplicaciones en Telecomunicaciones Presentado por: Juan G. Gonzalez Cuartas RESUMEN En esta Tesis introducimos los elementos fundamentales para una teoría estadística aplicada a procesos impulsivos o con colas pesadas. Palabras Clave: Procesos impulsivos, procesos con cola pesada, desigualdad de tipo Chebyshev Nombre de la Tesis: Efectos de las Observaciones Outliers en Modelos de Estructura de Covarianza Presentado por: Carlos Mario Parra Mesa RESUMEN En el trabajo se analiza la incidencia que tienen las observaciones outliers o atípicas en la estimación de parámetros de un modelo de estructura de covarianza. Se definió un modelo recursivo de la clase de modelos LISREL completos, que consta de 2 variables latentes endógenas y una exógena, cada una de las cuales tiene asociada 3 variables medibles cuyos errores de medición están incorrelacionados. Además, se generaron 10000 observaciones independientes de N9 (O, S) a travéz del procedimiento IML del SAS; se escogió el método de estoimación de máxima verosimilitud y se ajustó el modelo a travéz del procedimiento CALIS del SAS. Las estimaciones de los parámetros a partir de tal muestra se tomaron como valores de referencia y frente a ellos se evaluaron los resultados de las estimaciones de los mismos parámetros cuando la muestra fué contaminada por cambios preestablecidos en una de las componentes de la observación multivariada y en número de 1, 100, 500 y 1000 observaciones. Palabras Clave: Modelo Lisrel, Outlier, Simulación, Modelos de estructura de covarianza Nombre de la Tesis: Comparación entre la Discriminación Normal - Lineal y Cuadrática- y la Regresión Logística para Clasificar Vectores en dos Poblaciones Presentado por: Francisco Javier Castrillón Meneses RESUMEN La clasificación de vectores está basada en la estimación de los parámetros de la ecuación de la frontera entre las dos poblaciones también conocida como Función Discriminante de Fisher. Si la estimación se hace por máxima verosimilitud a partir de una muestra correctamente asignada, el método es conocido como Procedimiento de Discriminación Normal. Pero si se hace condicionalmente sobre los vectores observados, el método se conoce como Procedimiento de Regresión Logística. El Procedimiento de Discriminación Normal lineal -que se da cuando las Palabras Clave: Clasificación de vectores, función discriminante de Fisher, regresión logístca, discriminación normal-lineal y cuadrática, ARE Nombre de la Tesis: Projection Pursuit Discreta Presentado por: Juan Carlos Salazar Uribe RESUMEN Projection Pursuit es una técnica exploratoria ideada para trabajar con datos de alta dimensión. Projection Pursuit realiza una búsqueda intensa entre muchas proyecciones de los datos buscando aquellas que muestren facetass interesantees del conjunto de datos originales. este trabajo pretende mostrar algunos usos prácticos de la técnica P.P. Discreta usando diferentes tipos de proyecciones; la elección de estas proyecciones depende de la estructura de los datos. Projection Pursuit Discreta permie obtener proyecciones que pueden representar ciertos comportamientos de los datos. Uno de los aspectos importantes de Projection Pursuit Discreta es que permite la reducción de la dimensionalidad del problema, pues las proyecciones usualmente se hacen a una, dos o tres dimensiones. Una vez se obtienen estas proyecciones se debe trataar de encontrar aspectos interesantes de la geometría p-dimensional de los datos. También se trata de resaltar la importancia de la transformada de Radon en el contexto de P.P. Discreta y la forma como se obtienen proyecciones con ella. Se expone un algoritmo para implementar la técnica, cuando se tiene no datos referentes a conteos organizados en forma matricial. Este último es uno de los aportes más importantes de este trabajo y subraya la importancia de P.P. Discreta como técnica exploratoria. Adicionalmente se revisan algunas de las formulaciones más importantes de la Entropía; Se mostrará una aplicación de P.P. Discreta para explorar tablas de contingencia, exactamente en el ejemplo referente a pruebas Icfes; cabe anotar que en este ejemplo, se plantea un método para trasladar esas tablas de contingencia, al espacio vectorial , donde m es el número de tablas que particionan la población y n es el número de celdas de cada tabla; esto facilita el cálculo de la trasformada de Radon; en otro ejemplo se compara la técnica con un vínculo simple, que utiliza la distancia del vecino más cercano; también hay aplicaciones de P.P. discreta en pruebas de selección múltiple y en estudios de ordenamientos, resaltando la importancia de conjuntos tales como y en el marco de P.P. discreta. Palabras Clave: Projection Pursuit, Transformada de Radon, métodos jerárquicos, tablas de contingencia. Nombre de la Tesis: Comparación de Algunas Medidas Multivariadas de Asimetría y Kurtosis y su Utilización en Pruebas de Multinormalidad Presentado por: Mario César Jaramillo Elorza. RESUMEN El trabajo germinal de Mardia (1970) da definiciones multivariadas de Asimetría y Kurtosis que son usadas en pruebas de multinormalidad, y ha dado origen a gran variedad de extensiones y formalizaciones. Se hace una revisión de dichos conceptos y de las comparaciones entre ellos en cuanto a su potencia. Se muestra como los tests formales de bondad de ajuste basados en el principio Score de Rao y la noción de tests suaves de Neyman no son mejores que los basados en estadísticos que generalizan las nociones de asimetría y kurtosis. Palabras Clave: Asimetría, kurtosis, multinormalidad, afin invariantes, dependientes de coordenadas, principio Score de Rao, tests suaves de Neyman, estudios de potencia Nombre de la Tesis: Una Transformación de Simetría, Vía Marginal y la Media Retransformada para el Caso Bivariado Presentado por: Juan Delgado Lastra RESUMEN Muy a menudo en el análisis estadístico de datos multivariados es neresario realizar transformaciones sobre los datos debido a la presencia de valores atípicos o a la asimetría de su distribución. Para el análisis de esta clase de datos, este trabajo de grado presenta un estimador de la transformación de potencia vía marginal que los simetriza y, un estimador de baja sesgo de la media retransformada bivariada sin hacer uso del supuesto de normalidad bivariada. A través de la técnica de bootstrap se obtuvo tanto la matriz de var-covarianzas del estimador de la transformación, como el de la media retransformada bivariada. Los resultados obtenidos a través de simulación muestran que el procedimiento propuesto parece ser un competidor del método de Máxima verosimilitud en distribuciones como la lognormal, gama tipo I y pareto bivariadas, aunque no ocurrió lo mismo con la distribución Beta Stacy, pues en este caso no fue posible simetrizar la muestra vía marginal, supuesto básico en la aplicación de este método, muy posiblemente por la situación de dependencia entre las dos variables. Palabras Clave: Técnica Bootstrap, Retransformada Bivariada, Distribución lognormal, gama tipo I y paralelo bivariada. Nombre de la Tesis: Detección de Outliers Multivariables Mediante Projection Pursuit Presentado por: Victor Ignacio López Rios RESUMEN En este trabajo presentamos la revisión de algunos métodos para la detección de outliers multivariables e implementamos una nueva técnica utilizando el enfoque por "Projection Pursuit" (P.P.) (búsqueda de proyecciones). Con el fin de evaluar las proyecciones construímos dos índices: Uno de ellos es una versión del índice radial unidimensional y el otro se basa en la diferencia media de Gini. Mediante simulaciones mostramos situaciones particulares en las cuales la técnica P.P. detecta los outliers multivariables en forma exitosa, mientras que el método más utilizado de los revisados, el de componentes principales, no los detecta. Palabras Clave: Outliers multivariables, Projection Pursuit, Indices de Projection Pursuit, Diferencia media de Gini, Indice Radial y componentes Principales. Nombre de la Tesis: Identificación de Grupos de Datos Influenciales en Regresión Logística Mediante Clusters Presentado por: Carlos Mario Lopera Gómez RESUMEN La detección de grupos de datos influenciales es ampliamente utilizada en regresión lineal. Este trabajo pretende extender al caso de tener una regresión logística, un método de identificación de grupos de datos influenciales en regresión lineal basado en clusters propuesto por J. B. Gray y R. F. Ling (1984). Para cumplir con este objetivo se definen a partir de medidas para grupos de datos influenciales útiles en regresión lineal, medidas de influencia similares en el caso logístico, de igual forma se presenta una técnica basada en clusters que permitirá identificar grupos de datos influenciales en el caso logístico, y posteriormente, se evaluará el desempeño del procedimiento mediante simulación de configuraciones contaminantes en regresión logística, lo cual permite establecer las fortalezas y debilidades de la técnica. La evaluación de la efectividad se hace utilizando las medidas de influencia generalizadas al caso logístico acompañadas de gráficos donde se puede ratificar si aquellos grupos de datos candidatizados a influenciales por la técnica propuesta en realidad lo son o no se deben tener en cuenta en el análisis y esos mismos gráficos permitirán candidatizar nuevos grupos de datos. Nombre de la Tesis: Carta T2 con Base en Estimadores Robustos de los Parámetros Presentado por: Nelfi Gertrudis Gonzalez RESUMEN Una causa de estado de fuera de control en la primera etapa de implementación de un sistema de control estadístico multivariado, usando la carta T2 de Hotelling con n observaciones históricas individuales, consiste en la presencia de k outliers multivariados ubicados arbitrariamente en dicho conjunto de datos. La carta T2 basada en los estimadores insesgados usuales del vector de medias y de la matriz de varianzas covarianzas carece de robustez ante la presencia de este tipo de observaciones. En este trabajo se pretende utilizar procedimientos desarrollados en detección de outliers multivariados y estimación robusta con el fin de subsanar esta deficiencia de la carta T2. El procedimiento propuesto consiste en el uso de estimaciones robustas del vector de medias y de la matriz de varianzas covarianzas en la construcción del estadístico T2. Se prueba con estimadores MVE (Elipsoide de Mínimo Volumen), estimadores S biponderados y estimadores Stahel - Donoho y mediante simulación se comparan estos procedimientos frente a diversos niveles de contaminación con outliers provenientes de tres modelos contaminantes; el desempeño es establecido con base en cuatro medidas obtenidas como promedio de las simulaciones y para la comparación se recurre a gráficos de las curvas de respuesta de cada medida, en cada nivel y modelo de contaminación. Los resultados señalan que los procedimientos basados en estimadores S y MVE son consistentemente los mejores para la detección de outliers provenientes de perturbaciones en el vector de medias y/o la matriz de varianzas covarianzas, y en particular el procedimiento basado en estimadores S resulta ser el mejor. Palabras Clave: Control multivariado, T2 de Hotelling, estimadores robustos, outliers multivariados Nombre de la Tesis: El Efecto de la Dependencia entre los Tiempos de Falla en la Estimación de la Confiabilidad de un Sistema con Dos Modos de Falla Presentado por: Eva Cristina Manotas RESUMEN En esta investigación el objetivo central es identificar el efecto de la dependencia entre tiempos de falla en la estimación de la confiabilidad de un sistema con dos modos de falla. Esto implica obtener la función de confiabilidad del tiempo mínimo entre tiempos de falla. La metodología tradicional asume independencia entre tiempos de falla. Este trabajo pretende medir el grado de error que dicho supuesto conlleva, para ello se hacen simulaciones que obtienen tiempos bivariados asociados a diferentes distribuciones Lognormales y Weibull, ya que éstas son de amplio uso y aplicación. Cada escenario de simulación contiene 6 situaciones diferentes, asociadas a 6 valores del parámetro de dependencia entre los tiempos de cada modo de falla; la dependencia es medida por el coeficiente de correlación en el caso lognormal, y el parámetro de dependencia? en el caso Weibull. Se obtienen así las medidas pertinentes para cada una de las situaciones estudiadas, y se aprecia de los resultados analíticos que cuando se ignora la dependencia, hay diferencias considerables entre la función de confiabilidad verdadera y la estimada Palabras Clave: Confiabilidad, Dos modos de falla, Distribución del tiempo mínimo, Lognormal bivariada, Weibull bivariada, parámetro de dependencia. Nombre de la Tesis: Modelos y Análisis para Datos de Degradación Presentado por: Ronald Andrés Granada Galvis RESUMEN La degradación es un deterioro progresivo que eventualmente puede causar la falla (e.g, el desgaste que sufren los neumáticos de un automóvil). Cuando es posible medirla, ésta puede proporcionar mayor información que los datos de tiempo de falla, para propósitos de determinación y mejoramiento de la confiabilidad de un producto. Se desarrollan técnicas propuestas por Meeker y Escobar (1998)) hoy en la frontera de la Teoría de Confiabilidad (Lawless (2000)). En este trabajo se compara el análisis aproximado de degradación con el modelo de degradación explicito. Estos últimos modelos implican la utilización de modelos físicos de degradación a los cuales se les introducen efectos aleatorios. Se implementan las técnicas para la estimación de modelos mixtos en S-PLUS siguiendo a Pinheiro y Bates (2000) y con métodos bootstrap se calculan los intervalos de confianza. Se utiliza la simulación para comparar las dos metodologías propuestas y hacer recomendaciones relativas a su utilización. Palabras Clave: Metodologías para el Análisis de Datos de Degradación, Nombre de la Tesis: Propiedades Estadísticas de un Algoritmo Adaptable para Individualizar la Dosificación en un Esayo Clínico Controlado por Concentración Presentado por: Tulia Esther Rivera Flórez RESUMEN Un problema fundamental de la farmacología clínica, es el determinar la dosificación óptima de una droga que producirá una concentración plasmática deseada de la droga, o que producirá una concentración que esté dentro de un rango de concentraciones deseado, para un paciente determinado. Para resolver este problema, se ha propuesto el uso de la estimación Bayesiana empírica, en combinación con modelos farmacocinéticos poblacionales mixtos y medidas repetidas de concentraciones. El objetivo de esta tesis es sugerir como individualizar la dosificación de una droga en un paciente particular, o en un sujeto experimental, cuando el logaritmo de la razón concentración/dosificación de una droga en el estado estable puede describirse con un modelo lineal con intercepto aleatorio. El modelo puede incluir covariables tales como la edad, el género, el peso corporal, el uso concomitante del cigarrillo u otras drogas, estados de enfermedad y demás variables relevantes, clínicas o demográficas. Nuestra propuesta implementa un algoritmo adaptable con retroalimentación Bayesiana empírica, con el fin de determinar la dosificación óptima correspondiente a un rango de concentraciones deseado sugiriendo un criterio de optimalidad para detener la búsqueda de la dosificación y mostrando expresiones que permiten calcular el número mínimo de pasos del algoritmo necesarios para obtener la dosificación óptima. Palabras Clave: Algoritmo con Retroalimentación Bayesiana, Clozapina, Individualización de la dosis, Modelo lineal mixto con intercepto aleatorio, Ensayos clínicos controlados por Concentración, Concentración Estable, Ventana Terapéutica. Nombre de la Tesis: Bandas de Confianza de Percentiles Relativos entre Poblaciones Lognormales, con Aplicación a Tiempos de Supervivencia de Pacientres con Sida Presentado por: Fidel Ernesto Castro Morales RESUMEN En esta tesis se desarrolla la banda de confianza de tiempos relativos para comparar las funciones de supervivencia de dos poblaciones lognormales, en presencia de censura a derecha, controlando el efecto de posibles variables confundentes y sin asumir necesariamente un parámetro de escala homogéneo entre las poblaciones. Con el fin de comparar esta tesis, con el trabajo realizado por Muñoz y Sunyer (1996); también, se describe la banda de confianza de tiempos relativos para comparar las funciones de supervivencia de dos poblaciones Weibull. Como aplicación, se usa una muestra de 405 hombres homosexuales con SIDA diagnosticados con neumonía P. Carinii obtenida en un estudio multicentro realizado en cuatro centros médicos en los Estados Unidos, entre los años de 1984 y 1992. En esta aplicación, se usan los tiempos relativos para medir el efecto producido por la introducción de diferentes terapias antivirales, en el tiempo de supervivencia (medido desde el momento del diagnóstico de neumonía P. Carinii hasta la muerte del sujeto) controlando la edad al momento del diagnóstico, el conteo de CD4, la raza y el tabaquismo. Asumiendo los modelos lognormal y Weibull para los tiempos de supervivencia, se determinó que sólo la edad y el conteo de CD4 tienen un efecto significativo sobre el tiempo de supervivencia. Por otro lado, los tiempos relativos asumiendo ambos modelos permitieron concluir que el tiempo de supervivencia de los sujetos es alargado con el uso de las nuevas terapias introducidas después de 1987. Como conclusión, se muestra que la estimación e inferencia de los tiempos relativos para comparar funciones de supervivencia de poblaciones lognormales, requiere de procedimientos sencillos y proporcionan una interpretación directa. Además, se muestra que los tiempos relativos son un procedimiento útil para comparar dos poblaciones lognormales sin asumir necesariamente un parámetro de escala homogéneo entre éstas. Palabras Clave: Percentiles relativos, distribución lognormal, Bandas de confianza, comparación de poblaciones, variables de confusión. Nombre de la Tesis: Diagnósticos de Convergencia para algoritmos MCMC en la Estimación de Modelos Jerárquicos Bayesianos Presentado por: Mauricio Zapata Cuartas RESUMEN Se presentan dos nuevas rutinas de diagnóstico de convergencia sobre los métodos MCMC (Markov Chain Monte Carlo), especialmente de los generados con muestreadores de Gibbs cuando se aplican a estimación de modelos bayesianos de alta dimensionalidad. Un aspecto importante en la aplicación de estos método es determinar cuándo se debe parar de muestrear y cuantas iteraciones son suficientes para estimar características de las distribuciones de interés. La nueva propuesta presentada aquí es una combinación de métodos de diagnóstico gráficos y cuantitativos reportados en la literatura que operan secuencialmente sobre la salida de los muestreadores y la combinación entre ellos complementan un adecuado diagnóstico. Para efectos de poner en práctica las propuestas de diagnóstico se presentan dos casos de ejemplo. el primero es un caso de estimación de un modelo normal trivariado simulado con alta correlación (de baja dimensionalidad), el segundo es un caso de estimación de un modelo jerárquico con datos longitudinales reales (alta dimensionalidad). La primera rutina de diagnóstico opera sobre salidas con una cadena y prueba en que momento la muestra proviene de una distribución estacionaria. La segunda rutina opera sobre salidas con múltiples cadenas e intenta probar cuándo las cadenas simultáneamente provienen de una distribución estacionaria. Con los ejemplos se muestra que las dos nuevas rutinas de diagnóstico son consistentes con los parámetros estimados, pero pueden presentan grandes diferencias en cuanto a la longitud de cadenas de Markov necesarias y los requerimientos de tiempo de cómputo. Se recomienda la primera rutina de diagnóstico por su fácil ejecución y por ser la que menos tiempo y memoria de cómputo requiere. Todos los procedimientos utilizados se pueden implementar en software gratuito y existen para algunas de las rutinas códigos disponibles. Nombre del trabajo: Incorporación de Mediciones Previas de Concentraciones Plasmáticas de una Droga en un Algoritmo de Individualización Basado en un Modelo Lineal con Intercepto Aleatorio Presentado por: Diego Mauricio Rendón RESUMEN El presente trabajo popone, mediante la generalización de algunos resultados, proporcionar una metodología para la incorporación de mediciones previas de pares dosis-concentración, en un algoritmo de individualización de droga propuesto por Díaz et al. (2006) y que asume un modelo lineal con intercepto aleatorio. Igualmente, también se calcula el número de observaciones (tamaño muestral) que se requiere para generar, con un algoritmo o procedimiento diferente al propuesto por Díaz et al. (2006), dosis que produzcan, con la máxima probabilidad obtenible, concentraciones de droga dentro de un rango objetivo. PALABRAS CLAVES: Retroalimentación bayesiana, individualización de dosis de droga, concentración óptima Nombre del trabajo: Estimación por el Método de Momentos Eficientes en un Modelo de Volatilidad Estocástica con Asimetría Presentado por: Mauricio Lopera Castaño RESUMEN En este trabajo se realiza un estudio Monte Carlo sobre las propiedades de los métodos de estimación GMM y EMM en un modelo de volatilidad estocástica asimétrico. El método de estimación GMM usa esperanzas incondicionales como condiciones poblacionales para hallar estimaciones. Por otro lado, EMM usa la esperanza bajo el modelo estructural del score de un modelo auxiliar como condiciones poblacionales.
Nombre del trabajo: Estimación de Funicones de Intensidad en un Modelo de Markov de Tres Estados Bajo el Efecto de Covariables con Datos Longitudinales Presentado por: René Iral Palomino RESUMEN Los modelos de estados múltiples han demostrado ser de utilidad para el análisis de datos longitudinales, particularmente aquellos que involucran información acerca de la prograsión de una enfermedad a través del tiempo, Kay (1986). En este trabajo se considera un proceso de Markov con tres estados que pueden representar los estados de una enfermedad: Sano, Declarado y Muerte, por ejemplo. El objetivo primordial es poder modelar las tasas de transición entre estados y estimar los parámetros asociados a dichas tasas. Por medio de un estudio de simulación se obtienen condiciones óptimas para tamaños de muestra y número de mediciones repetidas de los individuos involucrados para estimar las tasas de transición de un estado a otro, a través de la cobertura de los respectivos intervalos de confianza estimados. Posteriormente considerando dichas condiciones óptimas se mide el efecto de introducir covariables en el modelo en la estimación de las tasas de transición al contrastarlas con aquellas obtenidas sin tener en cuenta las covariables, evaluado a través del sesgo relativo. El algoritmo utilizado en ambos casos, requiere la estimación de las varianzas de las tasas de transición, las cuales son estimadas usando el método delta, Van der Vaart (2000), y el cual constituye el aporte más significativo de este trabajo. La técnica se ilustra usando datos de la CIB (Corporación para Investigaciones Biológicas CIB, Medellín) acerca del daño de las articulaciones de manos y pies de un paciente con artritis reumatoide (AR).
Nombre del trabajo: Estimación de Funciones de Intensidad en un Modelo de Tres Estados en Presencia de Censura Arbitraria Presentado por: Luisa Fernanda Rosales Cerquera RESUMEN Los modelos de estados múltiples conforman una importante familia de herramientas estadísticas que sirven para modelar la dinámica de procesos recurrentes a través del tiempo o algún fenómeno cambiante en el tiempo. En este trabajo se estudia una metodología para estimar funciones de intensidad dependientes del tiempo en presencia de censura de intervalo y censura a derecha cuando se considera un modelo de tres estados del estilo enfermedad - muerte como el propuesto por Harezlak, Gao & Hui (2003). Esta metodología constituye una generalización de la propuesta por Joly & Commenges (1999) para estimar las funciones de intensidad. Adicionalmente, se deduce matemáticamente la función de verosimilitud, la cual incorpora información que ha sido recolectada longitudinalmente, así como los diferentes modos de censura. Esta verosimilitud se debe optimizar numéricamente con la ayuda de una cuadratura de Gauss ya que en dicha expresión aparece una integral que se relaciona con unidades censuradas. Se explora, por medio de un estudio de simulación, un método basado en funciones por tramos (Faddy 1976) para obtener una estimación de las intensidades. Finalmente, se ilustra la metodología usando datos reales. PALABRAS CLAVES: Funciones de intensidad, modelo de tres estados, censura arbitraria Nombre del trabajo: Estimación y Comparación del Efecto de Asimetría en Modelos GJR, con Aplicaciones Presentado por: Alejandro Regino Gómez RESUMEN En este trabajo se hace un recorrido sobre la evolución de los modelos de tipo ARCH generalizados (GARCH) para capturar el comportamiento de la volatilidad de los rendimientos de ciertos activos financieros y se estiman los estimadores cuasi-máximo verosímiles (QMLE) a partir del trabajo de Bollerslew y Wooldridge (1987). PALABRAS CLAVES: Modelos GJR, asimetría Nombre del trabajo: Efecto de la Agregación de Ventas y Reclamos en Bases de Datos de Garantía en el Estimador en el Estimador de la Tasa de Reclamos Agregada y su Varianza Presentado por: Jorge Mario Obando López RESUMEN Los datos de garantía tratados de una manera estadística adecuada son útiles para la predicción de reclamos futuros, comparaciones entre reclamosde productos, estimación de la confiabilidad e identificación de mejoras del producto. Este análisis requiere de disponibilidad de información diaria que, muchas veces, sólo se tiene en totales semanales o mensuales (agregación de datos) debido a la logística de la empresa. PALABRAS CLAVES: Confiablidad, análisis de datos de garantía, procesos de conteo, tasa de intensidad Nombre del trabajo: Comparación entre Análisis Discriminante no Métrico y Regresión Logística Presentado por: Olga Cecilia Úsuga Manco RESUMEN Se presenta una comparación entre el análisis discriminante no métrico y la regresión logística en términos de tasas de clasificación errónea para dos poblaciones. El análisis discriminante no métrico es un procedimiento no paramétrico que no tiene supuestos de distribuciones específicas y por lo tanto tiene amplia aplicación en diversas distribuciones. Este método obtuvo tasas de clasificación errónea similares a la regresión logística en el caso de dos poblaciones provenientes de distribuciones normales multivariadas con matrices de covarianzas iguales, mostrando un mejor comportamiento cuando el tamaño de las muestras aumenta; además, para muestras desbalanceadas se observó un comportamiento similar en los dos procedimientos. Para el caso de dos poblaciones provenientes de distribuciones normales multivariadas con matrices de covarianzas diferentes se observa un comportamiento similar, mejorando su desempeño con respecto a la regresión logística a medida que el tamaño muestral aumenta. Finalmente, para variables binarias, la regresión logística muestra un comportamiento superior al análisis discriminante no métrico. PALABRAS CLAVES: Análisis discriminante no métrico, regresión logística Nombre del trabajo: Extensión del Análisis Gráfico del Modelo Lineal General a los Modelos Lineales Generalizados Poisson y Gamma Presentado por: Jairo Arturo Angel Guzmán RESUMEN En la actualidad es importante, dentro del campo de la estadística aplicada, al usar los modelos lineales generalizados Poisson y Gamma, los diagnósticos gráficos que se puedan dar al proponer justificadamente cualquiera de estos modelos como una solución a un problema de interés. PALABRAS CLAVES: GLMs, Added variable, gráfico residual parcial, Augmented, CERES, AMONE, AMALL Nombre del trabajo: Comparación entre el Análisis Discriminante no Métrico y Regresión Logística Multinomial Presentado por: Freddy Hernández Barajas RESUMEN En este trabajo se presenta un estudio de comparación entre las técnicas de clasificación análisis discriminante no métrico, regresión logística multinomial; adicionalmente, se considera la técnica tradicional análisis discriminante lineal ya que la función de clasificación de ésta sirve como punto de partida para análisis discriminante no métrico. Los escenarios bajo los cuales se llevó a cabo el estudio fueron los siguientes: tres grupos distribuidos normal bivariado con matrices de varianza y covarianza iguales y diferentes, siete grupos distribuidos normal con tres variables y matrices de varianza y covarianza diferentes, tres grupos distribuidos Logitnormal, Lognormal y Sinh-1-normal con dos variables. Los desempeños de las técnicas fueron medidos con la tasa de clasificación errónea. Las técnicas de Regresión Logística Multinomial y Análisis Discriminante Lineal obtuvieron tasas de clasificación errónea muy similares en todo el estudio e inferiores que Análisis Discriminante no Métrico. Se construyeron funciones en el programa R para implementar el algoritmo propuesto por Choulakian y Almhana (2001) para técnica Análisis Discriminante no Métrico. Se llevó a cabo una aplicación de las tres técnicas utilizando una base de datos real sobre datos antropométricos de trabajadores colombianos. PALABRAS CLAVES: Análisis discriminante no métrico, regresión logística multinomial Nombre del trabajo: Crecimiento del Activo Productivo con Base en la Calidad de Cartera Óptima: Evaluación de una Compañía de Leasing Mediante Series de Tiempo no Lineales Presentado por: Isabel Cristina Zuluaga Garces RESUMEN Modelación de un modelo que permita establecer las proyecciones de crecimiento de una Compañía a través de Modelos autorregresivos con umbral que permiten establecer un modelo diferente según las condiciones de mercado o las esperadas por la Compañía de Leasing con el fin de mantener unos buenos indicadores de cartera y crecer sostenidamente, PALABRAS CLAVES: SETAR, TAR, Crecimiento, Calidad de Cartera, Modelación, Umbral Nombre del trabajo: Efecto en las Estimaciones bajo Distintas Formas Distribucionales del Término Aleatorio en un Modelo Lineal Adaptado a una Cadena de Markov con Espacio de Estados Ordinales Presentado por: Roger Jesús Tovar Falón RESUMEN Los modelos lineales mixtos pueden ser utilizados conjuntamente con la teoría de procesos estocásticos usando cadenas de Markov de estados múltiples para modelar datos provenientes de estudios longitudinales, teniendo en cuenta posibles fuentes de variabilidad que se pueden presentar entre sujetos y dentro de los sujetos. En este trabajo se estudia una metodología para estimar los efectos de las covariables en un modelo lineal mixto con intercepto aleatorio y respuesta policótoma categórica ordinal, bajo distintas especificaciones distribucionales de dicho efecto aleatorio. Esta metodología constituye una extensión de la propuesta hecha por Salazar, Schmitt, Yu, Mendiondo & Kryscio (2007). En este trabajo se considera una cadena de Markov de k + 2 estados con dos estados absorbentes que compiten entre sí y k estados transitorios, se deriva matemáticamente la función de verosimilitud de los datos y se obtienen, por medio de un estudio de simulación, las estimaciones de los efectos de las covariables sobre las distintas transiciones, cuando el proceso puede ser visto como un modelo de regresión logística policótoma con efectos aleatorios y respuesta categórica ordinal. La maximización de la función de verosimilitud se lleva a cabo numéricamente utilizando el método de la cuadratura de Gauss y el algoritmo de Newton-Raphson (ver Abramowitz & Stegun (1972)). Finalmente, se ilustra la metodología usando datos reales, sobre los promedios acumulados de una muestra de estudiantes de la Universidad Nacional de Colombia, Sede Medellín. PALABRAS CLAVES: Datos longitudinales, modelos de estados múltiples, cadenas de Markov, regresión logística policótoma, cuadratura de Gauss Nombre del trabajo: Distribución Predictiva Bayesiana para Modelos de Pruebas de Vida MCMC Presentado por: Carlos Javier Barrera Causil RESUMEN En este trabajo se presenta un estudio de comparación entre las técnicas de clasificación análisis discriminante no métrico, regresión logística multinomial; adicionalmente, se considera la técnica tradicional análisis discriminante lineal ya que la función de clasificación de ésta sirve como punto de partida para análisis discriminante no métrico. Los escenarios bajo los cuales se llevó a cabo el estudio fueron los siguientes: tres grupos distribuidos normal bivariado con matrices de varianza y covarianza iguales y diferentes, siete grupos distribuidos normal con tres variables y matrices de varianza y covarianza diferentes, tres grupos distribuidos Logitnormal, Lognormal y Sinh-1-normal con dos variables. Los desempeños de las técnicas fueron medidos con la tasa de clasificación errónea. Las técnicas de Regresión Logística Multinomial y Análisis Discriminante Lineal obtuvieron tasas de clasificación errónea muy similares en todo el estudio e inferiores que Análisis Discriminante no Métrico. Se construyeron funciones en el programa R para implementar el algoritmo propuesto por Choulakian y Almhana (2001) para técnica Análisis Discriminante no Métrico. Se llevó a cabo una aplicación de las tres técnicas utilizando una base de datos real sobre datos antropométricos de trabajadores colombianos. PALABRAS CLAVES: Análisis discriminante no métrico, regresión logística multinomial. Nombre del trabajo: Robustez de un Modelo de Markov de Tres Estados Bajo Distintas Especificaciones Distribucionales de los Tiempos de Transición Presentado por: Armando Baena Zapata RESUMEN Los modelos de Markov de estados múltiples resultan de gran utilidad y aplicación en diferentes campos de la investigación dado que la estructura de dependencia de las observaciones longitudinales es simple. Estos modelos se basan en el supuesto de que la función de probabilidad del tiempo de transición es la Exponencial. Bajo este supuesto, la estimación de las funciones de intensidad es más sencilla dado que corresponden al parámetro de la distribución exponencial de la respectiva transición, luego, las intensidades no dependen del tiempo ya que el parámetro es una constante. La importancia de las funciones de intensidad se debe a que éstas proporcionan valiosa información sobre el riesgo inmediato o instantáneo de pasar de un estado i a un estado j, donde i y j pertenecen a cierto conjunto de índices, lo cual es de gran interés y utilidad en el estudio del riesgo en diversos fenómenos. Sin embargo, al tratarse de una variable aleatoria, la distribución del tiempo podría ser Gamma, Weibull, Pareto, Lognormal o cualquier otra distribución asociada a variables aleatorias positivas, y de esta manera la estimación de dichas intensidades sería mucho más compleja ya que éstas quedarían dependiendo del tiempo. PALABRAS CLAVES: Procesos de Markov, Riesgo, Funciones de Intensidad, Análisis de Supervivencia, Artritis Reumatoide. Nombre del trabajo: Estimación en los Modelos Setar con Base en Métodos de Momentos Generalizados Presentado por: Lucinia Rojas Peña
Nombre del trabajo: Comparación de 4 Procedimientos FDR para la Selección de Parámetros en Regresión Poisson Presentado por: Jorge Iván Vélez Valbuena RESUMEN En este trabajo se comparan, vía simulación, 4 procedimientos basados en la Tasa de Falsos Descubrimientos o False Discovery Rate (FDR) de Benjamini & Hochberg (1995), descritos en Nguyen (2005), para la selección de parámetros en Regresión Poisson. El desempeño de cada uno de los 4 procedimientos, así como el de los procedimientos t y Bonferroni, también evaluados, se determinó a través de la tasa de rechazos medida como el porcentaje de veces que, en el total de simulaciones realizadas para cada escenario, el coeficiente de regresión fue considerado estadísticamente diferente de cero para un nivel nominal a = 0.05. Se construyeron funciones en R (R Development Core Team, 2007) para la comparación de los procedimientos y la presentación gráfica de los resultados y se realizaron varias aplicaciones de los procedimientos evaluados que incluyen: (i) el modelamiento de la tasa de menores de edad con hijos nacidos vivos en el Departamento de Antioquia a partir de información del Anuario Estadístico de Antioquia – 1993, (ii) la selección de coeficientes de correlación y (iii) la determinación de genes diferencialmente expresados (Golub et al., 1999). En estas aplicaciones se encontró que, en general, los procedimientos basados en la FDR tienen un mejor desempeño que el procedimiento basado en la prueba t. Finalmente se recomienda utilizar el procedimiento t para la selección de parámetros significativos en Regresión Poisson cuando el número de variables regresoras sea menor o igual a 2, y los procedimientos FDR de Benjamini & Hochberg (1995) y menos conservador (o Least PALABRAS CLAVES: Comparaciones Múltiples, False Discovery Rate (FDR), Modelo Lineal Generalizado, Regresión Poisson Nombre del trabajo: Generalización de un Algoritmo de Individualización de la Dosis de Droga usando un Modelo Lineal Mixto Presentado por: Miladys Rocío Cogollo RESUMEN En esta tesis se estudian las propiedades matemáticas y estadísticas de un algoritmo de individualización de la dosis de una droga, cuando el logaritmo de la concentración plasmática de la droga se describe a través de un modelo lineal con covariables que tienen efectos aleatorios. El modelo usa el logaritmo de la dosis como una covariable. Este algoritmo constituye una generalización de un algoritmo propuesto por Díaz et al.(2007), el cual asume que no hay covariables con efectos aleatorios y que solo hay un intercepto aleatorio. Se generalizan los teoremas de Díaz et al., los cuales permiten obtener dosis óptimas, un estimador óptimo de los efectos aleatorios, y el mínimo número de pasos necesarios en el algoritmo generalizado para alcanzar la dosificación óptima. PALABRAS CLAVES:Modelo Lineal Mixto, Individualización de la dosis de una droga, Mezcla de distribuciones, Clozapina Nombre del trabajo: Control Multivariado de Procesos con Variables Binomiales Bivariadas Presentado por: Carolina Ospina Hincapié RESUMEN Muchos procesos industriales son de naturaleza multivariada dado que la calidad de un producto depende de más de una variable. El control multivariado de procesos captura la relación en las variables asociadas al proceso , si se ignora esta correñaco+pm y se utilizan gráficos de control univariados para cada variable por separado se puede concluir erróneamente acerca del estado del proceso. En variables continuas correlacionadas se han realizado muchas investigaciones, sin embargo, se envuentran pocos trabajos que traten sobre atributos correlacionados. En este trabajo se comparan tres cartas de control para variables aleatorias binomiales bivariadas, correlacionadas entre sí, las cuales miden atributos, las cartas son: la carta T2 de Hotelling basada en la aproximación de la distribución binomial multivariada a la distribución normal. La carta MNP la cual es una extensión np univariadad, y la carta r que es una metodología no paramétrica basada en el índice de profundidad de Mahalanobis. La comparación se hace vía similitud utilizando como medida de comparación , la longitud promedio de racha (ARL). De los resultados se aprecia, en términos generlaes que la carta MNP es la mejor tanto en control como fuera de control. Nombre del trabajo: Clasificación Jerárquica de Objetos a Partir de Experimentos de Comparaciones Pareadas. Presentado por: Iris Viloria Salazar RESUMEN En muchas situaciones se hace necesario ordenar un conjunto de objetos de acuerdo con ciertas caracaterísticas de común que no pueden ser medidas en alguna escala de medición numérica, a partir de la evaluación subjetiva de personas expertas. Bradley & Terry (1952) propuesieron un modelo para ordenar las preferencias de un número de jueces a partir de comparaciones pares de objetos evaluadas por dichos jueces. Diferentes extensiones a este modelo han sido presentadas posteriormente en la literatura: En este trabajo se presenta una nueva metodología para la clasificación jerárquica de objetos a partir de comparaciones pareadas realizadas entre los objetos por varios jueces o expertos. A diferencia de las metodologías existentes, en las que el proceso de comparación entre los objetos se lleva a cabo efectuando todas las comparaciones posibles de dos en dos, en esta nueva metodología el proceso de comparación se realiza evaluando cad aobjeto de cierta permutación únicamente con el inmediatamente anterior. Una extensa revisión bibliográfica sobre las diferentes aproximaciones existentes en la literatura para la clasificación jerárquica u ordenamiento de objetos a partir de experimentos de comparaciones pareadas, el desarrollo analítico de un nuevo estimador y del error estándar asociado y un estudio de simulación para comparar la clasificación jerárquica de los objetos resultante al aplicar el estimador obtenido analíticamnete con los resultados obtenidos al aplicar el modelo propueso por Bradley & Terry (1952) son presentados. La nueva propuesta presenta ventajas sobre la metodología Bradley-Terry en cuanto al número de comparaciones a realizar, en la nueva propuesta el número de comparaciones a realizar es mucho menor , lo que reduce el posible sesgo por fatiga de los jueces y hace más bajo el costo de experimentación. PALABRAS CLAVES: Clasificación jerárquica, Modelos Bradley-Terry, Ranking, Comparaciones Pareadas, Ordenamiento. Nombre del trabajo: Estimación de un Modelo de Difusión con Saltos con Distribución de Error Generalizada asimétrica Usando Algoritmos Evolutivos Presentado por: Juan David Ospina Arango RESUMEN En este trabajo se considera el problema de estimar los parámetros de un proceso de difusión con saltos (jump-diffusion) donde la magnitud de los saltos se asume dada por una variable aleatoria que se distribuye bajo la distribución de error generalizada asimétrica (SGED). Se aproxima la densidad de los rendimientos del proceso utilizando la aproximación Bernoulli-Poisson y recurriendo a la transformada rápida de Fourier (FFT). Con la densidad aproximada se encuentra, vía máxima verosímilitud, los parámetros del proceso usando varias técnicas de optimización para encontrar el óptimo de la log-verosimilitud, entre las cuales el mejor desempeño lo brinda la Evolución Diferencial (DE). PALABRAS CLAVES: Procesos de Difusión con Saltos, distribución de error generalizada asimétrica, transformada rápida de Fourier, máxima verosimilitud, evolución diferencial. Nombre del trabajo: Comparación de Árboles de Regresión y Clsificación y Regresión Logística Presentado por: Sandra Carolina Serna Pineda RESUMEN El problema de la clasificación de individuos u objetos en grupos o poblaciones conocidas es de gran interés en estadística, por esta razón se han desarrollado varias técnicas para cumplir este proposito. En este trabajo se presenta la comparación, mediante simulación Monte Carlo, de dos técnicas estadísticas de clasificación: Árboles de Regresión y Clasificación ( CART) y Regresión Logística. El comportamiento de las técnicas fue medido con la Tasa de Mala Clasificación (TMC). En general, la Regresión Logística presentó una Tasa de Mala Clasificación más baja que los Árboles de Clasificación. Se presenta una aplicación a la Encuesta de Innovación y Desarrollo Tecnológico, utilizando las técnicas estudiadas, para contribuir a un mejor conocimiento del sistema nacional de innovación en Colombia PALABRAS CLAVES: Clasificación CART: Árboles de clasificación y Regresión, Regresión Logística, Simulación, Tasa de mala clasificación. Nombre del trabajo: Prueba de Levene Multivariada para la Comparación de Matrices de Covarianza en Presencia de Datos Faltantes Presentado por: Mario José Pacheco López RESUMEN El método para comparar matrices de covarianzas más citado en la literatura es la prueba de Bartlett, la cual es una prueba de razón de verosimilitud modicada, pero esta prueba es sensible a violaciones del supuesto de normalidad multivariada. Otro procedimiento para la comparación de matrices. Otro procedimiento para la comparación de matrices de covarianzas es la extensión, la cual consiste en dos generalizaciones multivariadas para la homogeneidad de varianzas; estas son robustas a desviaciones del supuesto de normalidad, con la ventaja adicional de la simplicidad computacional inducida por el procedimiento univariado de prueba. En el siguiente trabajo se examina el comportamiento de la prueba de Levene multivariada en presencia de datos faltantes; un estudio de simulación es llevado a cabo para evaluar el comportamiento en comparación a la prueba de razón de verosimilitud modicada en términos de los niveles de significancia nominal y real. Se encuentra que la prueba de Levene tiene un buen comportamiento para los datos normales y no normales en muestras pequeñas y grandes, como en la presencia de datos faltantes. PALABRAS CLAVES: Datos faltantes, Pruebas de homogeneidad de matrices de covarianzas; Prueva de Levene, Prueba de razón de verosimilitud.
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Juan Carlos Salazar Uribe, Ph.D
Juan Carlos Correa Morales, Ph.D
Sergio Yáñez Canal, M.Sc
Nelfi G. González Álvarez, M.Sc
Mario César Jaramillo Elorza, M.Sc
Carlos Mario Lopera Gómez, M.Sc
Raúl Alberto Pérez Agámez, M.Sc
Elkin Castaño Vélez M.Sc
René Iral Palomino M. Sc
Isabel Cristina Ramírez Guevara M. Sc
Jaime A. Londoño Londoño Ph.D
Francisco Castrillón
Luis Alfonso Vélez
José de León Molina, M.D. University of Kentucky