SS_Logo

Investigación en Salud con apoyo de Stata: Análisis estratificado y regresión logística

Autor: Dr. José William Martínez / Portafolio: Quantitative / Vie. 25 de Ago de 2023

Transcripción de este video

00:00:45:18 Somos un equipo autogestionado, responsable, proactivo y autónomo, con gran compromiso social, aportando el pensamiento científico y el desarrollo latinoamericano, promoviendo el uso de software para investigación en todas las áreas del conocimiento. Generamos contenido de alta calidad teniendo en cuenta las distintas necesidades del mercado. Realizamos actividades gratuitas constantemente. Abordamos temáticas vigentes, aplicaciones especializadas y elementos metodológicos que te permiten interactuar y generar redes para la difusión de tus proyectos.

00:01:13:05 Contamos con servicio de asesoría, consultoría y acompañamiento personalizado, certificaciones internacionales, entrenamientos especializados y talleres prácticos. Nuestro principal objetivo es promover el uso de tecnología en el campo investigativo, generando un impacto significativo en la región y de esta forma contribuir a la creación de comunidad para compartir conocimiento.

00:02:02:06 Te invitamos a ser parte de este gran equipo Software Shop. Visita nuestra página web y conoce nuestros servicios Software Shop, la empresa líder en la implementación de herramientas analíticas y software especializado en Latinoamérica, les da la bienvenida a esta presentación. El día de hoy contamos con el acompañamiento del instructor doctor José William Martínez, Médico Doctor en Epidemiología, Académico de la Universidad Tecnológica de Pereira, epidemiólogo de oncólogos de Occidente, Miembro de la Sala de Análisis de Riesgo de la Secretaría Departamental de Salud de Risaralda, tutor del FED en el Instituto Nacional de Salud, con más de 20 años de experiencia en temas de investigación, de análisis de riesgo para enfermedades de interés en salud pública, evaluación

00:02:41:21 de pruebas diagnósticas e intervenciones comunitarias. Bienvenidos. Bueno, vamos a a comenzar. Primero vamos a hacer una presentación teórica para poder nosotros tener un mayor y una mayor aplicación de todo lo que esta atando nos brinda. Entonces es importante sobre todo en estudios observacionales cuando estamos hablando de estudios, por ejemplo, descriptivo de casos y controles. Estudios de caso, cortes o estudios híbridos en nosotros.

00:03:23:11 No, no seleccionamos los sujetos de investigación, ves que entran a esos. Esos estudios generalmente cumplen los criterios de inclusión muy general, pero no son tan selectivos como sí suceden en los ensayos clínicos, donde todos los computadores quedan totalmente ajustados desde el inicio del estudio, de tal manera que todos los estudios que nosotros tenemos y ya desde los observacionales o dan los datos de la vida real, pues vamos, vamos, van a tener que identificar variables de conducción.

00:03:53:05 Entonces miremos que seis es una variable de confusión, es una variable que tiene una relación con el desenlace, puede estar asociada o no con la exposición, pero no es en esos momentos nuestra exposición principal, No es en estos momentos la variable que nosotros queremos evaluar en función del desenlace. Me explico se muere un niño menor de un año.

00:04:33:16 Nosotros estamos evaluando el programa de de de control de la diarrea de la enfermedad rica aguda. Entonces es para nosotros es importante saber si el niño muere por diarrea, si la muerte infantil es asociada a la enfermedad renal aguda. Pero hay otras variables que están asociadas a la mortalidad infantil, como la prestación de servicios de salud, como por ejemplo la pobreza y con todas sus expresiones sociodemográficas, escolaridad, ocupación y otras anomalías congénitas.

00:05:20:09 Y bueno, en su en sí, la mortalidad infantil se explica por muchas variables, o sea, en la mortalidad infantil es un fenómeno multicausal, pero nosotros en los estudios generalmente elegimos una variable como disposición de las otras variables en que se están evaluando, pues ellas también están asociadas al desenlace. Por eso esa las vamos a llamar con dos horas, o sea, la con la consultora ahora es una variable que está asociada al desenlace, es parte del modelo multicausal de nuestro desenlace, pero no es en ese momentos la variable exposición que hemos definido nosotros para poder estudiar el fenómeno que nos interesa.

00:05:59:03 Entonces, la confusión no es un sesgo, la confusión es algo real, pero ella nos puede afectar. La variable como computadora, nos puede afectar la relación entre la exposición en el desenlace. Veamos estos ejemplos Aquí tenemos en una supuestas tasas de mortalidad bruta o tasas de mortalidad general en seis países de las Américas en un tiempo equis. Nos dicen que la tasa de mortalidad general de Costa Rica es de 3,8 por mil de Venezuela de 4.4 por mil, de mil o 4.9 por mil, de seis.

00:06:27:18 De Cuba, 6.7 por mil de Canadá, 7.3 por mil y 8,7 por miles para Estados Unidos es. Estas tasas generales votación bruta generalmente expresan cuál es el nivel de desarrollo social económico de un país. ¿De la pregunta sería con esas tasas reales de mortalidad general o tasas brutas de mortalidad general, cuál sería el país de mayor nivel de desarrollo social y económico?

00:06:59:09 Es uno. Al preguntar, pues uno diría pues el que tiene menor, menor tasa de bruta o menor tasa de mortalidad general es el de mayor nivel de desarrollo social. Económico es. Tendríamos que pensar que sería Costa Rica porque tiene la menor tasa y estaría por encima a nivel social, económico, de Canadá, Estados Unidos o Venezuela estaría por encima de escala de Estados Unidos o México, Colombia si estuviera allí.

00:07:29:16 Entonces lo que estamos viendo es un no ya 1,1 contrasentido. No es real que los países de América Latina tengan un mayor nivel de desarrollo social económico comparados con Canadá, Estados Unidos. Es que lo que sucede, lo que sucede es que estas tasas son reales, pero no son comparan antes. Para poderlas comparar hay que ajustarlas y veamos qué sucede cuando las ajustamos.

00:08:01:07 Al ajustar las tasas, nosotros pusimos en igualdad de condiciones a esos países y el aplicar esas tasas. Si podemos observar que lo que me está diciendo es que Canadá tendría una menor tasa de mortalidad ajustada y Estados Unidos tiene una tasa menor de mortalidad general ajustada y esos países tendrían un nivel de desarrollo social económico por encima del de América Latina.

00:08:45:16 Entonces, este es un ejemplo de el efecto del distribución es una variable emisora y puede afectar a la asociación entre la exposición y el desenlace y puede aumentar la fuerza. Asociación puede debilitarla, la puede anular. Es importante que nosotros, en producto de un estudio variado, no saquemos conclusiones inmediatas. Si estamos trabajando con datos de la guerra edad, si estamos trabajando con estudios descriptivos, con estudios de casos sin controles o con estudios de 4.º auxilios mixtos, porque estos estudios van a tener conclusiones.

00:09:21:15 Es el vivo variado. El análisis variado no es suficiente cuando tenemos nosotros una cantidad variable de conclusión para poder evaluar es, repito, la variable confusa hora se asocia causalmente con el desenlace. Es parte de la multicausal y del desenlace y puede estar o no asociada con la exposición. Otra regla acá la variable confuso ahora no es un intermediario entre el camino o la ruta que da la exposición hasta llegar al desenlace.

00:09:53:04 La variable confusión es otra, corresponden a otra ruta causal. Es aquí lo tenemos. La exposición que está asociada al desenlace y la variable confuso ahora está asociada al desenlace yen la variable confuso ahora se puede estar o no asociada a la exposición. Entonces lo que vimos ahorita el país puede estar asociado a la mortalidad, pero la distribución etaria de cada país puede estar asociada a la mortalidad.

00:10:35:01 También de eso era real que las tasas de mortalidad generales son más altas. En Canadá y en Estados Unidos porque real, porque son poblaciones más adultas comparadas con las poblaciones de América Latina, que generalmente son más jóvenes. Entonces, esa distribución por el grupo de edad nos confunde. La relación para mortalidad es. En este modelo estamos diciendo que la actividad sexual está asociada a la mortalidad, pero hay otra variable que también está asociada a la mortalidad el estado de salud general.

00:11:17:17 Entonces uno debería decir que la actividad sexual está asociada a la mortalidad, cuando justo por la condición de salud general, porque no puede. Entonces, en el análisis de variado no esta relación activa sexual y mortalidad se puede ver afectada porque no hemos metido en el modelo una tercera variable. En ese caso la condición de salud general. En este otro modelo la actividad sexual genera una segunda condición de salud general mejor y la condición de salud general mejor puede disminuir la mortalidad.

00:12:00:18 Aquí, en este modelo, no vemos como sólo porque la exposición a actividad sexual y para expresar su mortalidad genera un intermediario que es la condición de salud general. Pues aquí no hay un concurso, lo mismo que aquí de la obesidad puedes generar hipertensión y la hipertensión genera la mortalidad. Aquí no hay un conductor, lo mismo que acá el sin la madre en la gestación fuma y eso genera bajo peso al nacer y el bajo peso al nacer genera muerte perinatal en ese modelo incluso.

00:12:46:08 Pero si encuentro un artículo que me dice que el tabaco en es felicidad o sea, el tabaco genera muerte experimental directamente en las mujeres en durante su gestación. Bueno, entonces aquí sí tendríamos un concurso. El tabaco genera muerte perinatal, pero debemos ajustar esta relación al bajo peso al nacer. Bueno, eso en cuanto a confusión. Cuando no hay confusión o se descarta la confusión, debemos ver la interacción en la interacción tiene que ver que los efectos sean heterogéneos, o sea, ya descartamos que la haya.

00:13:23:09 Confusión no hay, no está corte. Hemos concluido que no está confundida la relación entre discusión. El desenlace es esa tercer variable. Bueno, generarnos confusión, pero sí generarnos interacción. Y esa interacción se define, se expresa como heterogeneidad de los efectos. Entonces aquí lo que se define es de dos o más factores de riesgo puede modificar el efecto y que cada cual tiene un efecto sobre la ocurrencia como en el des de desenlace.

00:13:53:11 En variables dicotómicas la interacción va a tener un efecto entre la exposición y el desenlace y puede. Ese modificador del efecto puede inducir, aumentar o disminuir las fuerzas de asociación. Por eso tenemos interacción positiva e interacción negativa. Es decir, la presencia del efecto modificador acentúa el efecto. La exposición de interés, entonces tenemos que hay un sinergismo interacción positiva.

00:14:27:21 Si esa presencia de esa variable disminuye la fuerza de asociación, eso puede ser pues genera un antagonismo y se ve en interacción negativo. Las interacciones positivas pueden ser y negativas son muy peligrosas, sobre todo cuando tengo fuerza de asociación de intereses en por un fenómeno de interacción con positivo, yo puedo reportar una variable como factor de riesgo cuando ella es factor protector.

00:15:01:01 Al comprar una escena, mi interacción negativo puede hacer que yo reporte como factor protector algo que genera un factor de riesgo. Entonces ese fenómeno es bastante importante porque necesitamos también evaluarlo y observarlo paso a paso. Entonces aquí tenemos e Vamos a estudiar tres factores el factor de A, el desenlace G Y hay un tercer factor Z, que es el que nos va a modificar el efecto.

00:15:35:13 Entonces vamos a ver ejemplos entre ellos la interacción. Entonces, repito, se define como está basada en la heterogeneidad de los efectos. Si los efectos son homogéneos, las fuerzas de asociación son homogéneas, no habría interacción. Si las fuerzas de asociación son heterogéneas, son diferentes, entonces ahí podríamos nosotros evaluar la interacción y básicamente entonces tendríamos que comparar la relación del factor de riesgo a en función del desenlace.

00:16:03:11 En la presencia y ausencia del test de la tercer variable z para poder evaluar si se presenta una interacción y cómo se presenta esa interacción. Es ahí como vamos a medir esto. Esto se puede medir en función del riesgo atribuible y tendríamos nosotros el modelo aditivo, o sea, la interacción se evalúa, es en función de qué pasa con la fuerza asociación.

00:16:35:08 Si mi fuerza sus acciones son de cuatro w, estamos en el marco del modelo argentino. Si nuestra fuerza de asociación es un riesgo relativo y por lo general estamos en algo multiplicativo de recuerdo, primero llevado al bar, si hay asociación entre el factor de riesgo y el desenlace, después de que encuentra esa asociación, yo debo evaluar sesgos y si no hay sesgos, defino que mi asociación es válida.

00:17:08:09 Si no hay confusión, entonces puedo evaluar si la presencia, el fenómeno en presencia. Una tercer variable tiene unas fuerzas de asociación homogéneas, entonces no hay interacción. Si las bases de esa asociación sean heterónimos, habría interacción. Pero vamos a ver un ejemplo la interacción auditiva es aquí tengo las tres, tengo el desenlace que lo estamos evaluando en tasa de incidencia y tenemos la fuerza asociación, un riesgo atribuible.

00:17:37:02 Por eso vamos a evaluar una interacción y modelo auditivo. Entonces la variable que vamos a evaluar sí nos genera interacción, se llama Z, entonces vamos a evaluar el fenómeno en ausencia de Z es la fuerza. La tasa de incidencia del fenómeno es la ausencia de Z idea es igual a diez por medio x cuando está presente A Y estamos en DZ, la tasa de incidentes es 20.

00:18:08:18 Entonces al evaluar el riesgo de incidencia después 20 menos incidencia en expuesto puesto diez. El riesgo atribuibles es Ahora vamos a ver qué sucede con el fenómeno en presencia de Z. Y está presente el fenómeno Z y está ausente A la edad. La tasa de incidencia es 30. Ahí está presente los dos. La tasa. En cuanto a la incidencia, cuando está presente aquí está presente Z es 40.

00:18:45:20 Entonces las esas son las tasas de incidencia. La tasa de incidencia quienes puestos es 40. Le resto la tasa incidencia en las fuerzas es 30 y me va diez. De ello concluiría que como lo son los riesgos, las fuerzas de asociación son homogéneas. Entonces aquí no se presenta una interacción o la variable z. Veamos en el triunfo en otro momento la el fenómeno en presente, en ausencia de la incidencia, etcétera, nos da una tasa de incidencia que es de cinco por mil.

00:19:23:11 Cuando está presente A y está ausente Z, la tasa S es diez. El riesgo atribuible entonces incidencia en expuestos menos incidencia en respuestas es igual a cinco. Cuando tenemos el efecto solo de Z en ausencia ya la incidencia del fenómeno es diez y la incidencia en el en el la expresión conjunta de z la tasa ahí si se estren, entonces vamos a calcular el riesgo atribuible Tasa de incidencia en expuestos 30 menos tasa de incidencia en estos días.

00:19:55:10 El riesgo es ven claramente vemos que en presencia de Z tenemos un riesgo atribuible diferente cuando está cuando está ausente Z cuando está ausente Z la la doble es cinco y el riesgo atribuible en presencia de Z el del otro en ese ambiente es. Aquí claramente vemos una heterogeneidad en la fuerza asociación. Eso se llama una interacción positiva.

00:20:32:02 La interacción también se puede valer en el modelo multiplicativo. Ya sabemos, vamos a verlo en la tasa de incidencia en ausencia de Z y es igual a diez la tasa de incidencia en presencia de incidencia 20. Como es un riesgo relativo. La incidencia después 20 la divido sobre la incidencia en expuestos diez es igual a dos. Vamos a ver qué sucede cuando con el riesgo relativo, cuando está presente Z se aparecen de Z está ausente a la c s 25 y el efecto conjunto de Z y de A en la 100.

00:21:11:04 El desenlace que se encuentra al calcular la incidencia en la presencia de Z tenemos incidencia en expuesto 50. Viéndose incidencia respuesta de 25. El riesgo relativo es dos. Claramente aquí no hay interacción en el modelo multiplicativo en el En este otro ejemplo la presencia es la incidencia. En ausencia de ese diez. La incidencia en presencia de ausente z el 20 desde relativo es dos y en la presencia de Z se observen a la incidencia 25 y el efecto conjunto de la idea 66 de 125.

00:21:51:07 Para tener un riesgo relativo de cinco. Donde podemos ver que las sucesiones son heterogéneas. Podemos decir que hay una interacción multiplicativo. Bueno para el análisis muy variado a veces. A veces estos análisis es Este es lo que llamamos estratégica lo que hemos visto. Pero a veces en los análisis estratificado, perdón, son exigentes en tamaño de muestra, entonces no podemos hacer bien eso, porque si nos dan un denominador cero eso, no vamos a evaluar el riesgo relativo, no vamos a poder tener esas, pues ese es un calculada.

00:22:24:01 Entonces el análisis multi variado es una, es una metodología también llena de datos que es muy eficiente, es muy eficiente porque puede puedo encontrar confuso ores y términos de interacción cuando e cuando tengo unos tamaños de muestra más pequeños. ¿Entonces, y cómo se hace el adalid multi variado? Por lo general tengo un una matriz x ui. O sea, tengo varias variables explicativas.

00:22:56:22 Sí, sí, sí y es igual A33. Tengo X1X2X3 y tengo una variable es enlace de su hijo. Generalmente queremos evaluar cuál es la expresión de ellas. Fui dado X, fui y pues en forma general, cuando las variables son cuantitativas el desenlace es cuantitativo. Entonces Jesús y de cumplir un supuesto se destruye normal con una media sui mitsui y una varianza sigma para.

00:23:29:11 Observen que en cuando la varianza sigma cuadrado no tiene el subíndice y o sea eso quiere decir que las varianzas tienen que ser las mismas para cualquier valor de un sub y eso se llama como se actividad de varianzas y debe ser un supuesto a cumplir para por ejemplo, hacer una regresión múltiple en y en forma general, pues entonces e en yeso n va a distribuirse normal una media Musso n y no varía.

00:24:05:18 Se afirma cuadrar. Eso es lo que deben cumplir y es su in para hacer un modelo de regresión múltiple. ¿Y por ejemplo, cómo se calculan entonces que se hace artículo? Aquí no calculamos el valor de regresión. ¿Por ejemplo, no calculamos fuerzas de asociación, pero calculamos las vetas de es cómo calcular los betas? Básicamente lo que se hace es esta función que tenemos allí, como la es la matriz X-Wing y lo que es fila.

00:25:06:07 Luego el pool columnas, lo que es columna, luego el confirmes que DS que generó una traspuesta es la matriz traspuesta y la matriz traspuesta es eso y nosotros cogimos e estoy en ella. Aquí tenemos esta X traspuesta esta x traspuesta es es. No es la matriz X-Wing, o sea el punto de variables independientes y las tres ponemos quiere decir que lo quiera y la cual volvemos solamente lo que es columna pero sin esa matriz traspuesta la multiplicamos por la matriz X-Wing que es nuestra materia matriz de trabajo es eso se hace para poder tener una condición de las matrices que deben ser cuadradas.

00:25:33:18 Las matrices cuadradas son las matrices cuyo número de filas es igual al número de columnas. Entonces esto se hace de esta manera cuando ya es el producto X Respuesta por X le puedo sacar la inversa. No puedo sacar de la inversa una matriz que no es cuadrada de es a esta inversa la multiplicamos por la x traspuesta y por el vector columna g.

00:26:02:21 ¿Ese sería el vector columna g donde están todas los desenlaces? Aquí tenemos la x e que es transpuesta y cuando calculamos todo esto nos da el vector columna de vectores donde el primer vector corresponde al beta cero. El segundo vector corresponde a la primer variable independiente x fin en el segundo. En el segundo beta corresponde al beta de la segunda variable que subía.

00:26:39:23 Si vamos hasta que obtengamos el total de vector, entonces E. De esa manera, entre otros, podemos calcular cuánto es el desenlace en función de que cada x sube y se multiplica por el vector en beta y ahí puede estar asociado un épsilon, que es un residual. Bueno, nosotros usamos más en Ciencias de la salud las redes físicas, porque la realización en logísticas en nosotros son como este tipo Un paciente hospitalizado se muere durante del alta.

00:27:11:01 Un paciente operado se infectó del posoperatorio. Un sujeto que sufre un accidente de tránsito se sea hospitalizado, no un adolescente tiene o no una tentativa de suicidio. Una mamá dejará de lactar o no a su bebé. Una semilla germina, no germina. El campo de la biología, una mutación se expresa, no se expresa. Como pueden ver todas o si o no los Los desenlaces están en nuestros desenlaces cuando son categóricos o solo no sinceros.

00:27:46:14 Uno. Si se expresa cero se nos expresa. Entonces usamos más y más. Sencillamente la reversión física es Veamos un poquito el problema que no resume la agresión física el infarto o la enfermedad coronaria. En nuestro desenlaces queremos evaluar cuán como es la relación entre cigarrillo y el desenlace infarto, Pero tenemos una matriz, unas variables para un para controlar su función que esta relación cigarrillo infarto también está asociada a la edad, la hipertensión a la edad, el infarto está asociada a la.

00:28:24:13 En el infarto está asociada al sexo. O sea, al tener una asociación edad significa en un variado y variado asociado cigarrillo, edad y raza y en cada sexo infarto. Pero decir exposiciones fumar es quiere decir que yo no puedo concluir que el fumar está asociado antes de las infarto tienen base en el variado. Debo ajustar todas estas variables que me asociadas en el vivo variado y les voy a mostrar en un modelo multi variado el regresión logística.

00:28:52:23 Entonces el modelo de regresión logística yo puedo meter la exposición y cada uno de los profesores y ahí sigo y observar como es la fuerza asociación de la exposición con el desenlace. Cuando ajusto por precios conclusiones en las variables independientes. Ahí tengo la exposición y tengo los conclusiones. Y puede ser que algunos computadores sean combinaciones entre variables independientes.

00:29:16:02 Es decir, yo puedo tener una exposición X1, puede ser mi exposición x unos, puede ser un computador, una x y tres como ser dos x. Un cuatro puede ser la interacción entre la exposición y el conjunto 1X5 puede ser la interacción entre comenzar una y el consumo dos y x seis puede ser una expresión de la exposición en forma de potencia.

00:29:53:20 Entonces la regresión logística es bastante útil para nosotros porque ella tiene esta función e sigue esta función e esa función que la función lógica. La función lógica entonces me va a tener este comportamiento en el menos infinito. La función lógica tiende a cero, en el más infinito, la función lógica aún. ¿Y entonces lo que nosotros necesitamos saber esa función login Qué probabilidad asociada puede tener?

00:30:23:16 Porque como ya tiene como límites el cero y uno, entonces puede derivar de esa función lógica algo como la probabilidad es esa probabilidad está en función de como se expresa Z. Si Z tiene un valor muy pequeño, usted tendrá un uno tendrá un valor cercano a cero. Si se va incrementando entre seis, el tenderá a un valor de uno.

00:31:00:07 Pero observen que la velocidad del incremento no es nueve se ve afectada por algunos cambios. Es aquí tenemos un cambio en la velocidad, se incrementa ostensiblemente y después vuelve y se cambia y se va atenuando. La velocidad de cambio es que z z es esta expresión el beta por la primer variable, el beta o la segunda variable el beta k por la variable k y tiene asociado un otro beta que es el alfa o constante o beta.

00:31:33:14 ¿Sería entonces como calculo la entrada función lógica uno sobre una máscara cena y que es la receta? ¿Es el mirar cuánto me dio el beta cero? Cuánto me da el beta de la primer variable por el valor de la variable, el papel, el beta dos por la variable x dos. El beta calcula variable x k. Desde nosotros haciendo esta función vamos a obtener una probabilidad de básicamente con el modelo los físicos.

00:32:12:08 Nosotros vamos a tener que identificar estos parámetros. ¿Cuánto vale alfa? ¿Hay cero y cuánto vale beta para cada variable? Cuánto vale beta sub y para acá hay que subir. Esos parámetros son desconocidos y deben ser calculados y se hacen una regresión logística. Es importante. Cuando tenemos una regresión logística tenemos que tener en cuenta que hay variables donde por ejemplo, hemos definido nosotros que el grupo sanguíneo es el grupo sanguíneo, el dos, el grupo sanguíneo a este el grupo sanguíneo o es cuatro.

00:32:37:18 Esta variable no la podemos meter en las multi variadas, porque esta variable realmente es para el para el programa para estatal cuatro es cuatro y cuatro es mayor que dos que uno. ¿Pero realmente lo que tenemos acá no es un número, tenemos un nombre, pero es cada uno sabe, entonces necesitamos ajustar esos valores para estar cómo lo hacemos?

00:33:09:04 Hacemos unas variables que se llaman dummy test. Aquí tengo cuatro, cuatro variables. Vamos a generar tres down test. Si yo tengo una variable que es que es ordinal normal en un grado severo por la presión arterial calificada, así presión normal, hipertensión de la manera en que va a ser un test, esa variable no debe ir a la regresión de uno, genera más daño de un test.

00:33:48:06 Por ejemplo, decidimos que, o sea, la referencia 000A sería uno cero seria B sería 010AB sería 001. Pero esto estas tres estas z uno z2 z3 serían las damas y estarían representadas tres. Para el valor A tendríamos que sería Z uno y insertados a es cero en Z3A0 en b en z uno sería cero en seteado sería uno.

00:34:21:07 En z tres sería seguimos y A.B sería cero en Z10 en z2 y uno en z3 es si todas y si tengo todas en cero pcs sería ON y esta va a ser nuestra variable de referencia para los betas es tal público y 20. Vamos entonces ahorita y a ver, ya estamos están bien de amistad, así que a veces correcto.

00:35:17:12 Acá en Chile hace 20 vamos a trabajar con una base de datos que ya es conocida, que es la base de de de avance y vamos a observar esta vez son unos códigos muy pequeños. Vamos a empezar aquí en el análisis estratificado de ES. Quiero que observen como, como cada bueno, que observen que este código es como hacemos en primaria, es aquí vamos a a definir que ese en la función SS que es para un estudio de corte se ese si fuera un caso se controla y sería c c en este caso siguiente c este se h de nuestro desenlace.

00:35:52:19 Luego tenemos a la exposición café con láminas y luego, como ya sabemos, vamos a tener un segundo comando que es base en. Este voy va nuestro posible concurso entre paréntesis. ¿Entonces veamos que sucede cuando nosotros esta, esta está como la aplicación, entonces aquí la tenemos de este demos que este es nuestra fuerza sesión cruda, cual es nuestra fuerza retención?

00:36:25:13 Recordemos cuando vemos lo que nos dio, cuando hicimos la fuerza sesión, cuando hicimos el día variado entre laminas de infarto. Es fue dos 44, el límite inferior un 58, tres 78 y ese y variado es el que tengo representado acá. Dos 46. El perdón dos 44 uno 58 y este es el jurídico, o sea, es la relación bolivariana.

00:36:56:19 El crudo corresponde a la relación de varía entre las condiciones, el desenlace, el ajustado. Ese es el ajustado corresponde a la relación entre la exposición y el desenlace ajustado por el contexto, mientras que en el de variables e hipótesis nula era KT con la mina siguiente asociada. Infarto. El aquí no en nuestra hipótesis sería en ese patrón no la sería que las kate con la mina no serán cercenadas.

00:38:07:06 Su infarto cuando apostó por el consumo del tabaco es vemos que no, nada no nos dio igual y nos nos dio en el indio. Parecido es cuando sería la instancia entre la relación trinidad menos el abusado, aunque señala la distancia entre la relación cruda, menos el ajustado. Serían 2.45763. Si a expresemos lo en por 100 y dos sobre el ajustado tenemos el crudo dos 44 95 16 ya la la relación bi varia de Kate por la amenaza de infarto menos el ajustado que la relación de Kate Polainas infarto ajustado por cigarrillo que diez 47 63 sobre el ajustada test de se dice si usted tiene es.

00:38:54:10 No hay un parámetro matemático estadístico que nos diga con claridad es hay es una tendencia en las publicaciones y en las comunicaciones de los teóricos de de biología y estadística. Ellos dicen que esa distancia en es muy residual, es mínima cuando es inferior al 10%. Si es superior al 10%, esa distancia es muy alta. Es No podemos pensar que sean que sean similares de cuan a partir de cuando esa distancia es importante, a partir de que sea mayor al 10% igual o mayor al 10%, unos dicen eso o dice el 15%.

00:39:21:08 Para nuestro ejemplo vamos a alejarnos, vamos a ser bien conservadores y vamos a que sea 10%. Ese porcentaje debe ser observado de cero en valor absoluto. Entonces aquí vamos a ignorar el negativo y vamos a decir que la distancia del punto 3% contra, 6.000 $ 10% es como la distancia entre el ajustado y el crudo es menor al 10%.

00:39:48:05 Vamos a pensar esto y no está relacionado. No es. No es muy marginal la confusión que puede generar el cigarrillo en la relación de Kate con la mina e infarto es como no es, no es, no es relevante. Vamos a evaluar las fuerzas de la sensación en el estrato de los no fumadores, en el estrato de los fumadores de.

00:40:27:23 Observemos de la hipótesis nula en el primer estrato las catego laminas no están asociados a infarto en no fumadores y observamos que las asociaciones tres 49. El límite inferior es uno 42 límite superior ocho 55 es Miren que este esta fuerza de este intervalo de confianza. No, no, no pasa por el medio nulo que es uno es. Podemos concluir que hay asociación entre carne por las venas e infarto en un grado.

00:40:55:02 ¿Qué pasa con las que tengo? La imagínate con algunas de las fumadores vemos que la personas hacen este del 18. El intervalo del segundo 32 a 3 seis. Podemos concluir que hay una rela que asociación entre el tipo láminas de infarto en los fumadores, pero observamos que las pertenencias son distintas. Entonces las gente con la media representan estrés.

00:41:24:19 Es decir, yo una persona estresada le que y y que fuman nosotros si le quitamos el cigarrillo. Una persona estresada que fuma le vamos a aumentar la fuerza. Lazos de asociación para el infarto y eso lo vuelve variable. Eso lo puedo cumplir. De este análisis se llama estratificada. Nos van en el estratificado lado del volumen que la función se se corresponde el tipo.

00:42:00:21 Esto de lo que estamos haciendo que sería cortes se separa casos de controles, desenlace y exposición coma bar. La variable con su zona es muy sencillo el pollo y ese código nos da unos datos. Esa información tan importante. Cigarrillo no es con un y el cigarrillo si genera un interacción que cuando yo a un paciente estresado que fuma el le quito el cigarrillo, yo le puedo aumentar la fuerza.

00:42:26:21 Asociación para el riesgo infarto y en es y es tan es así que hoy en día la hace. Las 36 Sesión de consumo de tabaco Al paciente estresado que fuma no se le quita el cigarrillo. Estamos hablando en un clínica. ¿Es necesario en el consumo de tabaco para quitarle el trabajo a este fumador? Yo tengo que primero relajarme.

00:42:57:10 Lo hago por el sicoterapia, lo hago con consejería o lo hago con medicamentos, pero tengo que realizar y una vez el está relajado, tranquilo, ahí si puedo pensar en la sensación de consumo. El tabaco es el análisis estratificado, es bastante potente en términos de que te permite identificar mucho el comportamiento de mis variables, el vamos a ver que sucede con nuestro desenlace, pero con otro punto.

00:43:26:20 Sólo vamos a ver acá, por ejemplo, el electrocardiograma anormal en sí. Veamos, acá tenemos que está el crudo de la relación de variarán con la vida es impar. Aquí no tenemos ninguna información de este mismo gráfico, pero en el ajustado. O sea que aquí en el ajustado, si estamos viendo que el fuerzas serían oye, sigue siendo ese indicativo.

00:44:12:00 Las categorías se infarto cuando ajusto por el electrodo normal. Entonces veamos cuánto es el nivel de distancia desde aquí simplemente recupero esta orden de del histórico de comandos y voy a cambiar el astral. Simplemente y calculada por el 15%. Es que va a concluir el electro anormal es un concurso de su importante como esta relación está confundida por el electro entre Yo no pude evaluar los estratos porque ya sé que van a ser distintos, pero ya hice esa diferencia.

00:44:55:21 Es por la confusión. Entonces hay 30 escenarios con relación a esa variable. Es un típico profesor. Vamos a ver entonces que sucede con las catego láminas, el infarto y otra y otra variable, por ejemplo con presión social económica es con condiciones económicas Igual hemos aquí en la DAN es crudo que la relación de variar y aquí tenemos la relación ajustar este las categorías no las altas están asociadas a impacto en el que no pasan por el no el de para reconocer en de valor de confianza no pasa por el valor no es.

00:45:34:08 Vamos a interpretar esta salida tenemos que las crático la mina están sesgadas que infarto cuando apuestas por la condición socioeconómica. ¿Cuánto es el nivel de de distancia? El poder ha gustado. Calculé nula 2.387584 miramos el de 2,5%. O sea, es una como se llama residual. Entonces vamos a campo, vamos a evaluar los estratos, vamos a ver si hay algún término interacción en la condición social.

00:46:04:17 Entonces vemos el estrato pobre, la clase media y los ricos de la hipótesis nula para el primer estrato es que las catego láminas altas no están asociadas de infarto en pobres. Lo observamos que la confianza ve en el cinco 98 intervalo de confianza tres uno 11 cinco. Claramente podemos rechazar el porque no la y decir que las categorías más altas están asociadas a infarto en pobres.

00:46:56:21 Vamos a ver que está en clase media. La fuerzas más baja bastante intervalo de confianza de 0A5A24. Aquí va a suponer valor nulo de No podemos encontrar asociación implica que con la amenaza e imparte en clase media y los ricos tampoco ha de ser el 75 cinco 85 es claramente podemos decir que la las láminas no están asociadas a infarto en clase media ricos, pero las láminas están asociadas a impacto en los pobres y lo es que la pobreza aceptación pasa de dos 38 cinco 98 la hasta el cinco 38 y la y la del estrato pobre cinco 96.

00:47:36:08 O sea que la pobreza asignación de categoría vienen se imparten. Es excesivamente alta en los pobres. Es aquí ya tendríamos nosotros un término de interacción que nos indica y claramente nosotros no podemos publicar e La fuerza asociación indica que con amenaza impar ajustada por condición socioeconómica. Como 38. Sino que nos ha de publicar es estas fuerzas de. Es decir que la fuerza cinco 98 en los pobres y no hay relaciones de expectativas más altas de impacto en clase.

00:48:17:03 Medias y ricos hemos en ese observado. Pues ya estos estos elementos que están acá vamos ahorita a hacer el análisis muy variado es aquí, vamos a hacer la relación entre esta tiempo, la no entre el infarto del comando, el lonche se h es el desenlace y exposiciones parte con láminas el cómo sobre el cigarrillo electrodo normal, edad, colesterol, presión, sístole y diástole es vamos a correr esa función es es.

00:48:49:20 Veamos. En nuestro deporte estar claramente este es el comando lo desenlace infarto exposición café con láminas sumar en negro edad colesterol Presión sistólica y diastólica se hizo fue observar que se hizo e entraron los 609 individuos en la en la el modelo de regresión El modelo. El modelo se evalúa a través de esta prueba hipótesis donde donde lo que.

00:49:18:03 Lo que me está diciendo que yo tengo en el modelo siete variables. Por eso él tiene y ese modelo es un que es un modelo like una he like like la y fue la razón de la que el busca. Entonces esa razón de verosimilitud se distribuye chi cuadrado con los grados de libertad, dependiendo de las variables que tenga allí y tiene ese valor.

00:49:53:09 Y con responder probabilidad de 0,0, algún uno por ahí tendrá. ¿Entonces este modelo es válido? Quiere decir que yo espero encontrar al interior del modelo al menos un beta diferente. Si los beta son los coeficientes, recuerden que los beta son lugares naturales, entonces los veamos en los ni cerca. Esta es las variables. Aquí tengo el desenlace, tengo los cuando sientes el coeficiente tiene un error estándar.

00:50:23:12 Si yo di el coeficiente por el error estándar, tengo el modelo de Z y esa es una distribución. Se es una suma distribución normal de proporciones y tengo asociado un valor de T y tengo un intervalo de confianza del coeficiente. Como los coeficientes son logaritmo naturales, el valor nulo aquí cero, Entonces cuando un coeficiente significativo cuando el no pasa por el valor nulo que cero.

00:50:58:04 Veamos que el valor de k t con la mina es de un límite inferior de 0,04 mayor a cero y no 52 mayor SD. O sea que claramente k que proteínas está asociada a infarto cuando adulto por cigarrillo electrón edad colesterol precio sistólica diástole. Esa sería la forma en que deberíamos interpretar un modelo donde se han extraído muchos profesores usando todos esos computadores y yo puedo decir que las catego laminas asociadas están asociadas de infarto.

00:51:45:09 Ha gustado por todos estos motores que he mencionado, esas en el interpretación de del modelo explicativo derivado de la regresión física, donde nos interesa simplemente saber cómo es la relación entre mi exposición ajustada por tores, profesores que poder tener sin exposición a cigarrillo. Entonces miramos el beta es 185 límite inferior. El punto 25 es mayor a cero y le superior uno 45 Tengo diría que cigarrillo está asociado a infarto cuando gusto por KT coraminas electro edad colesterol presión sistólica diastólica y este que está constante es el beta cero.

00:52:22:06 Entonces o el o el alfa que vimos inicialmente mente. Ahí tenemos un modelo. Entonces el modelo explicativo donde se ajusta, entra en variables y se pudo hacer, básicamente vuelve. ¿Comentó el como lo oye la profe no? YY luego el desenlace, luego la exposición y de ahí los conclusiones. Bueno es miremos que otra cosa podemos hacer es vamos, quiero interpretar mejor este es que pesa más.

00:53:00:10 Estamos más en función de V, lo que quiere decir del seis. Los betas pueden ver que pueden ser positivos o pueden ser negativos. El caso de la presión sistólica, el beta es es. Es negativo. Veamos el valor del beta. El del intervalo con fianza va en 0,02 a 0,07. Claramente pasó por el valor uno, lo que sería. Y miren que esa variable no tendría si esa fuera la exposición, eso tendría significancia.

00:53:51:17 Pero interpretemos el beta en función de aquí. Si las KT con algunas altas, entonces se mín al si tengo KT con más altas, este beta me dice en cuanto se en se incrementa el riesgo para infarto. Cuando tengo ganas por el me sacar lo mismo eso se incremente el riesgo de infarto si aquí si tengo el electrocardiograma normal, esto se va a incrementar y el riesgo si tenemos uso normal en edad en edad por cada año cumplido se incrementaría el riesgo en punto cero 38 aquí en colesterol por cada miligramo por litro que se incremente el riesgo para llevar densidad más cero ocho Impresión sistólica por cada milímetro Mercurio que se incremente se va a

00:54:22:20 bajar el riesgo en mido 0,07 presión diastólica se incremento por cada incremento de la presión de la presión sistólica por cada milímetro de mercurio que se incremente se incrementa el ritmo en este test. Es Eso es lo que me está diciendo el el coeficiente en cuanto se incrementa el riesgo para el desenlace infarto. Recuerden que eso hace una función que generalmente no da una probabilidad en función del ocho.

00:54:58:19 Ahora quiero hacer que la regresión logística me exprese esto en una fuerza asociación test. Simplemente vamos a darles el la función en lo get de como decíamos a ahora desde las s h de la exposición KT con láminas, fumar, electro edad, colesterol, presión sistólica diastólica. Una segunda función si es coherente, pero ha precedido una coma tres. Ya, ya no tengo coeficientes sino que tengo fuerzas de asociación.

00:55:44:08 Tres Puedo interpretarlo igual. El valor nulo acá es el el uno y puedo ver la consistencia entre los intervalos de confianza. Y lo más grave debe s sería una forma independiente de hacerlo. Ahora, cuando nosotros hacemos, cuando nosotros hacemos la función que iniciar, sino no e r sin el oe r tenemos nosotros este este modelo que ya vimos pero queremos nosotros predecir el riesgo es mil aquí para predecir el riesgo es el blanco génesis predicción y yo he llamado al riesgo.

00:56:31:12 ¿Riesgo? Puedo llamarlo de otra manera y lo va a llamar riesgo. Entonces ya, ya existe ese riesgo que miden que están a la espera de que se rían. El riesgo aquí ya ha sido calculado para cada una de las variables. Vamos a verlo acá es este es el riesgo. Infarto para este sujeto, este sen. O sea, tengo ya el riesgo predicho, o sea, ya, ya está medido esa función login y ya entonces tengo, tengo eso ya lo tengo establecido en ya, ya tengo el riesgo por sujeto, ya el me calculó todo esa función oye, uno sobre uno más sea la Z, lo hizo para cada sujeto.

00:57:07:12 Ahora con ese riesgo predicho nosotros podemos hacer la prueba de Josmar de mi show. Vamos a ver la prueba. Tenemos el reporte de la prueba. Entonces es. Y aquí queremos saber si las probabilidades observadas y esperadas son y se calculan probabilidades observadas inesperadas para diferentes escenarios para agentes de estimación de probabilidad. Y me dice que no hay diferencia entre lo observado.

00:57:45:03 Espera. ¿Quiere decir entonces que este se mueve de regresión logística? Es valido si yo quiero predecir de esta manera, nosotros evaluamos la validez del modelo. ¿Es esta AT Goff coma Group? Aquí estamos desde el hace estimaciones aquí para diez grupos de probabilidades y observa que no hay diferencia entre el grupo. Las probabilidades predichas con las observadas. Entonces nos dice que cuando el valor de piensa hace alto lo que el grupo tengo, el aquí es el.

00:58:22:18 Las probabilidades observadas son iguales a las probabilidades predichas al predicho en el riesgo aquí en el predecir. Entonces como nos da un valor de t alto decimos que este modelo es vale. Ahora queremos saber también un análisis de clasificación de ese modelo es una. Es importante que esta secuencia c, C, C, c se mantenga el modelo con los beta consigna sobre primer.

00:59:02:13 Luego predigo el riesgo, luego hago la prueba en hacerle mi show y ahorita voy. Ya, ya, ya, ya dije la clasificación de es decimos que el modelo es valido, pero aquí me hace un análi de sensibilidad, especificidad del del del modelo, del modelo de regresión. Me acabo de hacer y me dicen lamentablemente que la sensible es muy vaga, tiene una sensibilidad de 2,82, o sea que el modelo es capaz de identificar solo el 2% de los y marcadas.

00:59:38:19 Es muy específico para decir que no esta impactada, pero de los que dice está infartado, realmente sabe basta, es el valor previo positivo. Entonces y correctamente clasificadas, el 88% de nos que a nosotros un modelo con alta especificidad, un buen valor predictivo positivo, pero la sensibilidad baja. O sea que valdría la pena hacer unas otros modelos. Y para podernos otros hace unas predicciones.

01:00:26:17 Bueno, en lo que tenía para comentar quisiera o escucharlos a ver que opinan y algunas de las comentarios que puedan informarnos sin Gracias doctor José William por por esta presentación e invito a los asistentes de mercadotecnia en sus consultas en el chat les está enviando la información donde pueden acceder a ver la grabación de esta sesión. Nuevamente le voy a leer algunos comentarios que nos han dejado en el chat de los Baler textualmente como no los han puesto Doctor José Urbina nos dicen Apreciado doctor, estos ejemplos son modelación econométricos.

01:00:54:04 ¿Sabe usted porque las personas pertenecientes a esta área son muy poco receptivas a estas modelación? Yo trabajo con modelación econométricos para análisis y diagnóstico, pero las personas de esta área hablan de biometría, la cual yo la conozco porque es una. Porque del análisis estadístico de un lambda de luz con el método específico de diagnóstico. Pero frente a la complejidad debe utilizarse este tipo de modelamiento.

01:01:28:04 Es decir, la econometría es la madre de la biometría en medicina, que es si yo no sé si son sin la madre o son hermanitos, porque realmente en biometría para nosotros en epidemiología es una ciencia básica e y tiene como base fuerte la parte estadística, pero creería yo que tienen los mismos los como la econometría tiene también su base y la estadística.

01:02:23:09 Ahí es donde nos encontramos. Es como nuestro, nuestras estrías por decirlo así. O sea la estadística en base para econometría y es base para biometría. Entonces nosotros usamos los mismos modelos, lo que lo que lo que cambia son las interpretaciones y el comportamiento y las características de las variables en cosas de eso. Es decir, lo que cambia mucho es como el signifi la la información biológica que tiene cada variable aquí, como en econometría por la información económica de cada variable en los modelos y pues me imagino yo eso porque no se de econometría y me excusa pues si estoy cometiendo un error le agradezco si me lo aclaran, pero piensa eso que econometría y geometría

01:02:52:11 ¿tienen como su ance sería su origen? Muchos de los modelos estadísticos, los cuales pues sin mucha base matemática igual, pero entonces allí pues por eso usamos modelos similares o en ese caso podemos usar muchos modelos propios de modelos de regresión lineal múltiple. Son esos, sí, los conozco de econometría y tienen aplicaciones en ciencias de la salud. No sé si le respondí.

01:03:21:13 Sí, es claro y le agradezco el comentario perfecto. Si nos dan alguna respuesta adicional en el chat, acá nos dicen Gracias por la presentación. ¿En los modelos explicativos puedo dejar todas las variables independientes de su significancia o es recomendable seleccionar variables? ¿Si es así, que Regla recomienda para incluir y excluir variables de un modelo de regresión logística explicativo?

01:03:58:06 Muy buena pregunta. ¿Y si después de decir yo puedo, yo pude haber hecho otro modelo? O sea, este modelo que tiene tantas variables, yo podría empezar a haber como voy quitando variables, es decir, puedo o no saber acá, pero en el primer modelo yo creo que esa es mi fuerza, asociación. ¿Qué sucede con las catego láminas, la el coeficiente, el beta de categoría, lámina de infarto?

01:04:34:23 Si yo quito el modelo, la variable menos significativa que sería presión sistólica test, lo hago y obtengo modelo y observo que me afecta la fuerza asociación me la va disminuyendo entonces y me la y prácticamente me saca la exposición asociada al infarto. Osea, si yo quisiera que Cate Coraminas siguiera siendo asociada, yo no podría sacar presión sistólica. Entonces se recomienda hacer mucho eso, un paso atrás.

01:05:14:13 Ese paso a paso puede ser de un modelo saturado, como este y quitando me voy para atrás, voy a quitar o de un modelo sencillo o simple. Por ejemplo Cate de un modelo como este, un modelo, el más simple que puede haber aquí CAT es un body variado. Entonces puedo ir agregándole otra variable y voy viendo cómo se va transformando el beta y si sigue siendo significativo con el ajuste ese confuso, entonces puedo pensar en que se ha ido y para adelante.

01:05:59:03 El forward es cuando tengo el saturado y voy eliminando, es el valor, no voy para atrás cuando estoy con el sencillo y voy aumentando, voy hacia adelante. Lo otro que se hace es el este, este, el se divide, es paso a paso, quito y saco, quito y saco hasta que tenga un buen mejor modelo. Esto es bastante cuestionada y parece que lo mejor es hacerlo acá a través de procesos muy automatizados, porque las posibilidades de generar modelos son múltiples, pues ya se puede imaginar cuántos modelos de regresión puedo hacer.

01:06:31:21 Aquí tengo uno, pero acá tengo, aquí tengo, puedo tener otro. Y mire, los tres son significativos, puedo tener otro y puedo tener otro, como por ejemplo, eh, presión sistólica, BNC no me funciona. Entonces puedo con el otro y lo estoy haciendo. ¿O sea, puedo tener muchos modelos y aquí, pues teniendo estas variables, no sé, se imaginan qué pasa si tengo muchas variables y todas muy asociadas?

01:07:09:18 Entonces se recomienda que usted haga ese paso a paso, pero también que utilice un código de inteligencia artificial o machine learning. ¿Y el machine learning le puede y le puede proponer cuál sería el mejor modelo? Eso se puede también hacer en esos momentos, pues dependiendo lo de lo de la caja, de la capacidad de gestión que tenga que tenga con sus variables, pues se puede, puede hacer una, se va quitando, va mutando, va eliminando, va agregando y va mirando como se comporta.

01:07:38:04 El beta es su exposición y si a esa se transforma es si el beta se modifica mucho, como vimos ahora con la salida de una variable no asociada. Entonces ese y ese beta, esa área misma sociedad se debe mantener porque me modifica. Si le quito, me modifica la relación entre la expresión del desplazamiento. No sé si queda claro con estos ejemplos.

01:08:18:19 Gracias. Okay doctor, una pregunta, en el modelo logístico no se calculo el margen. ¿El margen? ¿Podría realizarlo o interpretarlo? Perdón, no se me fue por acá. En el modelo sofisticado no se calculo el margen, podría realizarlo o interpretarlo. El margen baja. No, no, no, correcto. En dónde estaría el no lo conozco, no lo lo, lo que veo en logística, en regresión logística lo que más utiliza es la validez.

01:08:48:10 Es a través de la prueba, en en el hecho y después cálculo de sensibilidad, especificidad del modelo. Eso es básicamente lo que hacemos. Otros cálculos. No, no he visto que se publiquen otros. Otro tipo de cálculos. Me gustaría que si me manda ese para yo para explorar efectos marginales. Ah, ya, ya, ya. El de residuales. Sí, sí, sí.

01:09:24:16 No, no, no, aquí no están necesario, porque mire que el pseudo r cuadrado de este es muy malo. Entonces básicamente como no son relaciones lineales, entonces esos marginales pues no son tenidos en cuenta. Ni siquiera leí pues el R cuadrado, porque es como eso está muy en función de relaciones lineales, es no son muy usados acá. Stata los presenta, casi todos los programas lo tienen, pero no, nosotros no, no los interpretamos.

01:09:53:05 Casi perfecto para entender la regresión lineal múltiple. Ay, sí, ahí sí eso es determinante. Perfecto. Vamos con otra pregunta. En la investigación biomédica no es frecuente el reporte de la interacción, como lo es la confusión. ¿Por qué cree usted que se de este fenómeno?

01:10:26:01 En la investigación biomédica publicamos mucho. La interacción en ensayos clínicos y en ensayos clínicos se publica bajo la figura de análisis de grupos. En los estudios observacionales. Yo creería. Creería que no se presenta porque no hacemos el estratificado que hoy, o sea, es el análisis estratificado hecho en otros tipos de herramientas, no te presentan lo que te presenta.

01:11:00:21 Stata. O sea, creo que son muy pocos los programas estadísticos. No conozco sino de Stata y conozco de R. Que sí lo. Pero el resto de programas, por ejemplo SPSS No puedes hacer ese análisis estratificada si no puedes hacer el análisis certificado porque el producto herramienta no lo tiene. Vuelvo o tiene mucha dificultad de implementarse. Puede que lo puede que lo haga, pero pero no da media resumen aquí me están corrigiendo.

01:11:26:14 Si lo si lo si se puede hacer análisis certificado en en algunos otros programas, pero no te da los análisis que te presente. STATA Entonces la gente no puede, no puede entender la interacción, no la ve y la mejor forma de verlo es a través de análisis estratificadas como los presenta Stack, que yo creería que es algo de herramientas.

01:11:49:01 Uno o de tecnología. Y lo otro es la conceptualización, porque tampoco veo mucha conceptualización con respecto a la interacción en los ensayos clínicos. Si lo hacen y lo publican, así como le digo, análisis de subgrupos.

01:12:26:12 Perfecto. ¿Doctor José William, por acá nos preguntan buenos días, me puede explicar un poco sobre los resultados de valor predictivo positivo y negativo, como se interpreta según el ejemplo? ¿Aunque si es muy interesante la pregunta eh? Vamos a verlo acá directamente. Bueno, el concepto de sensible a especificidad son conceptos, digamos en pruebas diagnósticas. Son son conceptos de la prueba, son en sí de la prueba son términos de la prueba rendimientos de la prueba es aquí.

01:13:10:12 Digamos que predecir el impacto es parte nuestra, es nuestro, es de nuestra. El nuestra e es la evaluación de la prueba. Pero las pruebas independientes, su sensibilidad y especificidad pueden tener diferentes valores predictivos positivos y diferentes valores predictivos negativos. Pero vamos al valor predictivo positivo. Entonces, por qué en la diferencia entre sensibilidad y valor predictivo que dice el valor predictivo positivo y el valor predictivo negativo es el rendimiento de su prueba en la población donde usted está trabajando, puede ocurrir fenómenos distintos.

01:13:47:19 ¿Tener sensibilidad del 100% y una especificidad del 100%, pero en un valor predictivo del 2,8% que quiere decir eso? Que es que usted de cada 100 fulanos que le salgan positivos en el escenario de un valor predictivo positivo, de cada 100 fulanos que le salgan positivos solo son positivos dos Y así de saca tenemos una sensibilidad del 2,8%, una insensible muy mala.

01:14:29:13 Eso no es, eso no es bueno. O sea, quiere decir que de de todo el 100% de infartado es. Yo con este modelo a detectar 3,8 digamos que es tres, pero los tres que yo identifique del modelo, el 100% van a ser impactados. Eso es lo que quiere. Eso es lo que me dice el valor predictivo para valor reactivo es el rendimiento de su prueba en el terreno, la sensibilidad, especificidad en la evaluación de la prueba en condiciones ideales, en condiciones muy controladas de laboratorio.

01:15:08:20 Pero que sucede con esa prueba en la comunidad Para poder saber que sucede con esa prueba, la comunidad usted tiene que ver el comportamiento del valor predictivo positivo y el sentido negativo es básicamente esa es la diferencia. Okay doctor, pues aquí le llamamos dos últimas preguntas. Para poder dar el cierre a la sesión del día de hoy, nos preguntan al plantear un estudio correlacional que estudia la asociación entre saturación de oxígeno y valor de PCR en pacientes con insuficiencia cardiaca.

01:15:52:12 ¿Qué pruebas estadísticas debería utilizar? ¿Como identificar las variables profesores? Perfecto, muy bueno. ¿Cuál seria su desenlace? La saturación. Si su desenlace es la saturación, entonces. Entonces es una variable con una variable de que es número seis. Tenemos que mirar si ese desenlace sigue una distribución normal. Si seis enlaces y una distribución normal, se puede hacer una regresión lineal múltiple y esa regresión lineal múltiple que va a ser, va a mirar si la prueba PT es su exposición, pero en confusa ser verdad.

01:16:26:10 Otra confusa puede ser si ha tenido un infarto previo, otro confusa puede ser diabetes mellitus. O sea, todo lo que altera el endotelio pueden ser con nosotros. Entonces usted debe tener esa información en la base de datos para evaluar si su exposición ajustada por esos computadores. M define una saturación. Por ejemplo. Entonces las los en generar las regresiones que hay y quienes stata se pueden hacer son muchas de muchos tipos.

01:17:12:10 Todo depende del comportamiento de su desenlace. Si es una variable cuantitativa y es normal hacer una regresión lineal múltiple, si no es normal, usted puede hacer otro tipo de regresiones. Hay muchas, muchas. Hay regresiones polinómica, hay regresiones e reach, hay muchas, hay muchos tipos de regresiones. Es dependiendo del comportamiento de sus desenlaces que usted define, es perfecto. Doctor José William Bueno, por acá nos están diciendo si el canto puede compartir el nombre, la base que utilizó para poder buscarla y los tés que se utilizan para los modelos.

01:17:44:12 Lógico para este ejemplo. ¿Ok, lo bueno del modelo Logic es que no tiene muchos prerrequisitos, si cual es el requisito? Es su descenlace, es un y las variables cuantitativas pueden ir en su condición cuantitativa. No debo poner variables Category usadas en 1234 cuando son más de dos categorías. No puedo, no puedo ponerlas allí, Debo hacer las damas. Si he.

01:18:33:16 Entonces ese. Ese tipo de variables deben ser y deben ser generadas y. No es más el los requisitos. No debo colocar variables ordinales 1234, sino que ol me las darme y el

Investigación en Salud con apoyo de Stata: Análisis estratificado y regresión logística


El análisis estratificado es una metodología muy útil en Ciencias de la salud ya que permite al investigador establecer si la relación entre la exposición y el desenlace está sobreestimada o subestimada por el efecto de una tercera variable denominada confusora o que corresponda a un término de interacción. En este sentido, permite estudiar de una mejor manera el conjunto de variables y sus interacciones, así como realizar los ajustes requeridos de acuerdo a la hipótesis planteada y las necesidades de la investigación. En esta presentación abordaremos tanto la importancia y aplicaciones del análisis estratificado, como las herramientas con las que cuenta Stata para su desarrollo.



Etiquetas relacionadas

  • Análisis de datos
  • Gráficas
  • Investigación

¡Comparte este video con tus colegas!

Compartir

Ver más

Cotizar
Próximos
Eventos

X

Mis cotizaciones:

Comentarios a tu solicitud:

Cotizar