SS_Logo

El desafío de las pruebas de hipótesis y el poder de Stata para análisis en salud

Autor: Dr. José William Martínez / Portafolio: Quantitative / Jue. 03 de Ago de 2023

Transcripción de este video

00:00:50:10 Software Shop, la empresa líder en la implementación de herramientas analíticas y software especializado en Latinoamérica, les da la bienvenida a esta presentación. El día de hoy contamos con el acompañamiento del instructor doctor José William Martínez, médico doctor en Epidemiología, Académico de la Universidad Tecnológica de Pereira, epidemiólogo de un país de Occidente, miembro de la Sala de Análisis de Riesgo de la Secretaría Departamental de Salud de Risaralda, tutor del FEP en el Instituto Nacional de Salud, con más de 20 años de experiencia en temas de investigación, de análisis de riesgo para enfermedades de interés en salud pública, evaluación de pruebas diagnósticas e intervenciones comunitarias.

00:01:49:18 Bienvenidos. Muy buenos días. Buenos días. Saludos a todos. Vamos entonces a a empezar. Voy a compartir de la pantalla que esperamos. Ya la estamos viendo. Perfecto, ya estamos viendo la presentación, doctor. Perfecto. Ok. Bueno, entonces. Muchas gracias. Elisa. Ahorita vamos a la comienzo a esta parte que es bastante importante en el desarrollo de los procesos de investigación. Tal vez es como desde dentro del marco del estudio descriptivos, pues estos no requieren para iniciar el estudio unas unas hipótesis, pero es muy importante que el estudio descriptivo pueda res recomendar, pueda entrar a dar un nuevas pautas.

00:02:23:23 Es decir, al final de él el puede también elaborar hipótesis que otro tipo de estudios puede entrar a confirmar. Entonces. Ya sea que nosotros partamos de una hipótesis para el desarrollo, un estudio causal o que nosotros lleguemos a ella con base a una información que hemos hemos discutido, hemos conocido de los datos que se manejan en diferentes e de diferentes formas y nos permita entrar a relacionar variables.

00:02:58:22 Entonces las hipótesis se refiere a eso, son relaciones entre entre variables en el campo de la salud, una variable, un tipo de variable aquí muy relevante es la la variable desenlace. El desenlace es el efecto en lo que nosotros queremos, por ejemplo, explicar y en algunos momentos llegar a predecir o proponer como una una variable de importancia, de interés que debe ser explorada.

00:03:52:25 Entonces en la explorada y tesis tenemos un desenlace. ¿C O corresponde esto a un efecto, por ejemplo A1A1 diagnóstico de de alguna enfermedad, un agente infeccioso? O puede también ser una práctica, puede tener también algún aspecto cultural que queramos nosotros identificar. Es en las hipótesis las e son son bastante relevantes la definición del desenlace, pero también es importante la definición de la exposición, la exposición en la variable que nosotros vamos a tener dentro de ese marco causal e como para poder establecer esa relación y que luego de confirmar esa relación, pues nosotros querríamos modificarla.

00:04:25:26 O sea, las probables hipótesis nos llevan a tener una visión de lo que queremos llegar a ser, pero también de lo que podemos modificar. Ya no se trata únicamente de un aspecto contemplativo, sino de que el investigador pueda, con las de hipótesis, orientar las decisiones, generar intervenciones y desarrollar cambios dentro de una enfermedad, dentro de una población y dentro de un grupo específico.

00:04:57:12 ¿Entonces vamos a a evaluar, en este marco de toda la hipótesis, los estudios de cohortes son los estudios observacionales de mayor nivel de evidencia o no? Sin esto es, estamos pensando que lo de casos de controles no la tengan, pero este tipo de estudios son muy relevantes por que aquí nosotros podemos establecer que la exposición fue previa al desenlace.

00:05:28:25 Entonces por este, por esta característica de que los estudios de corte tienen una exposición que es identificada y un desenlace que se va a presentar a través del tiempo, entonces podemos establecer eso. Primero fue la la exposición y luego fue el desenlace. Eso es totalmente y perfectamente demostrable. Entonces dentro del estudio de cohorte tenemos un grupo que se llama Expuestos y otro grupo que es el no expuesto.

00:05:59:18 La exposición entonces tiene estos dos valores, unos son expuestos y otros no son expuestos, por decir algo, unos fuman, están expuestos a tabaco, a cigarrillo y otros no fuman, no están expuestos a tabaco, no están expuestos a cigarrillo. Explosión de corte Tienes una exposición donde tienen un tiempo de seguimiento, un tiempo de seguimiento y tienen una variable que es el desenlace.

00:06:30:15 Al final los autores vamos a establecer cuantos de los esfuerzos dieron el desenlace, tuvieron el el evento de interés y que tiempo asociado tienen esas personas durante el seguimiento para que se produzca el desenlace. Lo mismo hacemos con los no expuestos. Entonces el hecho de que en el tres podemos establecer una relación del desenlace en función del tiempo personal nos permite calcular unas incidencias de entidad.

00:07:04:03 ¿Las incidencias de densidad corresponden como a velocidades a que velocidad van los expuestos para llegar a tener el desenlace? ¿A que velocidad van las personas que fuman para tener un desenlace? Por ejemplo cáncer de pulmón. ¿Entonces y a que velocidad? Los nuevos puestos van para tener un desenlace los que no fuman en este caso si el cáncer de pulmón el desenlace a que velocidad van ellos para presentar el el desenlace que es cáncer de pulmón.

00:07:48:06 Entonces estudian de esas velocidades a las cuales van los esfuerzos y lo nos puestos. Nosotros podemos establecer una prueba hipótesis. Entonces los estudios de cohorte tienen esa esas como tres dimensiones exposición, tiempo de seguimiento y desenlace. Deben estar las tres para poder nosotros establecer con claridad que hay una corte. Entonces se pueden evaluar, por ejemplo asociaciones ambientales o Associació ones de Exposiciones clínicas de exposiciones biológicas o asociadas al comportamiento con un desenlace.

00:08:26:27 Buscamos muchas veces ver esas o esas asociaciones inicialmente. Entonces. La exposición. Nosotros partimos del hecho de que la exposición es la variable inicial y tenemos que hay unas personas que en un momento en el tiempo cero, unos están expuestos y otros no están expuestos y vamos a ver cual cuantos después de que se termine el estudio, cuántos desarrollaron la enfermedad y cuantos no la desarrollaron y asociado tanto a la exposición como la después es a los dos puestos, está el tiempo de seguimiento de cada sujeto.

00:08:54:10 ¿Al final, entonces nos vemos si los expuestos desarrollaron la enfermedad o y los no expuestos, cuántos desarrollaron la enfermedad? Si digamos si el rectángulo a que me me expresa la frecuencia de los que desarrollan en la enfermedad, tanto en especies como en la expuesto, pareciera que los expuestos tienen más casos para el desarrollo de la enfermedad comparado con los no expuestos.

00:09:48:19 Entonces pareciera que es hipotéticamente, podríamos pensar que la exposición esta asociada a la enfermedad, la tenemos que verificar, pero además de eso vemos la dirección de la asociación. En este caso la exposición esta asociado a la enfermedad y parece que la exposición aumenta el riesgo del desenlace de es. Pareciera que la exposición entonces me está aumentando el riesgo del desenlace, porque puede ocurrir, digamos, si tengo una cohorte de adolescentes donde unos se exponen al al al uso del preservativo, del condón y otros no se exponen al preservativo o el uso del condón y no lo usan, entonces podríamos pensar que el desenlace es infección de transmisión sexual.

00:10:25:00 Entonces por en uno puedo podría observar el fenómeno contrario. Lo que vemos acá, que en los expuestos tendrían menos desarrollo de la enfermedad desparecerá que el presente. Hipotéticamente podríamos establecer que la exposiciones a condón o a preservativo está asociada al desarrollo, la enfermedad, pero la exposición disminuye el riesgo de la enfermedad en que es de allí deriva haríamos que es probable que esa exposición sea un factor de riesgo o un factor protector.

00:11:10:13 En el caso del preservativo, hipotéticamente, estaríamos pensando que el preservativo estaría disminuyendo. Riesgo sería un factor protector. Desde las pruebas de hipótesis es muy importante que no se trata únicamente de tener una asociación y decir que hay unas en A relacionan la sucesión entre la expansión y el desenlace. Necesitamos también establecer cuál es la dirección de esa asociación, si la exposición aumenta el riesgo del desenlace o si la exposición disminuye el riesgo el desenlace, Entonces las fuerzas de asociación me establecen cuánto es la intensidad de la relación entre la exposición y el desenlace.

00:11:40:00 Aquí nosotros no solamente tenemos un valor de P que puede decirnos el nivel de asociación, las Si hayas estadística o no, también tendríamos que evaluar que tan intensa es la relación entre la exposición y el desenlace. Y eso lo hacemos a través de fuerzas de asociación en los estudios de corte, las fuerzas de asociación se llaman riesgo relativo.

00:12:33:16 Ese riesgo relativo es una familia de de fuerzas de asociación, donde puede ser que la. Si la incidencia se establece a través de la incidencia establecida como incidencia en ciudad, entonces nosotros podríamos tener una fuerza de asociación que se llama Great ratio, o sea, razón de tasas. Ella entonces esa diría a mi que tan intensa es la la relación entre las pensiones de ese enlace a través de velocidades de cambio, porque estamos hablando de tasa de incidencia, pero si yo tengo una proporción, o sea, no tengo en ese momento, es decir, por alguna circunstancia en mi cohorte todos tienen el mismo tiempo de seguimiento, entonces yo ya no tengo el tiempo como una va un

00:13:03:00 componente extra de variación y lo que tengo son proporciones en una proporción de incidencia en expuestas y una proporción de incidencia en los puestos. Entonces es hay riesgo relativo, se denominará rice ratio o riesgo relativo. Realmente aquí se está estableciendo si el riesgo relativo o en el caso de incidencias acumuladas o en el caso de incidencia en ciudades, tendríamos la razón de tasas.

00:13:40:00 Las dos me establecen lo mismo, pues el de asociación. Para el caso de la hipótesis nula, se considera que hipotéticamente, que las incidencia son iguales. O sea que el riesgo relativo en el caso de que la hipótesis nula fuera, fuera, no fuera cierta, el riesgo relativo sería uno. Pero en el caso de que haya una relación entre la exposición y el desenlace y tenga yo más incidencia a el no expuestos, la incidencia en expuestos, miren que está en el denominador.

00:14:15:14 Si el denominador es más grande que el numerador, entonces no tres. Tendríamos un riesgo relativo menor a uno y por eso estaríamos pensando en que esa exposición está disminuye disminución de riesgo, o sea, exposición sería un factor protector. ¿Y en cuánto me protege el factor protector? El factor protector protegería el restante. Lo que la diferencia entre lo que me da el riesgo relativo en relación a uno, es decir, si tenemos un riesgo relativo de punto ocho, el me protegería.

00:14:44:28 Un todos sin riesgo relativo sería de punto tres, me restaría puntos 7 a 1. Entonces mi protección sería del 70%. Esta es, pues, la forma en que se establece en función de la fuerza. Es de sesión con factores protectores. Para el caso de factores de riesgo, la incidencia sería más alta en los expuestos, que es el numerador sería mayor el denominador.

00:15:26:21 Por eso tendríamos que el riesgo relativo sería mayor a uno y ese mayor a uno. Entonces me iría que tengo un exceso de riesgo. ¿Ese exceso de riesgo me diría cuánto puedo yo clasificar las diferentes exposiciones en contrario, si esas especies y cuáles exposiciones tienen una fuerza asociación mayor, cuáles son? Riesgo relativo mayores generalmente los riesgos relativos de orden social, de orden, de orden, sí, social son generalmente por encima de tres de 4.º, o sea, ritmo elástico de ese orden.

00:16:18:04 En cambio, los riesgos relativos asociados a exposiciones genéticas, a marcadores moleculares, a sobre el sobre exposiciones entonces, o sobre expresiones. Esas son fuerzas de asociación débiles son entre la un e mayores a uno, pero menores A15. Y esto es muy importante el cálculo del tamaño de muestra porque los riesgos relativos de cuyas fuerzas de asociación son débiles existen tamaño de muestra más grande, mientras que los riesgos relativos que son sociales por encima de tres, por ejemplo, tienen un tamaño de muestra más pequeños y la prestación de servicios generalmente sí la oyó ALUAR como una exposición.

00:16:47:17 Ellos están entre el orden de dos 2,5. Su tamaño de muestra son más moderados. Aquí tenemos la fuerza de. En el caso de las tasas que ya comentamos para el estudio de. Para el caso del estudio de casos y controles, que es una. Es una forma de de diseño muy eficiente, sobre todo muy importante en la evaluación de la prestación de los servicios de salud.

00:17:17:27 Nosotros podríamos tener, por ejemplo, los casos. Partimos del desenlace en los que las Cortes partimos de la exposición. Aquí vamos a partir del efecto. Por ejemplo, tengo unos pacientes impactados. Es más, los pacientes impactados son los casos. Los pacientes que no se impartan son los controles. Es muy importante de que la definición de caso y control. Nosotros nunca involucremos la exposición.

00:18:00:23 O sea, si yo y evaluar el programa de control de hipertensión con yo no puedo definir como casos a los impactados que están en el programa de control de la hipertensión, porque si hago eso, entonces no voy a tener variabilidad en la exposición y no voy a encontrar una asociación así ella se presente. Es muy portante que nosotros en los estudios de casos y controles de si queremos mayor eficiencia, de definamos no mismo con los controles.

00:18:37:23 Generalmente los casos son los más sencillos de definir, porque el caso tiene el desenlace que estamos buscando. Los controles, pues están libres del desenlace y tenemos que verificarlo. Entonces, en tanto en casos como en controles, vamos a evaluar retrospectivamente estuvieran expuestos, son expuestos. Para nuestro ejemplo, los casos son los importadores, pacientes, impactados. Vamos a evaluar si ellos fueron o no al control de la de la atención arterial, a la control de la hipertensión.

00:19:19:29 Los controles igual no tienen infarto, pero vamos a evaluar si ellos están asistiendo a control, el programa de hipertensión. Entonces este la estrategia de casos y controles es una estrategia muy eficiente en función de que se tienen tamaño de muestra más pequeños como los es en comparación con los de corte. Pero realmente estos estudios son bastante sesgados y básicamente yo lo que por eso aquí yo no puedo calcular incidencia, aquí no puedo calcular prevalencia porque es conocido hacendados, pero sí puedo calcular asociaciones y fuerzas de asociación.

00:19:50:15 ¿Entonces, cómo es la dinámica? Entonces tengo unos casos que tiene el de su enlace y unos controles que no tiene el desenlace y evalúo la exposición pasada. Al final, como no puedo calcular incidencia, no puedo calcular prevalencias, puedo calcular ellos de exposición de tengo unos de exposición en casos y unos de exposición en controles en los de exposición.

00:20:45:07 En casos en que tengo los casos expuestas es el numerador y los casos no expuestas es el denominador es es unos de exposición en casos en los controles tengo los controles que están expuestos, los debido sobre los controles. Después ahí tengo el 11 de exposición en controles, luego divido los de exposición en casos sobre los de exposición en controles y tengo la opere que la fuerza sucesión en el de casos y control las ocasionalmente también podemos tener un estimador de esta de esta fuerza asociación a través de estudios transversales donde calculamos prevalencias ISO de son equivalentes el o r y y la el riesgo relativo son e se interpretan igual, pero en general siempre los

00:21:18:01 operes van a ser mostrar una fuerza asociación mayor que los riesgo relativos de en los estudios de casos y controles. Parto del desenlace. Las personas con el desenlace son mis casos los que están libres del desenlace son los controles y tanto en casos como en controles voy a evaluar la exposición. Al final voy a evaluar cuánto fue la o esta exposición en casos y plazos de exposición en controles para determinar mi fuerza sucesión.

00:21:57:09 Un elemento importante también en el cálculo de las fuerzas de asociación es el riesgo atribuible. Digamos que la fuerza de asociación, riesgo relativo o r o s ratio son fuerzas de asociación que me establecen una exposición y el de la relación entre la exposición y el desenlace, pero muy a nivel individual. Si yo quisiera tener un marcador más poblacional de fuerza de asociación, sería el riesgo atribuible entonces de riesgo atribuible a una amiga asociación basada en la diferencia absoluta de las estimaciones de riesgo.

00:22:32:10 Decíamos entonces, para el caso de los la nas cohortes, hipotéticamente, voy a plantear que no hay relación entre la exposición y el desenlace y cómo lo establezco aquí. Parto del hecho de que la incidencia en expuestos es igual a la incidencia en expuestos de decir yo voy a hacer una diferencia de esa. Es una diferencia absoluta. Esos riesgos que ya me van a dar cero de mi riesgo atribuible cuando es igual a cero, quiere decir que no hay relación entre la exposición y el desenlace.

00:23:07:08 Y si ese riesgo atribuible es negativo, es quiere decir que la exposición, exposición hipotéticamente de esta disminuyendo riesgo es un factor protector que debe evaluar. Si el riesgo atribuible es positivo. Quiere decir que la exposición me está aumentando mi riesgo y que debo hipotéticamente establecer si eso se presenta o no, si hay diferencias significativas, el riesgo atribuible entonces, es una medida asociación, repito, basada en la diferencia absoluta.

00:23:57:03 Esas dos estimaciones. Y de aquí pues nosotros podemos interpretar, por ejemplo, la fracción tiene teológica, es decir. En no necesariamente la en la incidencia en expuestos me define el riesgo del desenlace por la exposición para poder yo saber cuánto le atribuyo del desenlace a la exposición, lo debo hacer a través del riesgo atribuible es el riesgo atribuible. Se interpreta como fracción etiología de la del desenlace, cuando sabemos que la exposición y el desenlace realmente tiene evidencia científica, esa reducción en sí y no tengo con cursores, no tengo sesgos que me expliquen esa fuerza situación.

00:24:32:17 Después de decir que es la fracción biológica de la exposición frente al desenlace en sí, tengo algunas dificultades en esta. En el control de computadores, pues podríamos hablar de la fracción de exceso, que es la forma de más, más moderada de ella. Establecer la intervención interpretación de cuatro tes. Veamos a lo acabo la exposición En los expuestas tenemos unos que demos de aquí la incidencia en expuestos y lencia en expuestos.

00:25:06:29 Podemos observar que la encia en expuestas está como está parada sobre la incidencia en lo expuestos. Entonces la incidencia en expuestos en expuesto no me explica cuánto el desenlace se debe a la exposición, porque esta esta incidencia de expuestas. Esta es esta contemplando la incidencia el de los jueces es como elimino la incidencia en el expuestos y siendo una diferencia de yo le resto a la incidencia en expuestos.

00:25:36:01 La incidencia no es puestos y me va a dar origen al riesgo atribuible en expuesto. Esto es bastante importante porque a las de es el riesgo atribuible el que nos va a decir cuánto del desenlace se le puede atribuir a la exposición y por qué hay que hacer eso que representa la incidencia en no expuestos. La incidencia y no expuestas simplemente representa a incidencia por otras causas.

00:26:04:27 Recuerden que no hay nada úni causal, todo es multicausal y de alguna manera aquí estamos evaluando para poder evaluar yo el peso real de la exposición como causa, tengo que restarle el peso de las otras causas. Por eso debo hacer la diferencia. Incidencia en expuestas menos incidencia y no expuestas para yo es poder explicar cuánto el desenlace es atribuible a la exposición.

00:26:35:23 Cuando tenemos brotes, por ejemplo, tenemos un brote de de sarampión de una inmuno prevenible. Nosotros podríamos evaluar el por la eficacia de la vacuna a nivel comunitario. Esa eficacia la establecimos a través del riesgo atribuible a una aplicación de prueba atribuible. Cogemos los la incidencia en los no vacunados de sarampión, por ejemplo, y le restamos la incidencia en vacunados.

00:27:06:05 De ahí tenemos un riesgo en Después es el riesgo en respuesta es la exposición de la vacuna y entonces establecemos la eficacia de la vacuna, del riesgo atribuible. Puede ser que pueda aproximarnos a cómo se está comportando la eficacia de una vacuna en una región y podemos utilizar el brote para poder establecer esa eficacia comunitaria de esa vacuna a través de una aplicación de el riesgo atribuible.

00:27:47:13 También nosotros podemos comparar los no expuestos con el riesgo en la población. Si nosotros establecemos la diferencia entre el riesgo en la población y le restamos la incidencia en expuestos, entonces ya tendríamos el riesgo atribuible poblacional. Ya en cuanto de la exposición se le atribuye al comportamiento el desenlace de esta población, que es un indicador bastante importante, ya que el riesgo atribuible esto en expuestos es un indicador más de comportamiento individual.

00:28:16:24 Esta podría ser como más asociado a la. Es la efectividad de un tratamiento. La eficacia de un tratamiento al desempeño clínico al desempeño de una prestación de servicios de salud. Pero el riesgo atribuible poblacional vado ALUAR Es más, el comportamiento de un programa, de un proyecto, de un plan de una polic y a nivel comunitario, entonces podríamos comparar los no esfuerzos con el comportamiento de la población.

00:29:00:29 Si la En la población tenemos, por ejemplo, una prevalencia, un riesgo mayor, pues nuestro equipo atribuible poblacional va a ser mayor. Si es menor, pues vamos a tener un patrullen en los estudios de corte de en estudios transversales que nosotros podemos hay discusión final. Se dice que los estudios transversales no pueden establecer relaciones causales, pero dediquen bound y otros autores han establecido de más o menos de la década de los 70 que es probable que yo pueda establecer una relación causal a tal inicio transversal.

00:29:31:03 Pero debo cumplir unos criterios. Uno es que yo sepa que la exposición realmente me generó el desenlace y que la exposición es previa al desenlace. Es, es, es, es. Ese es un criterio. Y segundo, que la exposición no te modifique la supervivencia del del caso. Entonces esto ha hecho que de pronto se puedan establecer relaciones causales a través de estudios transversales.

00:30:08:23 Un ejemplo es, por ejemplo, un ejemplo sería la sobre expresiones por en card dos. Por ejemplo, la mutación de cerdos en es una mutación que parece que se puede adquirir en la concepción e durante el desarrollo embrionario o finalmente la persona nace con esa mutación en cerdos y el se puede sobre expresar quiere decir que la el gen mutado es leído en el una proteína, pero es tanta la cantidad de proteína que se puede evaluar en la membrana.

00:30:29:26 Por eso se habla de una sobre expresión Expresión es cuan de un años cuando se auto del Prat se ese marco de lectura y se produce por ejemplo en la proteína. Aquí se produce una suficiente cantidad para que ya pueda estar establecida en la membrana y a través de un en un esto química. Nosotros podemos evaluar si hay una sobre expresión de las dos.

00:31:05:00 Entonces en cáncer de mama, por ejemplo, se puede evaluar si hay una zona especial de cerdos. Entonces se evalúa en el tumor, se evalúa la sobre expresión del tumor. Entonces, si hay una sobre expresión, nosotros podemos asegurar que ese cáncer de mama se produjo por una mutación en cardos y. Y la paciente en este caso o el paciente barre cibir un tratamiento específico, un tratamiento target con relación a inhibir esa sobresaturación.

00:31:52:25 ¿Entonces, y como se hace eso? Se hace el paciente. La paciente tiene el tumor, se hace la extracción del tumor y sobre el tumor se evalúa. Entonces la sobre expresión, como pueden ver es una en la exposición el desenlace de esta hablando al cual vuelvo al tiempo y se aplica directamente el la la terapia, porque la evidencia establecido es una sobre expresión es previa al desenlace al en este caso el cáncer y por tener la mutación de GERD dos las personas no van a cambiar su supervivencia desde en este típico estudio de donde se dan estos de estas dos reglas podemos pensar en la relación causal En general.

00:32:26:09 Usted no tiene que demostrar para poder va a poder establecer una relación causal, pero se puede hacer estimaciones también para poder hacer sus hipótesis que otros estudios, por ejemplo, no de corte o un estudio de casos y controles, o un estudio experimental, puede entrar a evaluar. Bueno, test ahora sin más. Vamos entonces a a ver las las relaciones con una aplicación en start.

00:33:04:01 Pues aquí tenemos en este programa vamos a importar una base de datos, está en Excel, la vamos a llamar, está en la base de datos. Aquí debemos importar la primera fila del Excel, corresponde a los nombres de las variables. Debemos de aclararle eso a Stata. Simplemente hacemos clic y ya vemos que entonces si no tiene clic, miren que los nombres de las variables están ocupando la primera fila y cuando le importamos como nombres de las variables, ellos inmediatamente suben.

00:33:37:04 Es aquí ya la primera fila, tienen los datos de un sujeto de investigación, decimos que está bien y tenemos aquí las variables. Estas son las reales nombres de las variables y aquí están las etiquetas. Nosotros podemos cambiar esas etiquetas, por ejemplo, para los nombres de las etiquetas, el comando es bastante sencillo. Labels var el del nombre de la variable que tienes data.

00:34:12:06 Este es el nombre de al se HR y enfermedad coronaria es la etiqueta que le vamos a poner es corremos la etiqueta, corremos en el comando y aquí observamos que el nos nos hizo la modificación. Ya em esto también lo podemos correr para todas las demás variables, lo podemos, lo podemos al tiempo. Acá en este archivo duo, ese es un archivo du donde está el código que utilizamos para manipular las variables y para hacer los análisis.

00:34:41:18 Esto es bastante importante hoy en día. Muchas revistas le están poniendo a usted el código, el código que utilizó para el procesamiento de datos para la de su base de datos. No todas las bases de datos iniciales son las que uno realmente utiliza en el análisis, porque es posible que tenga que hacer modificaciones a la base de datos original y hacerle algún tipo de limpieza.

00:35:11:20 Y finalmente, usted tiene una base de datos limpia que la que va a la que va a hacer todas sus probadas hipótesis. ¿Entonces es este ese tipo de modificaciones? Usted tiene que dar evidencia de eso y la revista la están pidiendo. Pueden a usted la base de datos original, la base de datos depurada como usted llegó a la base de datos depurada, lo mejor es tener un código como en este caso y como hizo en los análisis.

00:35:52:27 Entonces ellos van a ver si lo que los datos que que tiene su base de datos con el código es consistente con los resultados que usted está presentando. Entonces es bastante importante tener esta precaución y aquí en este caso, nosotros, por ejemplo, podemos correr varias líneas de código para generar esas etiquetas. Bueno, en otro video ya explicamos la como se hace el paso a paso y querríamos también evaluar que para nosotros en algunos momentos, por ejemplo, veamos como se está comportando después en datos.

00:36:21:22 Aquí vamos a hacer un y variado. Ya sabemos que tenemos la etiqueta que reemplaza se accede, entonces esto es más informativo para nosotros, pero también querríamos cambiar, modificar los las variables, los valores de la variable del desenlace, pues vemos 538 que no se importaron y 71 que se impactaron en ese seguimiento de nueve años. ¿Entonces, cómo modificamos los valores de la variable?

00:37:09:09 Entonces ahí si necesitamos hacer dentro del línea de código tres, por ejemplo de si tenemos una variable e una variable que le definimos y la vamos a llamar a usted, la puede llamara, la puede llamar cuál puede llamar María, la puede llamar Manuel o Liliana se la puede llamar como quiera. En este caso yo la llamaría y ella me va almacenar un código que es que cero corresponde a local y uno es un caso que se le dice a primer línea el que tenemos almacenado ese código, luego ese código que se llama, que lo hemos llamado a través de la y volví entre lo vamos a relacionar con el desenlace de HD y como lo

00:37:42:05 hacemos con Label values se HD, que es la variable como realmente indicaba el desenlace y finalmente ahí le presentan. O sea que lo que hacemos es presentarle el código al desenlace y veamos que ocurre. Vamos acá nuevamente a nuestro esta tan donde aquí tenemos e podemos volver a repetir nuestra nuestro comando anterior y ya nos dice a 538 no son casos de enfermedad coronaria, es 71.

00:38:13:00 Si son casos de enfermedad coronaria de ya tenemos una tabla que es muy informativa para nosotros y nos permite hacer discusiones un poco más allá. En este caso son 609 fulanos que se siguieron todos por nueve años. Entonces el tiempo aquí es no es variable para los 609 y en ellos o en en el tiempo cero no había impactados, o sea, las personas por infartos.

00:38:40:12 ¿C No, no podían ingresar a esta corte porque precisamente lo que se quería evaluar en años, cuánto se importaban? Estos son 71 casos que se impactaron en el seguimiento de una población que se siguió que previamente no tenía impacto. Tres. Este 11.6 es una incidencia acumulada. Es esto establece un riesgo. ¿Cuál fue el riesgo de impacto en esa corte?

00:39:12:26 ¿Que es el riesgo? Es un dulce. No multiplicamos por 100 para tratar de interpretarlo más fácil para nosotros. Tenemos muchas dificultades por interpretar cosas por debajo de de de de uno en riesgo de es lo aproximamos a un porcentaje, multiplicamos multiplicamos el riesgo real que es punto 11% y tendríamos que ese porcentaje me representa la incidencia acumulada de infarto en nueve años de seguimiento.

00:39:47:00 Bueno, e igual, pues podemos hacer entonces la evaluación con las etiquetas para las otras. Las otras variables lo corremos y podemos ver que sucede, por ejemplo con en este caso la exposición de con láminas, vamos con CAD este vemos que estos 122 personas tiene un nivel alto de con lámina, un nivel anormalmente alto de café con láminas 487 tiene el nivel normal de Cate con láminas.

00:40:40:29 Entonces. Y también podemos establecer otras variables como se comportan. Por ejemplo el 63.5 fumaban. Siendo una proporción importante de fumadores, tenían un electro cardiograma anormal, el 27% tenían y este es el comportamiento uni variado de la edad. Aquí tenemos que la mínima fue 40 años, la edad máxima 76. Por acá podemos ubicar rápidamente e con el porcentaje acumulado podemos encontrar que la el primer cuartiles 40 y o sea podemos decir que el 27% tenían 46 años o menos, o que el primer parte va a ser 46.

00:41:25:06 La mediana estaría aquí. Uno es el 25 individuos, el uno es el 25 individuos. Se corresponderá a la división del 50% un lado y 50% al otro. Por eso del la media en adelante cualquier eran antepasados. Y este es el cuartel de 60 años. Desde la información que podemos tener de una tabla y variada para datos cuantitativos a nivel de razón, una variable, en este caso discreta también, pues podemos hacer lo mismo para colesterol y podía podrían ser contar uno.

00:42:10:10 Puedo yo sacar la información de varias variables estemos el un el descriptivo la nariz description diremos que atrás de presión sistólica presión diastólica colesterol y finalmente queríamos ver una información socioeconómica con esta variable. Entonces el 36% son de condición económica baja estrato medio 37% y altos el tremens casi el 22%, pues ahí tenemos el descriptivo. Hubo la análisis mejorado, esto que ya le hemos visto.

00:42:45:03 ¿Cómo pueden manipular estas variables cuantitativas y generar una modificación? Es que esto ya lo vimos la destacada. Vamos a evaluar alguna medida de tendencia central de esas variables cuantitativas. Por ejemplo, establecimos a través de suma el comando son el resume es un es el la polo formaría es mauris y el me dice la el resumen de la unidades de tendencia siempre dispersión muy a colesterol precio sistólica diastólica.

00:43:14:10 Observamos que el promedio es de la media aritmética o promedio. El 53 es de 53.7 años. El promedio de edad es 211. Dentro de colesterol 145. El promedio de presión sistólica y diastólica no entre y aquí están las la dispersión. Este sería la la desviación estándar. Aquí tenemos el rango recorrido entre el valor mínimo y el máximo de cada uno.

00:43:52:05 Los valores de las variables. Pero si yo a este mismo comando voy a repetir el comando eje que corresponde a la edad se HL, se BP y de BP con las variables que acabo de evaluar le hubiera generar una segunda de comando test, le sepárese a segunda línea con una coma y simplemente le corresponde de en este caso como segundo comando es la forma abreviada de detalle es miremos cuánto le pedimos.

00:44:35:10 Es la media de dispersión y tendencia central en detalle. Tenemos que tiene más información. Tenemos efectivamente la mediana, el primer cuartil, el tercer cuartil también tenemos el es la esquina, el apoptosis y e información a nivel porcentual. Por ejemplo, aquí podríamos decir que el 95% tiene 71 años o menos, o al contrario, el 5% tenía 71 años o más, según son interpretaciones que me puedo tener y ser importantes en algunos momentos para poder comprender el comportamiento, por ejemplo de los atípicos.

00:45:14:12 Los atípicos corresponden a datos reales ya, y ese es el grado en que esos atípicos, o sea que no son errores, son datos reales y muchas veces me explican el comportamiento. El desenlace, pues, es atípicos. Pueden ser por valores extremos muy altos o bajos. De esto me permite aquí establecer como este es con nivel de colesterol alto y por acá tengo presiones sistólica, baja o muy altas y en el tengo variabilidad importante en estas variables cuantitativas.

00:46:18:06 Bueno eh, como eso también puedo en este comando a este bueno, decimos yo puedo hacer una un ordenamiento desde aquí. En esa línea 37 vemos que esta ve de Ñemby, el Valle smog que tiene cada que el cigarrillo coma. Vamos a ordenar a E a al desenlace. Pues veamos esto. Esta línea de E tan sencilla veamos que nos reporte que lo que hicimos fue con esa orden, es que me ordenará el comportamiento del desenlace en no fumadores y fumadores está sencillo, es una sola línea de código y me permite a mí con datos descriptivos y evaluando en función de si hay una sucesión como puede ser en niveles de de la E.

00:46:57:00 La dirección de la relación entre da una variable y el desenlace. Observamos que en los que no fuman la frecuencia la la incidencia de acumulada de infarto es de siete 6% que en los fumadores es de 13,95% es Vamos, vamos. Podemos observar que el riesgo de infarto en fumadores es más alto que el no fumadores y miren, el código es baja y la variable que yo quiero se se haga la estratificación, en este caso de cigarrillo.

00:47:38:12 Yo ordeno la frecuencia de mi escenario. Esto lo puedo hacer sexo, lo pueda hacer por cualquier variable ocupación y lo pueda hacer por escolaridad, por municipio de origen, ciudades o divisiones territoriales que en me tenga yo interés en establecer una frecuencia y es una línea de código muy sencilla en mi SM SNK que en la variable que hay estadística repito coma porque viene un segundo o una segunda línea de comando que es XOR o de ME y me da el de en el variado.

00:48:37:07 Bueno, me ha sido muy útil este tipo de de de comandos para poder entender mis datos y como puedo ir dirigiendo mis probar hipótesis. Esta otra línea de comando es corresponde. Vamos a verlo acá en el Hola Corrin está ahora perdón, estoy con este grado, la misma ahora sí, desde aquí que que hicimos e hicimos tap en la exposición en desenlace y le dijimos que nos diera por sentar una información de ordenada.

00:49:04:04 Nos hicieron una prueba de hipótesis y ya veamos que como se nos representa esto. ¿Entonces tengo yo nivel de cate con láminas? Es que la exposición de recuerden que ya puede ser normal o puede ser anormal porque está alta. Y qué pasó en el cómo se comportó las cate con láminas en las personas que no tuvieron un paro desde aquí temas que son cuatro.

00:49:37:18 Si aquí está esta clave me dice que lo primero puede haber en la frecuencia absoluta. 443 Luego voy a ver el porcentaje por filas 50.97. O sea, eso quiere decir que den todos los que tienen el de cate con la mitad normales no, no tuvieron infarto el 90.27%. Esta es la columna por porcentaje. La tercera información que corresponde al 82% o intérpretes de todos los que nacieron.

00:50:13:07 Infarto de mi a nivel de catego, la mitad normales, el 82%. Y aquí tenemos el peso de la celda de los SE 443. Se denomina pues 609 tes es de la frecuencia relativa. Entonces ahí podemos ver una información que puede ser útil para yo entender que por ejemplo, como se está presentando las las frecuencias de del desenlace, ya sea tomando la variable o hablando por la exposición o a lo mejor el desvanecimiento.

00:50:50:13 Y aquí tenemos una prueba de chi cuadrado les para leche cuadrado. Esta es una prueba no paramétrica que va luego a diferencia de proporciones, la hipótesis nula es una proporción o no es igual a la proporción. Dos. Se hace una evaluación comparando los datos esperados con el observado. El tenía auto observado. El dato esperado sería el producto de 187 son este total solo son los marginales multiplicado a 387 sobre 538 y se dio el 609.

00:51:17:04 De ahí tendría yo el dato esperado en el computador, pues la máquina en este caso está haciendo toda esa, toda esa evaluación entre lo cerrado y esperado para poder darme después un valor de y decir que aquí hay una sucesión significativa entre el nivel de partículas y la enfermedad coronaria. Recuerden que para poder interpretar esto previamente debo establecer una hipótesis nula.

00:51:45:11 La hipótesis nula tiene una sintaxis. La exposición no está asociada al desenlace. Desde aquí decimos el nivel de cate con láminas no está asociada a la enfermedad coronaria, y lo que voy a rechazar es esa hipótesis nula. Esa hipótesis nula se rechaza cuando el valor de P es menor al máximo error tolerable que previamente hacia declarado por el investigador en general en Ciencias Médicas.

00:52:16:27 Definitivamente son e se establece por cultura porque en parte tienes por otra vez otra argumentación que la significancia es menor a 0,05. O sea, yo no puedo tolerar un error del 0,05 o más. Es cuando mi valor de P el mayor es 0,05. Yo no puedo encontrar rechaza la hipótesis nula. No tengo evidencia para decir que miel de café con láminas está asociada a la inclusión coronaria.

00:52:57:09 En este caso ofrecemos valor de P significativos auditora a 0,05 y podemos decir con esta evidencia que las cate con lámina en lugar de cate con láminas está asociada a la enfermedad coronaria. Es una forma también de de solicitarle a Stata para yo desarrollar la prueba hipótesis en esa La otra línea de comando lo que vamos a hacer es pedirles data que me des las medidas de la media aritmética, la ellos en estándar y las frecuencias de la edad en la relación cigarrillo e infarto.

00:53:29:06 Esta es la media de consumo de media edad de los que no consumen tabaco y no tienen parto. De aquí tenemos la media edad de los que no consumen tabaco y tienen infarto. Me gustaría aquí de los que consumen tabaco y no fue motivo de infarto su media 52 y los que consumen tabaco y tuvieron partes iguales. Bueno, si se perdería la dispersión y aquí tendríamos las frecuencias.

00:54:05:08 Es Scott. Es importante también para poder entender las como las relaciones que se pueden tener. En el caso de los fumadores, vemos que los fumadores son mayores, son mayores que los no fumadores. En el caso de los que pueden no perdón. Los fumadores de no fumadores son son más son mayores cuando alcanzan el infarto. Si de los jugadores se en la medida es de 61 para tener un infarto, mientras que los fumadores la de después cinco.

00:54:49:02 O sea que pareciera que fumar puede ser que el infarto sea más más tempranera. Pareciera habría que establecer la relación entre cigarrillo y enfermedad coronaria para poder estar seguros. ¿Bueno, vamos a vamos a pasar a a evaluar el el análisis probaría nuestra, pero al tipo de cáncer de vamos, vamos a hacerlo directamente acá creen queremos saber dentro de este cohortes cuál es la relación entre la exposición y el desenlace de la sintaxis?

00:55:22:05 Es que es una corte en el comal de c s de coco, está ahí, tiene el desenlace y luego la exposición. ¿Si fuera un cáncer que controles? Sería ese el desenlace y la exposición, que simplemente es un comando muy sencillo desenlace. Y la exposición es mire que aquí nosotros no hace más que preocupar quienes serán quienes sólo observen la de datos.

00:56:02:29 Eso esta si los que tienen infarto la valores cero, los que los que no tiene y parte cero los que tienen marco es uno. El valor en la exposición, los que no están después del valor es cero y los después el valor es uno. Esto es importante porque algunos programas usted le tiene que decir eso al computador. Aquí cuando yo le digo este data, este es mi desenlace y este la exposición, El me da la información en forma lógica, a lo peor van tres quienes tengo aquí.

00:56:46:18 71 caso, estoy harto de contar quienes tengo aquí. 122 expuestos a cigarrillo. No me a una tabla el que me pone aquí ceros y aquí unos no me pone ceros y aquí unos. Y entonces es muy importante porque si yo no un en algunas el otro software estadístico que no le que no entiende la relación, sé que es en exposición desenlace, te puede dar alterada esta tabla y aquí te pones a 443 o 27, porque primero es el cero y luego el uno entre quienes son cero.

00:57:12:03 Aquí los no casos estos de acá y quien es cero acá, los no expuestos desde aquí correspondería al que no tiene el desenlace y que no está expuesto. O sea 443. Y cuando ahora lo a las órdenes de sucesión, eso está al es, entonces está invertido, entonces es algo que es muy grave para la interpretación de los datos.

00:57:52:11 STATA Pues te permite esa reflexión causal, expresarla aquí y tus datos están siendo consistentes con reflexión causal. Test Tenemos 71 personas que se impactaron caso es aunque no se compartan suman 122 puede 187 Hola y que es 27 27 son de las personas impactadas que ocupaba 444. Son personas que se impactaron pero fumaba 95. Se apartaron pero no fumaba.

00:58:19:13 Aquí sí se impactaron pero no fumaba. Y aquí voy a tres. Pues 43. Ni fumaba ni se impactaron de quien es. Punto 22 es el cociente entre siete. ¿122 es este la incidencia en expuestos? Y me está diciendo que es un riesgo porque es una incidencia acumulada, o sea, el riesgo después dos es punto 22. Cuánto es el riesgo en después 2.09.

00:58:56:02 ¿Claramente la hice en expuestos es mayor que la incidencia en expuestos que quiere? Quiere decir esto que pareciera que tener la T con las altas me aumenta el riesgo de para luego vamos a la riesgo diferencia El riesgo de experiencia corresponde al riesgo atribuido es la incidencia en expuestos. Le voy a restar para después si la hipótesis nula fuera verdad, eso se debe sería cero, porque la hipótesis de una y de que la hice en expuestos no está asociada a.

00:59:30:20 La incidencia no expuestos, o sea, en la incidencia de infarto en fumadores está igual, es igual a la que hay parte de fumadores. Si, si eso fuera verdad, eso sería igual. Por lo tanto riesgo muy de cerca. Cero. ¿Qué me está diciendo acá? Me está diciendo que tengo un exceso de riesgo en los fumadores para evitar que el 13% si lo vamos a multiplicar por, 113% de los infartos son atribuibles a las cate colaterales.

01:00:08:03 Alta. Sí, 13% de las partes atribuidas a las cápsulas causales. Pero esa es una estimación puntual. Está acá. Entonces hace diez evaluaciones y me dicen el 95% de las veces como se comportó ese riesgo atribuible. Dice que de lo imposible se hizo una evaluación y me dijeron algo de confianza. En ese intervalo de confianza el tiempo atribuible fue el menor, fue del 5% y el mayor fue 20%.

01:01:00:23 Cree decir este estimador puntual me da aquí en esta dice un set de estos datos, pero que él puede oscilar un cinco 20%. Podemos observar que el límite inferior y el límite superior, los dos, superan el cero. Es aquí, con esta evaluación de ese sumador puntual éxito el valor de confianza, que ya puedo decir que no es Tecate con las dudas está asociado de parto, porque él nunca tuvo un valor de cero, un sí permanente, confianza siempre estuvo por encima de cero y que tener categorías de más altas me de riesgo en parte que el el entre el cinco al 20% los infartos son atribuibles a lo de particular Pascal.

01:01:26:01 También puedo sacar un cociente de estos riesgos y de incidencia en especies por el Sena expuestas y van a dar 2.44 y le calculo un intervalo de confianza. Puedo observar que en un intervalo de confianza el riesgo relativo nunca fue un uno, sería el valor nulo, porque recuerden que según la hipótesis nula, la incidencia después es igual a 20.

01:01:52:26 Después se calculó el tiempo atribuible. Uno. Ese sería el valor de el riesgo atribuible para una hipótesis sea verdadera. Observamos que el intervalo de confianza siempre fue superior, aún con e. Este es otro y ese que me dice que el nivel de café con láminas está asociado a un infarto y que es un factor de riesgo tener un nivel de alto hepático de láminas para infarto.

01:02:48:22 ¿Ahora, qué sucedería con la eficacia de la intervención médica? Por ejemplo, tengo una persona que tiene un nivel alto de articulación y luego cambio a lo paso expuesto a lo expuesto cuando esa prestación del servicio de salud logra modificar esa exposición, entonces vamos a a reducir el riesgo del desenlace, debido a que si nosotros logramos por intervención médica o psicoterapéutica, o cualquier intervención de la prestación de servicios de salud y logramos que estos supuestos dejen de estar expuestos a ser algo expuestos, vamos a reducirle el riesgo el desenlace de 50% y también de cálculo, está a un intervalo de confianza.

01:03:22:15 Dice que se reduce el riesgo. Va a ser entre un 26 a 1 73%. En el caso de que yo pudiera tener un programa, un plan, una política y yo pudiera hacer que población aumente, es que a través de intervenciones comunitarias nosotros pudiéramos pasar los esfuerzos largo después, a través de ese plan, un programa o una política, vamos a reducir el riesgo poblacional.

01:03:57:25 22% de infarto y de la población. Y aquí tenemos el valor de P e hice la asociación. Pueden ver que esta tabla es bastante informativa y me permite no solamente la relación entre la exposición y el desenlace, sino como en la dirección de la asociación. Vamos a evaluar cigarrillo y el impacto y aquí podemos observar que también está asociado el hábito tabaquismo con infarto.

01:04:28:06 También tenemos inicia en expuestos al tabaco mayor de infarto con relación a los que no fumar. Tenemos un riesgo atribuible IT y vemos también que el riesgo de no paso por el valor nulo. O sea que es consistente con que haya sucesión, pero el hábito tabaquismo y el parque y que el e el cigarrillo en el entre uno al 11% los infartos son atribuibles al hábito tabaco.

01:04:58:12 Que fumar es un factor de riesgo que es exceso de riesgo. La acción de 8% a tres veces más. Y que si yo puedo hacer tengo una clínica de cesación de consumo de tabaco y fumando a esa clínica los fumadores y fumadores dejan de fumar. Se va a reducir el riesgo y parte del 45% y que eso puede ser que esa clínica sea tan efectiva que reduce el riesgo y parten de 17A1 67%.

01:05:35:06 Si yo hago un programa comunitario, una política para que los que no fuman nunca fumen y ellos nunca fuman, entonces puedo hacer que ese es el riesgo y parte donde esa población se reduzca en un 34% de este, una asociación entre cigarrillo, infarto. ¿Y tengo una asociación Tecate con las niñas que parto clínicamente, podemos ver que la eficacia para infarto es Si yo pudiera hacer una intervención clínica, cuál puedo hacer?

01:05:59:15 Hago un control de cate con láminas o hago un control del consumo de tabaco en el consumo de tabaco, donde tendría más éxito, tendría más éxito en la reducción de riesgos de infarto por la el control de CATE con láminas. ¿Pero dónde tendríamos nosotros un impacto comunitario más alto? Tendríamos un impacto dado más alto con la asistencia de consumo de tabaco.

01:06:46:13 Entonces, de esta manera podríamos tener una evidencia que nos orienta a intervenciones clínicas y comunitarias más claras con base en la evidencia. Y es una línea de comandos muy sencilla. También podríamos empezar a pensar si exposiciones cate colaterales y es de este infarto que eso se guía si ya ajustar el consumo de cigarrillo, porque el cigarrillo aquí que como está actuando en la relación de cate con ansiedad que parto, el debe estar actuando, puede ser un confesor o puede generar tremenda interacción, pero sólo después quiero dejar allí y más bien pasar a las preguntas.

01:07:13:24 No sé si hay alguna pregunta. Hola, doctor William. Gracias. Bueno, nos han estaban viendo algunas preguntas. Erika te manos apoyado. He dando algunas respuestas vía chat, tenemos una por acá que se la voy a leer en este momento en un estudio transversal que proviene de una encuesta con diseño muestral. Cuál es el. ¿Cuál es la diferencia de usar?

01:07:50:17 ¿Razones de prevalencia y odds Ratio? Muy buena esa pregunta, pues realmente en términos prácticos no a encontrar diferencias, no a encontrar diferencia básicamente cuando se está hablando de eso de mencio transversal, de las características que se mencionan y estoy pensando no hay sesgo, no hay neutro, no hay el los los elementos de de de recolección de datos son válidos de entender a tener el mismo valor.

01:08:21:24 Tanto la razón de prevalencias como el o el. La dificultad la tienen si lo comparo con riesgo relativo, ahí sí habría una dificultad, porque en forma general los dos van a tener una fuerza a su yo hablando de la razón de prevalencias o el o R van a tener una fuerza de asociación mayor que el que el riesgo relativo.

01:08:56:00 Ese es la dificultad que tenemos cuando usamos o eres o razones de prevalencia. ¿Gracias doctor William nos pregunta que significa el comando CS perfecto? CS es una forma abreviada de yo expresarles data que tengo. El estudio de Cort Court Estadio y CCE es casco dentro. Entonces por eso para casos y controles el comando sería CSE para estudios de corte.

01:09:58:18 ¿El comando sería C y puedo utilizar cc parecidos transversales o que diferencia entre perdóneme? La diferencia entre confusión e interacción desde el punto de vista epidemiológico versus bio estadístico, que es una discusión bastante importante, llamativa, bonita y útil. El confuso pues será porque la relaciones que estamos evaluando cuando hacemos un bi variado. Mire, cuando estamos evaluando catego, láminas e infarto, estamos prácticamente poniendo como única causa del desenlace las cate con láminas y cuando vemos cigarrillo e infarto estamos haciendo lo mismo, poniendo como única causal de de infarto el cigarrillo.

01:10:34:23 Pero las dos están asociadas, asociadas una que yo no pueda ignorar eso. Yo creo que hay una relación mínimo en la rela. Si yo establece la relación KT con láminas infarto de evaluar cómo afecta el cigarrillo la relación KT con láminas de infarto, entonces sí es Entonces me lleva a que primero yo al ver si sí es un confesor, el cómo usarlo evalúa mucho en cuánto se modifica, en cuánto me modifica el Infarto La fuerza Asociación Esta es la fuerza.

01:10:59:25 Acusación cruda dos 44 El a fuerzas entre cate con el nace y partos. Pero la relación bi variará si yo ajusto esta relación cate con hermanas de infarto y lo ajusto por el consumo de cigarrillo. En cuanto me se me modifica esta fuerza sucesión. Puede ser que esa fuerza desviación sexual puede ser quizá por asociación se me baje.

01:11:46:24 Entonces, si eso sucede, Tina me está diciendo que sea ese El cigarrillo confunde la relación de Cate para dominarse infarto que la fuerza de nuestros 44. Sino que la fuerza es la ajustada cuando tengo 44. Es la relación solamente de Cate con láminas de infarto. Si yo establezco una fuerza sucesión de cate con lo en ese impacto y tengo en cuenta el peso de cigarrillo y esa fuerza asociación se me baja o se me sube, ya no sería la fuerza 644, sino la ajustada, porque peso en forma importante en la relación de Cate.

01:12:22:14 Para mí se pacto. No sé si está claro donde veo la confusión en las relación de las fuerzas, cómo se comportará puerta a sucesión y, cuánta distancia entre el ajustado y el crudo. Algunos autores toleran esa relación más o más o menos tolerantes. Unos dicen yo no tolerar una diferencia mayor al 10%, otro dice no al 15%. No hay evidencia científica para decirles de cos al diez o el 15% de solo decir usted.

01:12:49:27 Y entonces, si esa fuerza sucesión el mayo, esa diferencia es mayor al diez por por ejemplo, entonces yo digo que el cigarrillo es uno como ser y veo hacer otro modelo donde yo pueda evaluar las cate con láminas, con infarto, pero debo meter en el modelo el se consume cigarrillo y no lleva más al modelo multi variado, se arma.

01:13:39:27 Una de las posibilidades del modelo multi variado es que me permite establecer el peso de los conductores en la relación entre la suerte y el desbalance. ¿Ok, acá tenemos otra consulta, hemos visto relación de variables, pero si quiero buscar el impacto de dejar de fumar en una persona, cómo se realizaría? Yo creo que estaría tam en el riesgo atribuible en expuestos aquí es es indicador, ese es muy importante, ese es un aporte importante stata que nos permita hacer los cálculos de la fraccional y después aquí ese seria el impacto de qué sucedería si yo, el que el que fuma, lo vuelvo no fumador por una intervención terapéutica.

01:14:29:19 Por ejemplo, tengo una clínica y se sostiene con consecuente, como es buena, que esa clínica es decisión de consumo el tabaco, los fumadores dejan de fumar. ¿Entonces, qué paso con? El des. El riesgo de infarto se reduce en el 45%. Es esa. Así interpretaremos. Esto sería la. Es la persona que me lanzo en expuesto. Sería como el impacto a nivel individual que haría el ejercicio clínico o el ejercicio a la prestación de servicio de salud y la fracción atribuible por poblacional sí sería como más el impacto de un programa algo político es aquí tendríamos que decir después que em cuando reporto medias y cuando medianas, qué pruebas puedo usar para diferencia de medias y diferencias

01:15:00:11 ¿de medianas? Perfecto. Si por el tiempo no pudimos abordar esa parte de relacionar, por ejemplo la edad y el infarto, por ejemplo, primero tengo que establecer una si mi variable cuantitativa, en este caso la edad se distribuye normal, aquí lo podemos hacer y el comando es bastante sencillo. Ese Wilk es que me dice ahí en ese build, es la prueba de Shapiro Wild para la variable edad test.

01:15:30:23 La hipótesis nula, la que no tengo un dos variables en una sola de la la hipótesis helena chapero will es la edad se destruye normal. Desde aquí tenemos un valor de P de la Shapiro vuelve seis es menor a con 0,00 menor a 0,05. O sea, yo debo rechazar la hipótesis nula como mi hipótesis nula la edad seis lo de normal, debo concluir que mi edad no se distribuye normal desde en este caso en una relación.

01:15:59:26 Ello no podría utilizar la media para establecer una asociación con el desenlace, porque la media en distribuciones no normales en distribu en otro tipo de distribuciones diferentes a la normal, ella es sesgada. Es de acusarme por una prueba de que mediana con si una prueba o una prueba de signos o una prueba Wilkerson o una prueba de rangos, esa se puede.

01:16:36:19 Ese como lo más indicado es cuando utilizó yo una diferencia de de de medias. Cuando mi variable cuantitativa se distribuye normal. O sea que al aplicarla el valor de pese a mayor a 0,05 años rechazaría la hipótesis nula y podría hacer una prueba por de Student que establece una evidencia de de medias tiene aquí el comando sería types de tests si mide y tendría que tener otro supuesto que es la distribución.

01:17:15:04 La omo se asiste a las varianzas. Eso se puede hacer también en stata. La confirmación de si me varianzas son homogéneas, entonces las pruebas T de Student Anova exige que mi variable cuantitativa se distribuya normal y las varianza sean de mujeres esas pruebas Test y Anova. Anova se hace Es cuando tengo más de dos categorías. En la C, por ejemplo, tengo una hipertensión, la tensión arterial es normal, tengo hipertens

El desafío de las pruebas de hipótesis y el poder de Stata para análisis en salud


Un objetivo de los análisis descriptivos es la posibilidad de relacionar variables y ver su comportamiento. Al realizar este procedimiento se da paso a la formulación de hipótesis, las cuales se deben analizar bajo el rigor de los supuestos que se deben cumplir. Stata pone a disposición de los usuarios herramientas que facilitan la ejecución de estas pruebas así como su manejo en escenarios paramétricos y no paramétricos. En esta presentación, se abordarán de forma práctica los distintas posibilidades con las que cuenta Stata para el trabajo con pruebas de hipótesis, así como los aspectos que se deben tener en cuenta para una adecuada interpretación.



Etiquetas relacionadas

  • Análisis Descriptivo
  • Metodología
  • Software

¡Comparte este video con tus colegas!

Compartir

Ver más

Cotizar
Próximos
Eventos

X

Mis cotizaciones:

Comentarios a tu solicitud:

Cotizar