Autor: Dr. José William Martínez / Portafolio: Quantitative / Vie. 02 de Jun de 2023

Transcripción de este video

(Transcripción automatizada sin revisión humana)

00:00:45:11 Software Shop, la empresa líder en la implementación de herramientas analíticas y software especializado en Latinoamérica, les da la bienvenida a esta presentación. El día de hoy contamos con el acompañamiento del instructor doctor José Wilda Martínez, médico Doctor en Epidemiología Académico de la Universidad Tecnológica de Pereira, epidemiólogo de Oncólogos de Occidente, miembro de la Sala de Análisis de Riesgo de la Secretaría Departamental de Salud de Risaralda, tutor del FED en el Instituto Nacional de Salud, con más de 20 años de experiencia en temas de investigación, de análisis de riesgo para enfermedades, de interés en salud pública, evaluación de pruebas diagnósticas e intervenciones comunitarias.

00:01:20:09 Bienvenidos. Bueno, es muy importante en los procesos de investigación en salud que nosotros tengamos como investigadores, no mucho control en términos de lo que es la recolección de información y la coherencia que vamos a tener entre este, esos procedimientos en los que ya sea en el laboratorio o en las comunidades para poder que tengamos coherencia entre lo que el protocolo planteó y los datos que vamos a tener y vamos a precisar en esta.

00:02:02:29 Entonces vamos a ver que es muy importante. El en el es este alta para nosotros porque nos facilita el proceso de de comprensión de, de muchas salidas estadísticas que nos permite. Es más fácil la la la interpretación debido que le pedimos a stata las cosas que necesitamos y el nos reportaría la información que necesitamos y no otra. Pero es muy importante antes de ese procedimiento, que nosotros tengamos una adecuada administración y gestión de datos que veremos algo conceptual ahora y dentro de este.

00:02:43:23 Dentro de estos elementos pues vamos a ver una aplicación de Stata, un disfuncionalidades y posteriormente pues entraríamos a a resolver sus preguntas. Entonces la estadística pues es esencial al todo para todos los profesionales de ciencias de la salud, porque no solamente vamos a ver resultados, vamos a identificar comportamientos extraños de algunas variables, vamos a poder evaluar la calidad de nuestros instrumentos de recolección de información, así como vamos a conectar datos que de pronto no son de esta área pero que son muy afines al tema que estamos tratando.

00:03:15:10 Por ejemplo, en algún momento necesitamos información molecular y esa información molecular es relevante para procesos no solamente diagnósticos sino terapéuticos o para poder comprender el comportamiento de nuestros desenlaces. Y así mismo muchas veces queremos vamos a tener de parte de muchos evaluadores o de mucha, o en algunos congresos nos van a entrar a cuestionar si lo que nosotros tenemos como desenlace es adecuado.

00:03:47:22 Entonces es muy importante en este proceso de recolección de información, de análisis, de datos, que nosotros tengamos en cuenta que esta tasa no es únicamente para la, EH, la lectura de medidas de tendencia central y para de hipótesis. Sino el apoyo para la gestión de datos. Entonces. Básicamente es importante en esta gestión de datos tener claro que muchas veces necesitamos también bibliografía.

00:04:28:07 O sea, ahí muchas veces requerimos saber de cuál es el comportamiento esperado de las variables. Y ese comportamiento esperado de las variables, pues debe ser totalmente documentado. Es un entonces esa, esa documentación va a ser referencias bibliográficas. E Nosotros podemos tener el apoyo estatal para la validación de los instrumentos. Así mismo, como stata en los procesos descriptivos no necesariamente, pues vamos a mirar inicial metania desde el inicio central.

00:05:03:11 Ahorita vemos algo con la depuración de la base de datos e también en el en el proceso de hipótesis, ya que hemos en estudio transversal, pues desearíamos r hacer recomendaciones y recomendaciones van a ser establecidas a través de hipótesis que otros estudios causales van a confirmar. Y es importante también en nuestras pruebas de hipótesis, pues evaluar los supuestos de estas pruebas de hipótesis para poder que tengamos claridad de su validación estatal.

00:05:46:11 También nos ofertar opciones de tener datos en gráficos que pueden ser muy fácilmente e insertados o adheridos a a a documentos de hojas o de cumentos de pequeñas que van a ser posible enviar para publicar o para presentar en congresos. Entonces, en el análisis de datos, pues nosotros vamos a hacer este análisis de datos muy orientados a los objetivos del proyecto de investigación, muy coherentes con una metodología que nos permite entrar a entender por qué los datos se están comportando de la manera que estamos observando.

00:06:19:04 Tenemos que tener bibliografía y por supuesto, en estos momentos algunas revistas te van a pedir, sobre todo revistas de un único uno de alto factor de impacto. Te van a pedir cuáles son los códigos que usaste para el procesamiento de la base de datos, la limpieza de la base de datos y también para la matriz de datos, es decir, todo mundo está muy, muy interesado en que todos los procesos que nosotros tengamos sean replicables.

00:07:01:14 Y esa réplica del iPad, la hacemos a través de códigos, de los códigos en esta, a través de los archivos, que son bastante sencillos, como lo vamos a ver, a pesar de que tengamos unos datos muy relevante, es una información bastante importante. Podemos observar que vamos a observar que esos códigos son sencillos, generalmente el el proceso de ver ciencias de la salud tiene una distancia con respecto a los códigos, porque no hemos sido entrenados en ello, no hemos tenido información acerca de ello, pero vamos a observar que es realmente códigos bastante sencillos que no tenemos que aprenderlo, pero que con el uso frecuente terminamos haciendo de forma automática.

00:07:33:11 El objetivo del análisis, entonces, es tener claro que el ejercicio es un ejercicio de medición. Tenemos que estimar los efectos, pero antes de eso, después de estimar ese efecto, nos tenemos que preguntar acerca de la validez de esa estimación, que sensibilidad y especificidad tenemos en esa estimación, que precisión tenemos en esa estimación? Cuánta dispersión tiene nuestra estimación? Mide que uno es uno en una prueba hipótesis lo que inicialmente necesitamos.

00:08:07:02 Este es un análisis más cuantitativo, más que cualitativo, pero es bastante relevante. Entonces, para poder nosotros tener claridad acerca de la validación de la validez, deben ser mediciones. Tenemos que pensar siempre en que nuestros datos deben pasar por una edición. Esa edición consiste en que nosotros podamos evaluar la coherencia que tiene nuestro muestra. La respuestas que obtenemos de laboratorio, las respuestas que obtenemos en las poblaciones consultadas con las preguntas que estamos haciendo.

00:09:00:12 Es esa esa evaluación se requiere para poder decir uno. Tengo una base de datos con calidad, además de muy probablemente ni siquiera necesitemos confirmar que nuestras variables son coherentes. Si tengo una información en una variable, probablemente tenemos más o menos claro como puede ser el comportamiento de otra variable o en otras ocasiones. Nosotros en los procesos de investigación, en la elaboración del protocolo de investigación, pues nosotros podemos establecer que nuestros datos, por ejemplo, la edad, la edad es una variable, razón de ser, una variable cuantitativa, pero en el proceso de edición observamos que tenemos un grupo muy importante de concentración de datos por encima de los 80 años o menores de 15, y que nuestra

00:09:32:23 variable que inicialmente era de razón, fue no hacer eso y no va no a tener ese comportamiento. Lo las frecuencias de entre las KT, las valores de cada variable son muy pocas y debemos por ejemplo, generar una variable categórica o una variable ordinal. Después de ese proceso de edición, donde ya tenemos una base de datos limpia, donde estamos seguros de que no hay errores de digitación, que hay consistencia entre los datos limitados y los y la recolección de datos.

00:10:01:10 Pues tenemos que empezar a resumir esos datos y tener que y tenemos que tomar decisiones. Los vamos a resumir en tablas, en gráficos, vamos a hacer una descripción de esos datos. Esto es muy importante, sobre todo para cuando vamos a hacer un artículo, pues no vamos a movernos más en tablas y de descripción de los datos que graficas a lo sumo nos permitirán una o dos gráficas.

00:10:42:08 Es un artículo para publicar en una revista científica en forma diferente. Si vamos a hacer nosotros una presentación en un congreso, pues vamos a apelar más a gráficas y vamos a tener mucho menos datos descriptivos como de esto. Entonces, estas son decisiones que podemos tomar para una ocasión o para otra, y esta etapa nos puede apoyar para que esto quede mucho más claro y mucho más entendible para la comunidad a la cual nos vamos a a expresar e vamos a estimar medidas epidemiológicas de interés, vamos a calcular incidencias, vamos a calcular prevalencias, pero también limitamos calcular intervalos de confianza.

00:10:42:18 -

00:11:09:28 Desconocido Esto es, intervalos de confianza no son únicamente para medias. Podemos calcular intervalos de confianza para mediana tenemos que calcular. Se puede calcular intervalo de confianza para proporciones. Estas estimaciones son bastante importantes y luego pues la interpretación de los análisis descriptivos, es decir, esas estimaciones que hicimos a nivel epidemiológico, como se comportan al interior de otras variables, es dar una descripción de eso.

00:11:40:11 Por ejemplo, cómo se comporta eso, esa incidencia o esa prevalencia en función de la edad, en grupo, en función del sexo, en función de algunas comunidades que que hemos encuestado y podemos observar que a pesar de que nosotros hayamos seleccionado un un municipio o una ciudad y hemos hecho algún proceso de selección aleatorio, podemos llegar a la conclusión de que el nuestra muestra tenemos diferentes comunidades.

00:12:16:21 Las comunidades no se, no tienen un patrón y no necesariamente es geográfico o político administrativo, puede tener un patrón más cultural y entonces eso lo podemos observar en los datos cuando, cuando evaluamos nuestras incidencias de prevalencias en función de diferentes contextos culturales, entonces de esa manera, al entender esa descripción, podemos hacer una interpretación mucho más adecuada y mucho más rica para otros procesos que tiene la investigación.

00:12:48:12 En ese sentido, nosotros entonces tenemos que tener claro que no inicialmente la prueba hipótesis es lo que es lo más importante a veces no es, no tenemos como objetivo hacer una prueba de hipótesis, no está en los objetivos de nuestro proyecto de investigación y en otras ocasiones no hay ni siquiera necesaria para publicar los resultados. A veces incluso hasta nos complica los análisis, no aporta nada, es información, además que nos confunde un poco o mucho.

00:13:22:28 Sin embargo, es un concepto muy arraigado, por lo menos en lo que yo observo en mi medio, que los investigadores estén pensando siempre en que si no tienen un valor BP no tienen importancia, sus datos no tienen aporte. Entonces el proceso de medición es un proceso complejo y es un proceso que, por ejemplo, puede servir para el proceso de toma de decisiones en empresa o de servicios de salud en un en un e, en una persona que haga política pública en salud o en un sistema local de salud.

00:13:55:20 Entonces ese proceso de medición es muy importante para ellos, para poder que con nuestros datos sean nuestros datos, la evidencia para ellos orientar su proceso de toma de decisiones. Y en ese sentido entonces nosotros podemos pensar cuál es el parámetro objeto de ellos, como estimarlo y como evaluar su variabilidad con intervalos de confianza, además de entender como ese interpreta estimador puede variar en diferentes condiciones demográficas, culturales o de de prestación de servicios.

00:14:25:28 También la estimación es no solamente el estimador puntual. Se requiere una evaluación de dispersión. Esa evaluación de dispersión pues va, va a ser, va a variar dependiendo del comportamiento. Es el variable, el comportamiento descriptivo. Podemos calcular intervalos de confianza, por ejemplo para proporciones, para medias o para medianas. Y con esos intervalos de confianza no es concluir acerca de la precisión de de nuestro estimador.

00:14:56:06 Cuánta es este? Esta precisión está muy en función del error aleatorio. Es importante también que nosotros en el proceso de análisis de datos, tengamos unas buenas prácticas de los mismos. Esto lo hemos adaptado de de ser riguroso proceso, buenas prácticas clínicas que tienen los ensayos clínicos. Entonces cuando vamos a hacer el análisis de los datos, no que ya tenemos un dou, un du que probablemente surgió cuando hicimos una prueba piloto.

00:15:22:23 La prueba piloto no necesariamente es únicamente para entrenar encuestadores. Eso puede ser una muy buena opción o para estandarizar una prueba en laboratorio. Eso también se ha de hacer, pero muchas veces también con eso los datos que se hallen a prueba de la prueba piloto, nosotros podemos pensar en como armar nuestro archivo, lo que podemos empezar para tener, para empezar nuestros análisis.

00:15:50:11 Es más sencillo hacer un duo con poquita información para luego hacer un dump que vamos a aplicar a un grandes cantidades de datos. También es es muy importante esos datos de la prueba piloto para que nosotros empecemos a estudiar eso. Cómo lo analizan otros investigadores? Como es el comportamiento local en que nos parecemos, en que, en que somos distintos a otras publicaciones.

00:16:26:09 Entonces la es importante la revisión bibliográfica. En este. En este momento. Para hacer un esperar a tener una mayor comprensión de cómo interpreta los datos. Los otros investigadores y tener nosotros en la interpretación una evidencia también científica en términos de la aplicación. No es únicamente interpretarlo porque tenga un comportamiento estadístico matemático, no es interpretarlo en función de un tema aplicado, como lo ve un cardiólogo, como lo observa un internista, como lo observa un salud jurista u otro epidemiólogo.

00:16:34:04 Entonces es esa familiarización, requiere de información, de evidencias que debemos aún ajustar.

00:17:06:14 Es también una muy buena práctica. Si tengo trabajo de campo y inspirados en lo que hace el laboratorio, el laboratorio tiene generalmente un diario de laboratorio. En ese diario de laboratorio ellos colocan variables que son relevantes en los ensayos que hacen. Por ejemplo, hubo cortes de energía o un instrumento. Pareciera que está tomando. He dando reportes que que no son muy consistentes, muy coherentes.

00:17:38:03 Esta información se anota y esa información es vital para luego hacer la interpretación de un dato que puede estar asociado a un sesgo, a una mala clasificación o a un comportamiento de nuestro instrumentos. En esto mismo se puede hacer en terreno y podemos tener también una bitácora o un diario de campo donde nos puedan podamos informar. Por ejemplo, hubo muchas lluvias o hemos hecho una un protocolo de investigación para evaluar una prevalencia?

00:18:06:26 Y cuando vamos a la comunidad no está esta información que voy a comentar. Pues esto nos pasó, por ejemplo, hubo mucha migración de esa comunidad y entonces las prevalencias pues se alteraron con esa migración. Si yo no tengo esto en mi diario de campo, no tengo como la evidencia para soportar esta información. Entonces yo voy a tomar un voy a concluir sobre una prevalencia que tiene un comportamiento distinto.

00:18:40:05 Entonces en las comunidades les comunidades son bastante dinámicas, sobre todo las comunidades en América Latina, donde las poblaciones se pueden, pueden migrar de barrio a barrio, de ciudad ciudad o de país a país. Entonces es importante tener diarios de campo que nos permita recoger información que no está en nuestro proceso de de nuestros instrumentos de recolección de información, pero que son relevantes en el momento de explicar el comportamiento de variables de interés.

00:19:26:07 Asimismo, bueno, hay algunos programas donde el el cero y el uno en la exposición y el desenlace le pueden generar una mala jugada con respecto a esos programas. Entonces uno tiene una tabla de dos por dos donde A corresponde al expuesto con el desenlace. Entonces la la primer celda arriba a la izquierda corresponde a los expuestos con el desenlace, o sea a los que tiene uno expuesto, tiene uno como valor y desenlace, tiene uno como valor, no es puesto, tiene cero como valor y sin el desenlace es un cero sin valor, pues algunos programas para ellos primero es el cero y para otro y no el uno.

00:19:53:12 Entonces lo que tú crees que estás viendo como expuesto con el desenlace, realmente corresponde al que no está expuesto, que no tiene desenlace y puede llegar a tener resultados que son difíciles de interpretar con estática. Esto no sucede porque con esta acá declaramos quién es la exposición, quién es el desenlace y y no lo tenemos que hacer. Pero es importante que ustedes consideren esta limitación de otros programas.

00:20:23:09 También es una práctica importante que muestre bases de datos originales, que tengamos copias de seguridad y cada vez que la muestra formando pues tener la copia de esa transformación y asociada al código que hizo la transformación porque no las cuente. Vamos entonces con un ejemplo de aplicación, existe el análisis multi variante. Miren que multi variante no es un análisis de multi variado.

00:20:54:06 La diferencia entre multi variante y multi variado es que en el análisis multi variante yo no tengo un desenlace. En el multi variado si entonces se considera el análisis multi variante como una un aprendizaje no supervisado, no hay un desenlace, mientras que el multi variado si es un aprendizaje que supervisado, eso en el lenguaje del machine learning, entonces el anali de componentes principales es una técnica para transformar las variables originales.

00:21:40:11 Podemos observar que algunas de esas variables pueden tener una alta correlación entre sí, y entonces esas variables correlacionadas del modo de que yo voy a ser la suma, puede ser que me de información redundante y me lleve a a valores que no son, que no son ajustados. Entonces es de esas variables, de ese procedimiento de de componentes, por ejemplo, el plan el analista de componentes principales, que es un tipo de análisis multi variantes, van a evaluar de esas de las correlaciones y nos va a generar otras otras variables que son denominadas como componentes principales, cuya característica es que cada componente es linealmente independiente.

00:22:10:17 El otro, o sea, la correlación es cero. Entonces de esta manera resolvemos un problema que originalmente se necesita para que se nos está presentando en nuestra nariz. Descriptivo Este es pues otro tipo anali descriptivo cada componente de del anali de componentes principales, una combinación lineal de todas las variables y tiene información, o sea, cada una de las variables de interés que ponemos en el instrumento está contribuyendo a la definición de cada componente.

00:22:40:01 Entonces, en la información con explicado contenida por cada componente, también el anali de componentes principales nos da una varianza. Esa varias se la debemos interpretar como la explicación de ese componente en función de otra variable. A veces debemos nosotros una serie de preguntas que realmente están preguntando, una cosa diferente a lo que estamos recolectando en como sucede con las escalas.

00:23:16:00 O sea, tenemos una serie de preguntas que nos llevan a explicar, por ejemplo, el desenlace, pero usamos muchas veces esas escalas. Esas escalas pueden estar validadas en otros contextos culturales, pero es necesario hacerlo en nuestros contextos y para darle mayor valor a una información que estamos recogiendo, que corresponden de ese enlace, pero que no tenemos una prueba de laboratorio que la confirme, no tenemos la señal electro fisiológica o una señal fisiológica que nos establezca que estamos siendo consistentes con ella.

00:23:42:09 Entonces es una forma de darle más valor a variables que realmente estamos buscando. Y esas variables que están contenidas en el con el grupo de variables que hacen parte del instrumento, generalmente se llaman variables latentes. Vamos a mirar entonces qué sucede con el análisis de componentes principales? Aquí tengo la variable x uno y la variable x dos y meses.

00:24:12:21 Y básicamente estas dos variables contribuyen con su correlación a formar el componente uno de este componente uno tiene información asociada AX1 y x dos, pero también puedo hacer una rotación de los de las variables para que e una vez rota esa rotación me genere un componente que es linealmente independiente del componente dos que e y es información tiene con información.

00:24:47:08 Ese componente dos tiene información tanto x uno como x dos. Pero hubo otra información es este componente de dos me va a dar una varianza explicada dentro de esta variable latente en general de menor cantidad que componente uno. Y así vamos haciendo con cada uno de los componentes. Entonces pasamos, ahorita vamos a observar nuestro ejemplo. Primero les voy a presentar la base de datos que tengo acá, este es un son datos nuestras donde nosotros.

00:25:25:25 Bueno, en estos momentos el país pasa por una situación difícil con respecto a la notificación de tentativa de suicidio, entonces nosotros la tentativa de suicidio, eso es. Es un problema de interés. Y donde debe ser atendido el sujeto? Pues por el psiquiatra y el psicólogo clínico, pero también podemos nosotros como el de la epidemiología entrar no se a a entrar a apoyar ese proceso a la atención con la selección de personas que en este caso son adolescentes que puedan tener la ideación suicida.

00:26:11:11 Ellos no, no han hecho un gesto suicida, no han tenido una tentativa de suicidio. Pero cómo captar aquellos que lo estén pensando? Entonces está esta última variable. Piense en su muerte. Es nuestro. Esta es nuestro gol estándar. Es. Miremos que lo que le vamos a preguntar a los sujetos, vamos a ver si ellos tienen, por ejemplo, están desinteresados, manifiestan poco interés académico, poco interés por las cosas, se observa decaído, tiene dificultad para dormir, se siente cansado, se siente sin apetito, mal consigo mismo, tiene dificultad para concentrarse, se siente que habla lento, piensa lento.

00:26:59:29 Nunca le vamos a preguntar a los sujetos acerca de si está pensando en matarse o si si tiene, pues ideas de suicidio, de ideas suicidas. Entonces, con esas preguntas que nosotros queremos saber y tenemos una variable latente que sería la ideación suicida, es eso lo que vamos a a establecer acá? Es esta es nuestra base de datos y entonces vamos a ver nuestro código primero, mirar cuánta correlación tienen esas variables, pues es el comando, mire que es muy sencillo, corro el correlato y voy y coloco allí todas, todas las variables aquí haciendo clic en este eje, en este ejecución.

00:27:31:04 Y el Doug se ejecuta en esa línea y aquí en la pantalla nos destaca. Podemos observar cada una de las variables con la correlación entre ellas y observamos que todas las variables tienen una correlación importante, pues todas las variables están correlacionadas unas más, otras menos. Es allí, vamos confirmando eso. Sí, sí, va, eh, vamos a ver si qué podemos hacer al respecto.

00:28:22:08 Lo otro importante es que podamos nosotros evaluar si este información que tenemos acá es una información que pueda ser replicable. Es decir, aquí vamos a El Comando, lo cambiamos de correlato a alfa y entonces en el aquí observamos como está todo el comando alpha a lt, h a es el, es el código y luego vienen las variables. Y en ese en esas variables observamos que tenemos un siete variables y podemos observar que lo que me está diciendo este Alpha de prueba es que en el punto 83 en punto 83 de toda la información, siendo uno, toda la información es procedente de esas preguntas.

00:29:11:27 O sea, lo que estamos observando que las respuestas que estamos obteniendo no son variables de sujeto a sujeto, ni entrevistador entrevistador. Son variables que son respuestas que están asociados al instrumento y es por eso que tiene una reponsabilidad alta. Pero no podemos ignorar que se ha replicado y ya puede verse afectada por la correlación entre los datos. Volvemos otra vez a que de pronto nos cuestione que nosotros tengamos, que tengamos nosotros una información que puede al sumar las variables, este se está haciendo redundante y que está replicado el ya se puede ver afectada por la correlación entre las variables.

00:29:50:28 Entonces volviendo, volviendo hacía nuestro hombre a nuestro código, pues vamos a hacer el análisis de componentes principales. Nuevamente observamos que en el código simplemente lo que hemos hecho es donde colocamos antes o relay, donde antes colocamos alfa. Ahora colocamos CCA y dejamos todo el resto de variables y observamos si tenemos siete variables y vamos y aquí está como los componentes generados, como son siete variables, tenemos siete componentes.

00:30:24:01 Cuál es la e? El que ganamos acá? Que cada uno de sus componentes tiene como correlación cero, pero también estamos evaluando que el aporte de todas las variables en este componente, cuánta correlación tiene dentro las variables que están dentro del componente y está cuál fue la proporción de variante explicada. O sea, si estamos pensando en que de verdad estas preguntas que luego origina los componentes e cuanto me explica la.

00:30:49:22 La ideación suicida es podemos decir que el componente uno me explica el 50% de las de la eyección suicida, mientras que el componente dos explica el 12.89 y entre el componente One y el componente dos tengo el 64% de la ideación suicida. El componente tres me explica el por el 10%, el uno del dos y el tres me explica el 74% de la ideación suicida.

00:31:18:08 Y así vamos a ir evaluando el aporte de cada componente en la explicación de de esa variable latente. Entonces podemos explicar que eliminando la correlación que hay entre las variables que es el, nosotros podemos tener una un aporte de la varianza explicada de cada componente y la suma de varios componentes. Y podemos decir no, no me interesa sino hasta el componente cuatro.

00:31:44:19 O sea, yo puedo entrar a simplificar más este proceso de recolección de información. Estamos hablando de adolescentes, hacer encuestas no es una cosa que sea súper sexy o súper wow para que ellos le dedique mucho tiempo, entonces es mucho mejor tener el sistema entonces muy sencillos, pero que nos permita definir realmente quién puede estar en este caso de una forma precoz en la condición de riesgo.

00:32:13:07 Y a aquí también destacando es presenta como es el comportamiento de cada componente con cada una de esas variables, cambia con cada una de las variables, pero observamos que no todas las variables participan lo mismo. Por ejemplo, esta esta variable que es dificultad para concentrarse, para para concentrarse, es participa muy bien el componente uno, pero no tanto del componente dos más o menos tres.

00:32:58:23 Y así pues, todas las variables participan en forma diferente en cada componente y hay una forma de yo poder ver eso mejor. Cómo? Al mismo código. Al mismo código le voy a generar una segunda línea, un segundo código, una segunda, un segundo comando desde el primer código que comanda la palabra que el código que se comanda en el enemigo, compañeros rivales, especie A Pero yo quiero hacer una segunda línea de código, entonces debo separar la la primera de la segunda con una coma y aquí le estoy diciendo que no me inte sino los las participaciones por encima de punto 35.

00:33:33:05 Desde aquí podemos ver más claramente porque consideramos que puntos 25 para abajo no es, no es una participación relevante. Es Con esto podemos nosotros ya ver como cuales son las variables que realmente están definiendo cada componente en forma importante. Entonces este análisis de componentes principales, yo puedo después por ejemplo yo puedo, yo puedo descargar estos componentes dentro de mi base de datos y empezara a trabajar con los componentes.

00:34:10:10 O simplemente ya les digo, tengo la evidencia de que realmente esas variables me me explican muy bien la ideación suicida y entonces básicamente me voy directamente a generar midiendo esa cal, la vamos a crear otra variable. Entonces esta variable se llama riesgo. El riesgo va a ser la suma de las variables que inicialmente recoja. Recogimos y vamos a generar también otra variable que se llama Pensamiento de saca.

00:34:52:16 Veamos que no es que como se comportan este riesgo y de este hemos que tenemos sujetos que no puntuaron riesgo y sujetos que puntuaron riesgos alto de cero hasta 20 listo. Y nuestro desenlace? Nuestro desenlace pues es un desenlace que es el pensamiento que esta es la. La ideación suicida tiene varios valores, es 41 de estos 52. No bien no tienes ideas suicidas, hay uno que piensa diariamente en la o semanalmente la este, semanalmente en la idea de matarse.

00:35:29:23 Hay otro que algunos días de la semana y hay uno que lo piensa diariamente. Es Yo puedo, yo necesito, puedo hacer con esto alguna, algunas modificaciones, por ejemplo, lo que yo observo es que hay una concentración en ceros y hay una gran concentración con y muy poca participación en las otras variables. Bueno, entonces aquí, perdón, aquí voy a voy a hacer la codificación de mi, de la variable pensamiento.

00:36:20:09 Pensamiento va a ser. Entonces le voy a decir, si su valor es cero, el siga cero, si su valor es uno, que sea uno, si igual su valor es dos, que el sea uno. Si su valor es tres, el sea uno. O sea, observen que realmente yo tengo es una variable que esta variable piensa la muerte es una variable realmente categórica, es ceros y unos, y esto es esto aquí me esta hablando como en una frecuencia, pero es que los estos estos dos sujetos realmente tienen ella este de un pensamiento suicida, una ideación de se hacen los cambios y de generando otra variable.

00:37:15:27 Lo que hicimos acá fue que piensa en la muerte, generamos otra variable, esa variable vimos que realmente era categórica y la transformamos. Veamos a ver cuál es realmente el comportamiento de esta variable ya transformar. Si tenemos que la variable ceros y unos 41 nunca han pensado en la muerte, en su muerte o en matarse más claramente y 11 cinco Entonces ahorita lo que quiero saber es bueno, y con esa, con esa, con esa información que tengo aquí, con esa suma de ese riesgo que va de cero a que va de cero hasta a que va de cero a Pero el que tengo acá que va es cero hasta 20.

00:37:49:14 Yo necesito un por poner un punto de corte y cuál va a ser el corte que mirémoslo acá. O sea que que esencia y especificidad tengo yo para clasificar a estos tres sujetos, como que si tienen un riesgo de desviación suicida o a estos 20, entonces esta ata con este comando e vuelve con este comando. Lo lo puedo establecer el block.

00:38:45:19 Doctor doctor es una curva rock y me va a dar una esa curva rock como tabla pensamiento y en hacer nuestro desenlace y riesgo nuestro la suma en nuestras variables. Pues aquí tenemos las valores, la sensibilidad, especificidad a cada punto de corte. Tres. No puede tomar una decisión? Pues me parece que si tiene siete o más puntos ese riesgo es es alto entonces, pero no puede ignorar que este cinco más tiene también un riesgo que yo podría hacer entre cinco y lo puedo hacer una intervención con ellos, por ejemplo, una intervención comunitaria, o sea, una intervención global, una intervención donde e universal, donde, donde yo haga una intervención, por ejemplo el de la escuela o

00:39:17:19 el de la familia. Sin hablar de la ideación suicida, ese tipo de intervenciones existe estando como documentada. Nosotros hemos hecho algunas y ya tenemos también evidencia de como hacerlo, que hacer el papá, que hacer la mamá, que en el ser los hermanos para que eso, esta ideación se vaya cambiando y en el colegio también puedo hacerla. Tres. Se puede entrenar los profesores para que hagan intervenciones de este tipo universales que básicamente son muy sencillas?

00:39:46:22 Son las intervenciones como se escucha al adolescente como que para significa las palabras de la adolescente, entonces para eso hay que escucharlos, a ver que las palabras para ellos no son cosas sustantivas, únicamente no son verbos. Está hablando de sustantivos y de verbos, o sea, las los sustantivos y los verbos, para ellos y para muchos, también de adultos, pueden tener asociado una emoción.

00:40:13:01 Una emoción agradable pero muy desagradable es pues tengo que darme cuenta de eso para comunicarme bien con el adolescente. Es un trabajo que es interesante y aporta bastante al desarrollo de las personas. Lo otro que la familia y el profesor se convierte en la fuente. Autoestima de. Se estudian 11 estudiantes. Es decir, la autoestima puede ser un un objetivo académico.

00:40:41:08 Y entonces con ese tipo de intervenciones universales uno trata de que de llevar a cabo eso, bueno, es lo que tenemos. Entonces la curva rock y la parte de evaluación de ese estilo especificidad finalmente se presenta es tendríamos una variable latente que podemos tener claro y realmente la estamos evaluando o no es bueno ni le dese su especificidad para hacer trabajos comunitarios.

00:41:10:06 Por ejemplo se que puede, voy a dejar de presentar y espero sus comentarios, sus preguntas. Doctor cree que han llegado algunas preguntas? Se las voy a ir leyendo a continuación. Entonces no sé si quiera devolverse un momentito la pantalla. En Stata hay dos preguntitas sobre la parte de análisis de componentes principales y otras dos sobre una en términos de las aplicaciones.

00:41:44:18 Entonces, la primera pregunta que le hacen es cuál es la diferencia entre componentes principales y la parte del análisis factorial. Aunque sí, es una muy buena pregunta. Realmente la diferencia es muy poca, porque los factoriales también te van a te van a dar este mismo tipo de de comportamientos donde te dan la varianza explicada y te y puedes establecer el comportamiento de cada variable en función de ese factor.

00:42:13:21 Eh. Pues realmente a mi me parece que tengo mejor rendimiento con un análisis de componentes principales cuando mis preguntas son así de unos y ceros y yo tengo una unos valores que aquí si corresponden a variables cuantitativas, yo creería que el análisis factorial sería mejor. Es por ese lado, es que es la diferencia, que tipo de variables tienen y con relación a eso puedes usar uno u otro.

00:42:59:02 Perfecto. También me preguntan aquí, justo sobre esa pantallita que tenemos en este momento, cuando se dispone la condición del 0.35 porque aparecen los que están en negativo, supongo yo. Aunque si ese también me parece exacta ese dato. Las variables pueden estar aquí, tienen esas variables. Por ejemplo, me está diciendo que este decaído está participando negativamente del componente, pero y este es lo mismo cuando se que cuando él viene se siente mal consigo mismo, pero observemos que por ejemplo de caída del componente uno participa positivamente, o sea, las variables pueden, recuerden que tiene.

00:43:36:07 Estos son correlaciones que las correlaciones pueden ser positivas o negativas. Hay variables que aumentan o variables que disminuyen, pero participan igualmente. No se si esto tiene que ver más con eso. Las correlaciones pueden ser negativas. Yo puedo tener una mucha correlación entre dos variables pero en forma negativa, es decir, por ejemplo en la lap bueno, la presión arterial sistólica y la edad está correlacionada, pero está correlacionado positivamente a medida que aumente la edad de una presión sistólica más alta.

00:44:03:23 Pero no, no necesariamente sucede lo mismo con, por ejemplo, la presencia histórica y la actividad física. A medida que yo aumento la actividad física, generalmente mi peso sistólica es menor. Ahí la correlación es negativa. En el caso de la presión sistólica y la actividad física, en cambio, la correlación es positiva en el caso de la edad y la presión sistólica.

00:44:58:10 Es eso lo que me está diciendo esta? Esta es la información de esta tabla, y yo puedo tener una correlación positiva o negativa. Perfecto. Por acá también preguntan y lo siguiente los componentes hacen referencia a la agrupación de las variables o simplemente son cada una de las variables expuestas de otra forma? Yo creo que así es como una combinación de las dos cosas, porque los componentes que tienen las variables en los componentes se han conformado por variables, pero esos componentes si me permiten y en este ejemplo mire que el componente uno está conformado por x uno y x dos, en cambio el componente dos también está conformado por x uno y x dos.

00:45:46:08 O sea, cada componente es una resultante de las variables, pero esa resultante es para poderla establecer. Cómo van a estar mejor representadas x dos y x uno en una sola variable? Entonces para hacer eso, entonces en el eje en el plano cartesiano debe girar, pues debe rotar y entonces encuentra una rotación donde ese componente maximiza la expresión de x uno y que x dos en la definición de ese uno, o sea segundo es una expresión de x uno y x dos componente uno entonces, pero, pero no, pero no es lo mismo si en esta por ejemplo aquí, si es aquí, se sacas es acá hacia acá des en el lo que hace es trata de

00:46:16:18 definir dos en que nivel de rotación que se hace sobre el eje es que yo obtengo una máxima expresión de x1 y x dos para orientarme. Ese uno luego que se hace? Como se cambio el eje? Entonces ya el eje no está aquí, sigue siendo cero, pero está direccionado. Definió por segundo. Entonces debo hallar una participación de x uno y x dos en otra e de otra manera, cuando este está rotado.

00:46:55:25 Y si agrego C3 pues va a ser distinto. Es ok, entonces lo que hacen es hacer una una evaluación del nivel de participa ción de las variables en cada componente y para poder que el componente siga siendo expresión de las variables. Pero eso se hace en un plano multidimensional que nosotros no podemos representar. Más de tres dimensiones es cada componente es como una dimensión, no podríamos representar físicamente sino hasta tres entonces, pero matemáticamente yo podría encontrar que pueden ser 15, pueden ser mil.

00:47:33:16 Entonces me me permite expresar en cada dimensión, como en la participación de cada de cada variable, y esas dimensiones se van construyendo o rotando cada una dos componentes. Cuando decimos punto 35, la pregunta aclara eso porque el punto 35 1.30 o por lo bajo porque no hay punto 25. La respuesta es no hay evidencia para esto. Esto simplemente es un punto que yo elegí para poder ver más limpio esto acá, para poder definir cuáles son las variables importantes en cada componente.

00:48:12:16 Por ejemplo, en mi caso pensaría yo que que la idea de sensibilidad es suficiente con tres componentes, entonces tres componentes que la conforman antes de que pueda decirlo, conforman esta el componente uno que es de lo que más participan. Mire que están casi todas estas lleno por decaído dificultad para dormir que sin apetito está mal consigo mismo y dificultad, dificultad para concentrarse y habla lento, pero el componente dos está repetido, está decaído, aparece cansado que necesitaba y aparece también repetido mal consigo mismo.

00:48:58:20 Entendió que yo podría decir punto 36 de la participación de mal consigo mismo, y es menos punto 54 en el componente dos. Y yo creo que este mal consigo mismo es más de del componente dos que el uno. Lo mismo que acá el decaído es más del dos que el uno. Entonces yo podría en tabla dejar nomás que el componente uno este conformado por estos otros componentes de las variables y ya darle un nombre a cada componente, o sea no decirle componente uno, sino como decir bueno, el pensamiento, la ideación suicida puede ser que esté conformada por por dos componentes y ser dos componentes.

00:49:33:25 El primero va a estar por dificultad para para dormir, sin apetito e dificultad para para concentrarse y hablar lento. Entonces estas son todas estas son como expresiones del rendimiento académico, por ejemplo. Pero también la ideación suicida puede tener un un segundo componente donde están es está decaído, está cansado y está mal consigo mismo. Que podría decir estas son expresiones físicas.

00:50:07:24 Yo tengo unas expresiones del rendimiento y otras académico o el rendimiento social y otra del rendimiento físico. Yo podría decir que el componente uno es rendimiento académico social y el componente dos es un rendimiento físico. Desde esta manera me permite a mi hacer constructo. O sea, la ideación suicida tiene constructos de donde surgen los constructos de los componentes, pero quiero explicarme el constructo para darle realmente el concepto de constructo de o a utilizarlo.

00:50:36:26 Y cómo lo hago? Simplemente entendiendo qué son estas variables que conforman cada componente. No sé si está claro, eso es otra cosa que se puede hacer con el nadie de componentes principales. Definir que es lo que construye la la variable latente. No sé si queda claro. Si señor, por acá envían una pregunta Propósito de estudios En este caso, cuántos de los siete componentes definen la variable dependiente?

00:51:16:21 A mí me parece que que estaría bien con 3,31000. O sea, tener un instrumento que me capte el 75% de la ideación suicida. Y estoy hablando de imagínense un colegio con mil estudiantes que les ponga a el mejor que que con tres componentes y las variables que lo conforman en corro yo el instrumento de esos tres componentes puede ir en las mismas siete y los correría eso en un documento o googles para que yo lo digital y poder decidir quienes están en riesgo.

00:51:43:23 O sea este. Recuerden que la selección del riesgo es como lo que hacen las mamás cuando hacen la torta, o lo que hago o lo que hacen algunos hombres también cada golpe aunque de color torta. Yo no, no, yo no hago torta, me quedan horrible entonces, pero yo observo que mi mamá, mi suegra y mi esposa, ellos antes de de hacer la torta la pasan por el colador y entonces el colador es como el instrumento.

00:52:05:06 Y entonces qué hace? Selecciona la harina de mala calidad, la harina sucia y no permiten que sea parte. La torta es este. Es como la forma en que nosotros podríamos pasar un vaso a un grupo de adolescentes para poder definir quién está en riesgo y con es que están en riesgo. Eso es lo. Eso ya es un problema clínico, eso no es un diagnóstico.

00:52:43:17 No estamos diciendo que aquí está más del diagnóstico de de pensamiento suicida ni suicida. No estamos educando gente que está en riesgo y debe ir a una consulta, debe ir a una consulta de un psicólogo clínico, de una enfermera, de la enfermera de salud mental o de un médico o de un médico psiquiatra. Sí, pero hicimos algo porque este tipo de cosas cuando sucede, o sea, es devastador, es decir, es una tragedia, un suicidio y una de las tragedias más grandes es que no sabía que se podía hacer algo.

00:53:32:00 Entonces siempre nosotros, al estar vinculado nuestro concepto de salud, llevarlo a otras, a otras áreas como el sector educativo, aportamos bastante, pero tenemos evidentemente que tener una evidencia para hacerlo bien. No sé si queda claro esa. Lo que hacemos es seleccionar por defecto con esta instrumento y dirigir ya no a mil, sino los que están en riesgo para que tengan una atención y que esa atención clínica puede finar, que lo que tiene, pero entonces no tiene nada de eso, es lo que tiene, es un déficit de atención puesta a deprimido, está ansioso o tiene un odio, un problema, un conflicto de pareja que es bastante prevalente, o las relaciones no, no son tan armónicas entre

00:54:14:21 adolescentes, pueden ser bastante conflictivas y el se expresa así Bien, doctor, bueno, antes de continuar aquí con las otras tres preguntitas que nos que nos quedan, voy a compartir el cuestionario que les indico compañera Elisa, al inicio les agradecemos pues nos apoyen llenando las preguntitas y entre tanto pues aprovecho para hacerle las otras dos preguntas que han llegado aquí al chat y le consultan lo siguiente Si dos variables de entrada tienen alta correlación, no debería considerarse una sola y no sobre parametrizar como se puede manejar.

00:54:39:21 Este caso es si es y eso es realmente. Ese es el problema que tengamos mucha mucha sobre representación. Eso es lo que sucede cuando tenemos variables correlacional que pueden algunas características pueden estar sobre representadas y por lo tanto tres van a estar sub representadas de lo que evaluemos con relación a eso, puede no ser real y tenemos que ajustarlo.

00:55:20:06 Estamos presentando una forma de las muchas que podemos tener. O sea, destaca tiene una gran diversidad de cómo enfrentar esta dificultad, porque otras veces gratificar otra es simplemente definir los criterios de inclusión y tratar de que esas sobre read sobre representaciones o sus representaciones no se den. O sea, podemos actuar desde el protocolo de investigación, pero cuando lo encontramos en nuestros datos tiene la importancia es que tenemos muchas opciones de destacar para poder apoyar al investigador en que pueda tener más claro el comportamiento de sus variables.

00:55:48:25 También preguntan lo siguiente Aquí se puede utilizar análisis de componentes principales. Para variables categóricas es donde más las usamos en categóricas, pero recuerden que las variables tienen que estar en números, así sean categóricas, así sea una cualidad. Ellas deben tener una expresión en números y lo otro importante es que si se que si usted va a observar en la base de datos las variables, todas serán relaciones.

00:56:32:14 O sea, no puedo tener ceros y unos y 123, porque entonces ahí voy a tener más dificultades porque uno de los tres es para estatal. Tercero es que no tiene, uno tiene, pero tres es mayor que, que que uno y mucho y mayor que dos. Entonces lo que se recomiendan es que todas tengan como los mismos valores en, en y tenga el mismo comportamiento con igual valores todas cero o 101 los y cuando ella es totalmente cuantitativa estamos hablando por ejemplo de por desea algo presión sistólica Presión diastólica Edad Prueba de función renal Prueba de función hepática una función pulmonar, una frecuencia, una frecuencia cardíaca, etcétera Esas son todos valores.

00:57:01:03 Entonces mejor vamos con el el de la nariz factorial, no el de componentes principales. Por acá haciendo una pregunta es correcto decir análisis bio variado cuando se realiza el cruce de dos variables? Si es lo más en lo más general, porque son una es una exposición y la otra el desenlace. También es un análisis y variado, otra puede ser un confusión.

00:57:37:10 El confusión también hay que identificarlo. Generalmente, si yo tengo claro mi posición y el desenlace y tengo otra serie de variables en el instrumento. Las otras variables son computadores, pero tenemos que confirmar si son computadores de un computador. Es confusión porque está asociada al desenlace. El compositor no es real, o sea, la variable asociada al de al desenlace, a la variable adicional al al a la exposición que está asociada al desenlace realmente está asociada el problema de esto?

00:58:08:27 Cuál es el problema? Es que los eventos en en salud son eventos multicausal y nosotros como investigadores definimos como de todas esa exposición de todas variables. Una va a ser nuestra exposición porque la que queremos modificar, porque la que podemos modificar, tenemos la posibilidad de cambiar el desenlace actuando sobre esa exposición. Y entonces las otras que están asociadas como van a estar en ese modelo, en ese modelo pueden ser confusiones.

00:58:47:16 O sea, lo que hacemos mucho con los datos apoyados con el Stata es poder hacer un modelo y ese modelo debe representar la realidad. Y la realidad es que hay confesores y que hay y las exposiciones quieren hacer las exposiciones son algo arbitrario, no es lo que podemos manejar, es lo que podemos modificar, pero siempre hacemos esto porque con la con la modificación que hacemos en la exposición, nosotros con eso vamos a contribuir a menos, a menos dolor, a menos muerte, menos enfermedad, a menos ansiedad, a mejor a mejorar condiciones de.

00:59:16:28 Es por eso las tres variables son conclusiones y deben hacerse una nariz y variado. Porque cómo selecciono yo un concurso? Porque esa variable está asociada al desenlace, es una sucesión significativa del variado. Sirve para eso, para identificar quiénes son confesores y como se está presentando la relación entre la exposición, el desenlace. Luego nos toca hacer un multi variado, porque necesitamos ya sabemos que hay computadores que son significativamente relacionados.

00:59:46:05 Comience la se ve muy variado. No, no me es útil para sacar conclusiones. El bi variado me es útil para evaluar como es la relación entre la exposición y el desenlace. Es asociado pero en qué dirección está? Está lamentando riesgo? Lo está modificando? Lo esta imagen y lo otro, ete y variado. También me permite de pronto sospechar si hay términos de interacción porque hay variables que no son confusas horas.

01:00:12:13 Hay variables que me modifican la expresión del efecto y se llaman términos de interacción. Entonces esto también lo podemos ver en la próxima conferencia donde está. Tiene una manera muy didáctica, me me permite a mí rápidamente identificar quién es computador, quién es término interacción. Esta interacción es positiva, la interacción negativa y ya con eso previo, pues es más sencillo entender el multi variables.

01:00:49:15 Doctor, llega aquí una última pregunta y menciona lo siguiente Cuál es la diferencia entre confuso y modificador del evento? Ok, perfecto. El computador realmente es una variable que es parte del modelo multicausal, o sea, ella realmente está asociada al desenlace, es parte de las causas, como por ejemplo tengo una muerte de un recién nacido. Esa muerte puede ser porque ya tuvo bajo peso al nacer en la otra, puede ser porque tengo diarrea, otra porque le tiene una anomalía congénita de supongamos que en esa que se fuera desastre.

01:01:17:26 Entonces yo puedo, o sea, me intereses del bajo peso al nacer, quiero modificar el bajo peso al nacer. Entonces como actúa la diarrea en esa relación como compresor, como actúa en la anomalía congénita y en esa relación como confusión que yo puedo evaluar el bajo peso al nacer, ajustado a la diarrea, al cuadro clínico diarrea y al cuadro clínico de malformación.

01:02:04:13 Pero puede ocurrir, puede ocurrir que cuando hago esa relación yo debo detenerme y decirlo compositores, porque está asociada al desenlace, está muy bien, pero de pronto encuentro que la prestación de los servicios también es una variable importante. Inicialmente no la tenía clara interés. La prestación de los servicios de salud está asociada a la mortalidad. Entonces mi rol. Pero como que está asociada como quizá se establece a la mortalidad, pero esa es, no me queda claro, es muy variado después de establecer en los valores de la variable prestación de los servicios de salud, porque ya puede ser categórica.

01:02:29:22 Recibió de salud, no lo recibió, es cómo se da la relación bajo peso al nacer y mortalidad en neonatal. Por ejemplo. En los que refiere a los servicios de salud. Cómo se a la relación bajo peso al nacer. Mortalidad neonatal en los que no lo recibieron. Lo que estoy haciendo es gratificar por esa variable con la que tengo dudas.

01:02:58:26 Prestación de servicios de salud. Es como se da la relación bajo peso al nacer y muerte en los que reciben los servicios de salud y cómo se. A la relación entre bajo peso al nacer y muerte en los que me lo recibo y de ahí concluir que no era un concurso, era un término de interacción, que los términos de interacción son bastante importantes identificarlos porque ellos me modifican la expresión del efecto, lo que yo estaba viendo en el vivo variado que era factor de riesgo.

01:03:31:24 Aquí ya tengo claro que que el factor de riesgo al no recibir los servicios de salud y que el recibir los servicios de salud me generan ese impacto protector del me queda más claro el modelo causal, pero esto de verdad que le sugiero cuando en un próximo encuentro con Estatal otra ocho. Para poder hacer más claridad en esto se pueden identificar y diferenciar los campos sobre el de los terminales de interacción y que estrategia vamos a usar en cada caso esa eliminación?

01:04:20:15 Bueno, pues como le dije la última pregunta que nos había llegado y pues a nuestros participantes agradecerles su asistencia el día de hoy y a usted doctor enviarle y pues aquí leerle un poco los comentarios que le envíen en agradecimiento por el evento de hoy, las felicitaciones por la presentación y agradecerle el espacio y para vernos acompañado en esta sesión como les mencionaba el doctor hace un momento y hemos preparado para ustedes una serie de eventos en la que nos estará acompañando el doctor Martínez, en donde abordaremos la parte pruebas de hipótesis, la parte de análisis descriptivo y proveniente de datos epidemiológicos y cosas por el estilo.

01:04:51:14 Y pues estaremos encantados de contar con su participación, con su asistencia. No sé, autor si quiera añadir algo más antes de terminar esta sesión me pidieron un correo, ya lo estoy colocando acá también. Pues pueda traer de sobarse, operen, pueden ubicar y estoy muy encantado de ver tantos amigos que hacia rato nos saluda. Muchas muchas gracias y espero que la próxima vez sea más cara a cara, aunque en la distancia me alegra mucho verlos y saber que están bien.

01:05:44:24 Para mayor información respecto al software o en temas relacionados, no dude en contactarnos a través del correo electrónico. Entrenamientos a software on Ya.com o visitar nuestra página web triple OLE o Punto Software Guión Ya.com.

Aplicaciones y funcionalidades de Stata para investigación en ciencias de la salud

Stata es una herramienta que pone a disposición de sus usuarios diversas posibilidades de trabajo, en ciencias de la salud, una importante aplicación son los procesos de validación de instrumentos usados en la recolección de información. Otra posibilidad es la descripción de los resultados a través de medidas de tendencia central y de dispersión que permitan presentar un comportamiento de las variables así como la distribución de frecuencias. De igual forma, Stata facilita la limpieza de los datos, evaluando la coherencia entre las variables y los resultados obtenidos. Stata también permite mostrar los datos en gráficos, texto o tablas y de esa manera facilitar las opciones de presentación de resultados. También permite a los usuarios la realización de hipótesis para poder orientar estudios causales basados en la evidencia del comportamiento de las variables así como poder definir si siguen una determinada distribución como aproximadamente normal. De igual forma, es posible el uso de Stata en los procesos de segmentación o la estratificación descriptiva en cada uno de los valores del desenlace. Muchas veces la riqueza de un análisis de este tipo puede llegar a ser el suministro de una publicación o los datos resultantes que le permitirán a los tomadores de decisiones plantear nuevas estrategias en el control y prevención de enfermedades.

Etiquetas relacionadas

Análisis de datos
Gráficas
Visualización De Datos
Visualización de información

¡Comparte este video con tus colegas!

Copiar link

Facebook

Instagram