SS_Logo

Modelo de Regresión Logística en Stata 17

Autor: Andrés Raúl Cruz Hernández / Portafolio: Quantitative / Jue. 29 de Sep de 2022

Transcripción de este video

00:00:45:18 Somos un equipo autogestionado, responsable, proactivo y autónomo, con gran compromiso social, aportando el pensamiento científico y el desarrollo latinoamericano, promoviendo el uso de software para investigación en todas las áreas del conocimiento. Generamos contenido de alta calidad teniendo en cuenta las distintas necesidades del mercado. Realizamos actividades gratuitas constantemente. Abordamos temáticas vigentes, aplicaciones especializadas y elementos metodológicos que te permiten interactuar y generar redes para la difusión de tus proyectos.

00:00:55:17 Contamos con servicio de asesoría, consultoría y acompañamiento personalizado, certificaciones internacionales, entrenamientos especializados y talleres prácticos.

00:01:10:22 Nuestro principal objetivo es promover el uso de tecnología en el campo investigativo, generando un impacto significativo en la región y de esta forma contribuir a la creación de comunidad para compartir conocimiento.

00:01:56:02 Te invitamos a ser parte de este gran equipo Software Schott. Visita nuestra página web y conoce nuestros servicios Software Shop. La empresa líder en la implementación de herramientas analíticas y software especializado en Latinoamérica, les da la bienvenida a esta presentación. Esta sesión contará con el acompañamiento de Andrés Cruz, instructor del portafolio cuantitativo en Software Shop Profesionales, Finanzas y Comercio Internacional de la Universidad de La Salle Magister en Investigación de Administración y Finanzas de la Universidad de los Andes acreditado con la Certificación Internacional en Administración de Riesgos Cuantitativo C QRM, otorgada por el Instituto EPE.

00:02:19:06 Actualmente adelanta estudios de Doctorado en Administración en la Universidad de los Andes en Colombia. Bienvenidos. Buenas tardes para todos nuestros participantes veo que hay un gran número de asistentes, por lo menos a quienes aún no sé como es la asistencia en otras redes, Facebook y no sé por dónde me lo estarán transmitiendo. Pero bueno, buenas tardes para todos.

00:02:48:09 Espero que estén muy bien. Muchas gracias por acompañarnos en esta tarde. La idea entonces de hoy, como acaba de mencionar Luisa, es conversar un poco acerca de qué es la regresión logística, para que nos sirven y quizá un poco cuáles son sus similitudes y diferencias con la regresión lineal normal. Y pues obviamente utilizar el software de Stata para hacer algún ejercicio aplicado.

00:03:17:17 Entonces voy a dar inicio a la presentación. Si llegan a haber preguntas durante, se las pueden hacer por el chat, por favor o pueden la mano y con el mayor de los gustos se estarán respondiendo. Entonces, antes de empezar a hablar sobre qué es la regresión logística, pues debemos partir primero por la idea de una regresión lineal, entender un poco qué es ese concepto.

00:03:43:04 Si no hay claridad, quizá en este concepto los invito a que busquen dentro de la página de octubre sobre uno de los últimos entrenamientos que se impartieron, precisamente hablando sobre la regresión lineal. Aquí vamos a tocarlo muy por encimita, pero si es importante traerlo a colación, pues para luego entender un poco para qué nos sirve la regresión logística lógica.

00:04:15:23 De acuerdo, entonces digamos que primero, cuándo? Cuándo vamos a hablar de regresión e regresión? En estadística, en econometría o una regresión por allá ancestral o algo de otro tema? No hablamos de promedios. Es decir, siempre, siempre, procuremos asociar cuando, cuando escuchamos o trabajamos con regresiones lineales, procuramos asociarlo con con la idea de promedios, porque es bastante importante tener esto presente y ya lo vamos a ver.

00:04:43:17 Aquí tenemos la fórmula cómo se calcula un promedio? Nunca es la sumatoria de todos los de todas las observaciones, dividido en el total de esas observaciones en sí y es importante porque en la mayoría de los eventos sociales, una mayoría de los segmentos económicos, pues digamos que los datos tienen a retornar a ese promedio y regresar a la media.

00:05:14:13 También se conoce cómo es. Entonces, si conocemos el promedio, sabemos que en algún momento esa observación es van a tender hacia ese valor. Y entonces cuando nosotros usamos o construimos un modelo de regresión, lo que buscamos es encontrar precisamente una ecuación, una ecuación que nos permita modelar o representar ese promedio al cual esas variables van a retornar. De acuerdo?

00:05:38:11 Entonces, de nuevo, un modelo de regresión lo que busca es construir un modelo que explique un poco hacia dónde va esa variable. De acuerdo, entonces aquí ya empezamos a, digamos, hacernos la idea de que queremos hacer algún tipo de pronóstico. De acuerdo. Hacia dónde va? Cierto? Hacia ese promedio, si, pero un tipo de pronóstico de acuerdo es mediante la regresión.

00:06:10:16 Entonces se puede determinar el comportamiento promedio o otra vez aquí, promedio superimportante de una variable aleatoria. Y esa variable aleatoria puede ser variable aleatoria continua o variable aleatoria discreta. La principal diferencia acá en dos segundos es que la variable aleatoria continuo puede tomar valores infinitesimales, por así decir, puede tomar valores con decimales. Una variable aleatoria continua, por ejemplo, es la estatura que puedo medir 1.7568 centímetros quizá.

00:06:56:23 Y eso ya depende del grado de exactitud con el que se mida la estatura, por ejemplo, o la edad. Yo puedo tener 29.5865 años, por ejemplo. No todos pueden tener valores con decimales. La variable aleatoria continuo. Ahora la variable aleatoria discreta no puede tener decimales, como por ejemplo el número de hijos que tiene una persona. Yo tengo o un hijo, o dos o tres, pero yo no puedo tener 2.5834 hijos, por ejemplo, uno que otro ejemplo, no sé, la clasificación cuando se hace por género, por ejemplo masculino y femenino, o que es la clasificación de los estratos sociales de un estrato uno o 234 o cinco o seis.

00:07:25:15 De acuerdo, no puede tomar decimales. Esa es la principal característica entonces. Variable aleatoria, continua y discreta. Diez. Entonces, con la regresión podemos entender el comportamiento promedio de cada una de esas variables, sean continuos, etc, pero cómo se comporta en promedio? También con la regresión que puede encontrar. Un poco esa relación promedio de dos variables aleatorias puede ser la variable dependiente y la variable independiente.

00:07:49:03 Cómo se comportan en promedio esas dos variables? El y la regresión. Entonces utiliza los movimientos de una variable para explicar los movimientos de otra variable. Entonces esta es la dependiente, esta es la dependiente, la independiente. Entonces, como las variables independientes que no dependen de ningún otra variable, como afectan a esa variable acá que es la dependiente? Porque depende de la de acá.

00:08:36:02 Bueno, este digamos que es, es muy importante y muy útil comprender el concepto de regresión, porque es que es muy transversal a diferentes ramas del conocimiento. Hacemos regresiones en psicología, sociología, antropología, arqueología, ingeniería, educación, historia, finanzas y demás. Me acuerdo, pero cuando lo utilizamos en conceptos económicos, entonces se conoce como econometría, de acuerdo para analizar problemas económicos e Es un método más entre los métodos multi variados, sí, pero bueno, a lo que me quiero, en lo que quiero concentrarme en este momento es aquí vamos a construir una ecuación g que es mi variable dependiente, depende y está en función de esta.

00:09:02:12 La F está en función de x en función de otras variables. La variable g depende de otras variables. Entonces, como una regresión lineal, pues obviamente queremos construir una ecuación lineal, es decir, una ecuación que me trace una línea recta y que describe un poco el comportamiento promedio de la variable dependiente. Pero va a ser una línea recta. Y ojo, que esto es clave, porque en este caso no nos va a servir una regresión lineal.

00:09:29:06 Ya vamos a ver el por qué no y tenemos que utilizar una regresión logística. Entonces acá tenemos la ecuación matemática con g, que la variable dependiente beta cero que es la constante o el intercepto y beta uno que es el parámetro de de una de las variables independientes. De acuerdo con la regresión, lo que nosotros buscamos es encontrar estos parámetros beta cero, beta uno, meta dos hasta beta.

00:10:00:06 Si estos parámetros y digamos que existen diferentes metodologías para encontrar esos parámetros beta cero, beta uno, beta y la más famosa y la más utilizada es la de mínimos cuadrados ordinarios, o sea, mínimos cuadrados ordinarios. Existen otras metodologías como por ejemplo el método de momentos y el método de máxima verosimilitud. Y hacia allá vamos ahorita. De acuerdo. Entonces con mínimos cuadrados ordinarios se pueden encontrar esos coeficientes y me van a funcionar todo bien.

00:10:23:04 Entonces, por ejemplo, si yo tengo una ecuación como esta g igual a dos 0.8 x 12, entonces yo puedo afirmar que por ejemplo esta ecuación tiene un intercepto o una constante igualado que era este beta cero que tenemos por acá, nuestro cero o mi constante. Es decir, siempre va a tener por lo menos ese valor, va a ser constante, no?

00:10:48:18 Y 0.8, que es el beta uno de acá, va a ser la pendiente de esa línea recta. De acuerdo? En este caso es 0.2, una pendiente positiva. Ven que cuando la variable X, es decir está acá, es igual a cero, entonces la variable g es igual a dos. Acá cuando esta x de acá eh, perdón, se me fue cuando esta x de acá.

00:11:20:21 Toma un valor de cero, 0.8 por cero cero, se anula y entonces queda el dos. Por eso es que es una constante, porque no depende de otras, de otros factores, por así decir, no? Cuando 0,8 toma el valor de uno, no? Entonces qué haría 0,8 por uno 0,8 más dos? Entonces quería 2,8, no? Entonces, cuando la variable x aumenta en una unidad, es decir, aquí pasa de 0 a 1, la variable que aumenta en 0.8, que fue lo que les acabo de mencionar?

00:11:44:04 Tenemos acá el término de error o residuo. También se conoce y es el elemento más importante y de mayores. Por último, dentro del análisis de regresión, porque es que en el error digamos que hay muchos de los supuestos básicos y necesarios para validar un modelo de regresión. Por ejemplo, que en este momento no vamos a entrar en esto porque no nos corresponde.

00:12:15:05 Pero vamos, que en términos de errores súper clave, es muy importante al momento de analizar modelos de regresión. De acuerdo, continuamos entonces por acá, ahora? Si, ya, ya. Digamos que hicimos un pequeño récord de Eris, de lo que es la regresión lineal y ahora sí, vamos a hablar sobre la regresión logística. Y entonces qué pasa? Que es que acá en la regresión lineal está lleno, por lo general es una variable aleatoria continua.

00:12:46:03 Por ejemplo, el precio de alguno de los ejemplos, que ya les digo una variable aleatoria continuo. Qué pasa cuando está allí? Esa variable aleatoria ya no es continua sino es discreta. NS Es decir, cuando va, por ejemplo, cuando es binaria, cuando solamente puede tomar valores de cero o de un u en esos, en esos escenarios ya el modelo de regresión lineal no nos va a servir muy bien porque va a generar algunos ruidos por ahí, algunos problemas.

00:13:20:03 Entonces concentrémonos en ese escenario. Cuando llegue la variable dependiente va a ser categórica, va a tomar valores de cero o uno. Esto digamos que me va a pedir, me va a permitir encontrar una probabilidad más adelante. Esta variable categórica que puede ser, no sé, digamos, cara o sello, lanzamiento de una moneda 12.000, o si sale cara, entonces yo la categoriza como un cero cara y si sale sello y una categoriza como uno y de esa manera la voy registrando, no?

00:13:40:20 Eh, por ejemplo, prender la luz y apagar la luz cuando la luz está prendida, entonces va a tomar valor de uno. Cuando la luz está apagada, entonces va a tomar el valor de cero. Esos eventos categóricos que solamente puede tomar dos valores, por ejemplo uno, entonces de esa manera la ecuación de regresión y su valor esperado se interpreta aquí.

00:14:05:19 Ya entonces la interpretación de llevado va a ser hacia una probabilidad de que el evento ocurra dado otro factor. Ya ahorita con el ejemplo vamos a aterrizar este concepto y lo vamos a aterrizar, pero entonces vamos a estar hablando de probabilidades aquí. Quiero que quede claro, es que con la regresión logística vamos a estar hablando de probabilidades, de acuerdo?

00:14:27:04 Un problema entonces es que después de la estimación lineal, es decir, con una regresión lineal donde se utilizan mínimos cuadrados o binarios, el valor predicho, lo que yo voy a pronosticar de mi variable, lo que yo voy a pronosticar entonces, con una regresión lineal simple y con los mínimos cuadrados ordinarios como yo voy a pronosticar en este caso probabilidades.

00:14:48:20 Y si yo estimo esas probabilidades con mínimos cuadrados ordinarios, entonces voy a encontrar muy seguramente probabilidades que salen de ese intervalo cero y uno no es decir cuál era, porque las probabilidades de ocurrencia puede ser 0% o hasta 100%. No puede salir de ese rango. La probabilidad de ocurrencia de un evento. Es decir, yo no puedo tener probabilidades negativas.

00:15:15:13 Yo no puedo tener una probabilidad de menos 30% o una probabilidad de, no sé, 150%. Uno cero o uno es cero o 100%. Si la probabilidad de ocurrencia es de 100%, quiere decir que va a ocurrir con total certeza, pero ya una probabilidad de 150% a mí no me dice mucho y eso no tiene fundamento teórico y práctico.

00:15:44:19 Entonces, probabilidades menores de cero o mayores a uno no puede, no funciona, no existen. Y con mínimos cuadrados ordinarios vamos a encontrar eso, probabilidad de negativas o más de 100%. Entonces, esos valores predichos, lo que yo voy a pronosticar, a predecir, no son consistentes con los valores observados de la variable pendiente, porque los valores observados cuál es un cero o un cero o un y entre eso se debe mover, no puede ir más allá.

00:16:17:07 También se pueden presentar problemas de este, o sea, noticia por mínimos cuadrados ordinarios. Cuando utilizamos esto para realizar pronóstico de probabilidades, si hay que decir que la varianza no es constante a lo largo del tiempo, sino que es muy volátil y esto termina siendo un problema en algunos modelos. Tampoco voy a detenerme por acá y entonces como mínimos cuadrados ordinarios no nos funciona, debemos utilizar otro, otro de los métodos que les acabo de mencionar, que es el método de máxima verosimilitud.

00:16:57:15 Con el método de máxima verosimilitud, entonces lo que hacemos es ajustar un poco los datos a través de una ecuación o función logística, precisamente, y entonces ya esas probabilidades se van a acotar y se van a corregir y van a moverse entre cero y uno. Entonces esos modelos logísticos, este modelo de regresión logística, también se conoce como un modelo de respuesta binaria o un modelo de variable dependiente, una variable dependiente binaria también de acuerdo la aproximación metodológicas encima la probabilidad ocurrencia de acuerdo variable pendiente binaria.

00:17:25:00 Entonces la probabilidad de que ocurra que sea uno dado otra variable, la probabilidad de que ocurra dado otro otra variable es lo que dice acá en yo ahorita no aterrizamos con el ejercicio para que no se asusten donde X pues es un conjunto variables explicativas. Entonces, por ejemplo, cuál es la probabilidad de que un carro sea extranjero o nacional, según el kilometraje que hagan?

00:17:50:13 Por ejemplo, si según algo dado algo es esas son esas x de acá e las variables explicativas entonces y los coeficientes, estos beta cero, beta uno y todos estos coeficientes son ajustados, como ya lo he mencionado, de tal manera que el valor pronóstico o predicho de G se limite a cero y uno a través de esta función ID.

00:18:35:14 Entonces, ya para cerrar esta parte teórica, cuando sean estimados esos coeficientes con un modelo LOGI, entonces aquí ya cambia un poco la interpretación de esos coeficientes. Va a ser algo diferente a la interpretación que se le da en un modelo de regresión lineal. Y ya luego hagámoslo más bien de una vez. Aquí, analizando los coeficientes, vamos a tener en cuentas el ciclo que eso indica, el efecto de la variable X sobre la probabilidad de que ocurra allí, y la estimación de estos coeficientes a través de un modelo de variable pendiente binaria no puede llevarse a cabo mediante mínimos cuadrados o binarios, porque pues se utiliza una función logarítmica, que es una función no lineal.

00:18:59:10 La función logarítmica es una curva, entonces la función lineal es una recta. Y bueno, eso ya lo había dicho. Los coeficientes son obtenidos mediante método de máximo verosimilitud. Y acá tengo un ejemplo que esto lo vamos a sacar ahorita, vean aquí yo es esta imagen de la izquierda, es el pronóstico de mi variable y la probabilidad de ocurrencia de un evento.

00:19:31:08 Es allí, aquí yo tengo el pronóstico y ven que la probabilidad debe ir entre cero y uno, cambio acá a la izquierda a ver que les resulta próximo. Debe ir entre cero y uno, no? Las probabilidades no pueden haber probabilidad negativas, pues con mínimos cuadrados ordinarios ven que si tenemos probabilidades negativas y tenemos probabilidades mayores al uno o al uno o al 100%, entonces esto está mal.

00:20:02:22 Cuando yo hago un pronóstico de una variable dependiente binaria cero uno con una función logística o con un modelo Lolli, vean como cambia la cosa. Aquí tenemos la probabilidad de ocurrencia ciertamente, y se mueven entre cero y uno, no van a ver valores más abajo de cero y tampoco valores más arriba de uno. Entonces, utilizando un modelo de regresión logística, solucionamos ese problema y verán que es lo que les decía.

00:20:40:22 Pues la función logística es una curva, es una recta como esta de acá. Entonces con la función logística solucionamos un poco ese problema y listo. Eso fue todo por hoy en la parte teórica. Ahora sí vamos a dirigirnos a la parte práctica. Entonces permítanme, les comparto e el es data por acá, deberían estar viendo esta data, entonces tenemos nuestro esta esta versión 17.

00:21:20:13 Posiblemente su versión es estén en blanco. Bueno, esto, yo le hice alguna configuración para que quedaran oscurito, porque cuando uno pasa mucho tiempo en la pantalla es recomendable tener puntos oscuros cuando no estaban por ahí trabajando con códigos y todas estas cosas, vamos a utilizar una base de datos de Stata que viene recargado. De acuerdo? Bien, en precarga cuando uno descarga esta tan em se descarga automáticamente y es una base de datos bastante sencilla pero que nos ayuda a comprender el concepto de función logística en este caso.

00:22:00:10 Entonces la voy a llamar a través de este comando y entonces antes de entrar a realizar ejercicios y demás, pues vamos a ver qué es lo que tiene la base de datos. Para eso utilizo este comando uno. Perdón, que creo que campo, y entonces yo tengo una base de datos de unos carros, de unos carros y entonces que tengo, tengo la marca por acá de diferentes carros, tengo 74 carros, tengo los precios de esos carros, no tengo esa variable que son millas por galón, el rendimien to que tiene el carro, cuántas millas hace por cada galón de gasolina?

00:22:46:01 De acuerdo, el número de reparaciones que tuvo en un año, por ejemplo, en el año 78976, cuántas veces fue reparada? 304. Bueno, el espacio de la cabeza un poco hacia el techo del carro. Esto es en pulgadas sinusoidal en el espacio del baúl. El peso es largo. Bueno, a otras variables. Quiero que nos concentremos en esta última. Esta es una variable categórica que se llama faringe, y esto lo que me indica es cual es la procedencia del carro, si es doméstico, es decir, si es un carro nacional o por acá también tenemos unos carros extranjeros.

00:23:12:12 Ferrand No, entonces no se vayan a confundir, porque a pesar de que esto se ve como un texto, vean que acá en la parte de arriba, aquí arriba tiene un número cero, cuando es doméstico toma el valor de cero aquí arriba y cuando es extranjero toma el valor de uno aquí arriba. Entonces esta es una variable categórica que es binaria.

00:23:39:13 De acuerdo, que es una variable, viene de que ya hay algunas preguntas. Voy a responder una facilita o rápido, más bien que si esto solo funciona con esta etapa 17 no es fácil, sino con cualquier versión de Stata. Las otras preguntas las ve un poco más extensas, entonces las respondo más adelante, pero entonces les estaba diciendo esta variable es categórica cero quiere decir que es doméstico.

00:24:25:16 Acuérdense de eso porque va a ser muy importante, pero más adelante doméstico quiere decir cero, toma el valor de cero y extranjero toma el valor de uno. Ahí está cero o uno y pare de contar. Eso es lo que yo tengo por acá. Ups, perdón, eso es lo que yo tengo por acá. Entonces ahora lo que voy a hacer es primero correr una regresión, una regresión lineal, normalita, de las normalitas, y entonces voy a decirle oiga, por ejemplo, yo quiero ver esa raíz, pues yo voy a ser mi variable dependiente, no, yo quiero, es decir, quiero construir un modelo que me permita entender cuáles factores, cuáles variables explican el precio de un carro, por ejemplo

00:25:01:04 acá regresión, entonces, precio entonces, esta es memoria, la dependiente, y yo quiero ver si estas otras variables de acá y explican en alguna forma el comportamiento o los movimientos promedio del precio de acuerdo de el precio. Listo. Entonces acá estoy haciendo una regresión lineal normalita, una regresión normal. Pero observen, ojo, observen que precio es una variable aleatoria continua, es una variable aleatoria continuo.

00:25:31:22 Si yo por acá busco el resumen del precio, acá ven, hay 74 observaciones y el precio promedio son 6.165,257 $, por ejemplo. De acuerdo, entonces esto nos indica que es una variable aleatoria continua. Como es continua, no tenemos ningún problema. Esta regresión lineal nos puede servir. Ok, aquí ya hay que entrar a evaluar la significancia estadística de cada una de estas otras variables que son.

00:26:13:04 Se discutió en el último webcast? No, pero digamos que quiero que se concentren en que esta regresión es esta variable precio es continua tomando valores con decimales. Si yo utilizo esta regresión lineal con una variable binaria, ya no tendría sentido. Entonces vamos a hacer esta, permítanme hacerlo por acá y y entonces la única variable binaria que tenemos es esta acá, no que si es cero o uno, que si es nacional o extranjera.

00:26:41:21 Les decía que tenemos la variable categórica cero o uno y alguna otra variable explicativa. Entonces vengan acá a ver si les puedo compartir nuevamente por acá esto de acá la probabilidad de que ocurra es decir, por ejemplo la probabilidad de que sea extranjero, dado x no dado x x va a ser una variable cualquiera. En este caso va a ser, eh, mpg, millas por galón.

00:27:19:06 Entonces, con esta regresión lineal o todavía no he hecho nada lógico con esta regresión yo voy a mirar si el rendimiento del carro explica o me puede dar un poco la idea de si el carro es extranjero o nacional, no? Entonces corrí la regresión lineal con mínimos cuadrados ordinarios y entonces bueno, yo miro aquí la significancia estadística me dice que en millas por galón, si puede explicar en alguna manera, puede explicar si el carro es nacional o extranjero, pero aquí yo todavía no estoy encontrando probabilidades, no?

00:27:59:21 Y he aquí, por ejemplo, con un modelo con mínimos cuadrados ordinarios, la interpretación de este coeficiente sería, por ejemplo, que por canilla, por galón adicional que un carro haga, se incrementa. La probabilidad de que el carro sea extranjero se incrementa en cuanto el 0.03. Si, bueno, supongamos que el modelo está bien. Supongamos entonces ahora lo que voy a hacer es por acá, graficar cuál es esa relación entre millas por galón y y si es extranjero o nacional.

00:28:23:02 Entonces ven, acá hay una cosa importante la variable categórica extranjero o nacional es una nacionalidad, llamémosla. No toma los valores. Toman valores de cero, que es lo que tienen aquí abajo y tomaba alores de uno, que es lo que tenemos aquí arriba. Por eso está así, porque es categórica o cero o uno y ven que trazó la línea recta porque hicimos un modelo de regresión lineal.

00:28:49:13 Entonces trazo la línea recta, esa línea recta. Digamos que no cogemos acá para la mayoría de los datos, de hecho pasa solamente por un dato aquí, y si extendemos esta línea hacia acá arriba, pues va, quizás va a tocar otro, pero deja por fuera muchos de los números. Entonces aquí esto ya me puede indicar que no sé, como que no es una muy buena idea utilizar este modelo de regresión lineal.

00:28:59:07 Bueno, entonces ahora lo que voy hacer es por acá un principio.

00:29:34:13 Voy a mirar el efecto marginal que tienen las millas por galón sobre mi variable dependiente binaria. Todos esos numeritos de aquí que dicen margen en esta primera columna. Cómo interpreto yo esto, por ejemplo, que cuando el carro tiene o rinde una milla por galón, entonces la probabilidad de que sea extranjero es de menos 36%. Cuando el carro rinde dos millas por galón, la probabilidad de que sea extranjero es menos 33%.

00:30:04:22 Lo contrario por ejemplo, por acá, cuando el carro rinde 47 millas por galón, la probabilidad de que el carro sea extranjero es 107%. Y cuando el carro rinde 51 millas por galón, la probabilidad de que el carro sea extranjero es de 119.5%. Entonces vean que esto era lo que yo les decía. Con un modelo de regresión lineal voy a encontrar probabilidades negativas.

00:30:37:13 Por un lado y probabilidades mayores a uno por otro lado. Entonces, de nuevo, esto me dice que no está bien, esto no tiene sentido. Voy a graficar entonces por acá estoy acá. Y esta era la gráfica que les mostré anteriormente, estoy graficado, eso es, eso es efecto marginal, esos valores pronosticado, si, esas probabilidades que acabamos de ver negativas y positivas.

00:31:06:20 Eso es lo que se grafica acá. Y entonces con el modelo de regresión lineal encuentro una línea si, cuando hago el pronóstico, pero pues ya se los había mostrado, no tiene valor, es negativo y tiene valores superiores al 1%. Entonces me dice esto no, no, que no me suena, no está muy bien. Por qué? Porque de nuevo estamos usando un modelo de regresión lineal para hallar una probabilidad con mínimos cuadrados ordinarios.

00:31:43:14 Entonces no nos sirven con eso que estamos haciendo? Cómo lo solucionamos? Bueno, pues ahí entra la magia y la utilidad de el modelo de regresión logística. Entonces vamos a hacer, perdón, que se fue esto de acá, eh? Vamos a hacerlo entonces por acá y ahora, entonces para ejecutar una regresión logística, utilice este comando acá, lógico que es lo mismo una regresión logística, un modelo.

00:32:12:05 Vean que para la regresión luego el comando era este por acá REC, que es regresión, de acuerdo? Y vean que siguen siendo las mismas variables variable dependiente binaria cero o uno y una variable explicativa millas por galón. Entonces aquí abajo tenemos logic variable dependiente binaria y una variable explicativa. Cuál? Millas por galón. De acuerdo, entonces voy a correr esa regresión.

00:32:42:17 Ahí está. Entonces vean que siguen. Sino son muy diestros con el inglés. Pues estoy acá. Es la máxima verosimilitud. La verosimilitud se abre con la ley común, que es como verosimilitud. Entonces me está diciendo oiga, el modelo lógico ya no está usando mínimos cuadrados ordinarios, que es una forma de hallar estos coeficientes de acá. Mínimos cuadrados ordinarios los usamos para hallar los coeficientes de la regresión con longitud.

00:33:09:18 Entonces ya no usamos mínimos cuadrados ordinarios, sino esa máxima verosimilitud, que es otra forma de hallar esos coeficientes sin que se haya mencionado en la presentación. Y entonces, por un lado, la prueba de significancia individual de esa variable me dice que es buena, es decir, que explica las millas por galón ayudan a explicar la probabilidad de que un carro sea extranjero o no lo puedo entender acá.

00:33:29:16 Y yo les dije en la presentación, en la parte teórica, que esto ya no iba a tener una interpretación directa. A ver, voy a devolverme un poco por acá a la regresión normal. En la regresión normal con mínimos cuadrados ordinarios, yo le puedo dar una interpretación directa a este coeficiente de acá, el coeficiente de millas por galón, cuál sería?

00:34:00:12 Vuelvo a decirlo, cuando el carro aumenta en una unidad las millas por galón, es decir, cuando pasa de rendir, digamos de 10 a 11, pasa de rendir 0 a 1 o de 1 a 2. Cuando aumentan una unidad las millas por galón, aquí la probabilidad en teoría aumenta 0.03. De acuerdo. Porque le podría dar una interpretación directa porque era un modelo de regresión lineal o incluso más fácil con este.

00:34:47:17 Para que no nos confundamos con esta primera regresión acá, cuando por ejemplo, vean este, este coeficiente de acá, cuando las millas por galón un carro aumenta en una unidad a las millas por galón el precio. Porque aquí esta regresión fue sobre el precio y el precio disminuye en 13 13.40 $, por ejemplo. Y otra interpretación de esta directa lo hago para que veamos que cuando no puedo hacer esta interpretación aquí con regresión lineal simple si cuando el carro aumenta en un kilo su peso, porque esto es el peso, no watts cuando el carro aumenta en un kilo su peso, el precio sube 5.71 $ en promedio.

00:35:15:14 Ojo, que esto es en promedio una última. Cuando un carro es extranjero, cuando toma el valor de uno, el precio promedio de un carro sube. Cuánto? 3.550 $ en promedio. Acuérdese que eso es un promedio y un promedio. Entonces, con un modelo de regresión lineal, yo puedo hacer esa interpretación, así como la estoy haciendo directa para contar con un modelo logístico.

00:35:43:04 Ya no puedo eso, ya no puedo hacer eso porque en este caso, en el de regresión lineal, el efecto marginal era constante, era una recta, era el mismo efecto. Aquí tenemos una curva y ya no podemos hacer esa interpretación porque va a ser diferente. Aquí lo único que yo puedo interpretar es el signo, el signo de este coeficiente, signo, este coeficiente que es positivo, en este caso el signo es positivo.

00:36:11:15 Eso que me indica que por canilla, por galón adicional que rinda o que haga un carro es positivo, entonces aumenta la probabilidad de que el carro sea extranjero, liso. Eso sería como la interpretación otra vez, como el signo es positivo. Entonces yo puedo inferir que por camilla adicional que haga un carro millas por galón, que haga un carro aumenta porque es positivo el signo.

00:36:35:02 La probabilidad de que el carro sea extranjero es esa la interpretación que yo le puedo dar aquí. Yo ya no puedo decir que por cada milla adicional la probabilidad aumenta en 0.15, porque es que yo ya tengo una curva, entonces ya no le puedo dar la misma interpretación, digamos, a lo largo de esa curva. Entonces acá solamente interpreto el signo como tal.

00:37:10:01 Bueno, y vamos entonces a ver, un poco es en efecto marginal, que es lo que yo les estaba mencionando por acá. Entonces, si tienen buena retentiva, se van a acordar que la regresión lineal simple. Acá tenemos probabilidades negativas, no vamos a verlo por acá, acá tenemos probabilidades de menos 36%, -33, etc no? Y teníamos probabilidades mayores a uno que tampoco.

00:37:41:07 Está bien. Ahora vamos a ver qué pasó con el modelo lógico. Tengo probabilidades mayores que cero, ok, bien. Y tengo probabilidades menores que el uno o que el 100%. Entonces por ese lado, vean que con máxima verosimilitud solucionamos ese problema. Y por qué? Pues porque esta es una variable categórica binaria, pero uno entonces mínimos cuadrados ordinarios no nos sirve, que no sirve modelos logísticos ni esto.

00:38:16:08 Entonces por ese lado ok liso solucionamos ese problema. Vamos a ver qué pasa a nivel gráfico, o sea que pasa en el gráfico y tenemos entonces la misma gráfica que les había mencionado que les había ahí, perdón, deberían estar viendo la. Lo que sí tenemos la misma gráfica que les mostré en la presentación. Entonces ahora sí vamos a poder hallar una probabilidad que se va a mover entre cero y se va a mover entre uno, entre ese rango.

00:38:43:21 De acuerdo? Y vean que el efecto marginal va a ser diferente, porque va a ser diferente porque es que la la pendiente de esta curva cambia a lo largo del tiempo, entonces ya yo no puedo darle la misma interpretación al coeficiente que sí le da con mínimos cuadrados ordinarios, que era una recta. Entonces yo podía darle esa interpretación, porque la pendiente era la misma, era una recta con una sola pendiente.

00:39:07:12 Entonces yo podía darle una interpretación directa a esos coeficientes. Aquí tengo una curva que cambia de pendiente en cada trazo, en cada uno de estos puntos que ustedes ven acá tiene una pendiente totalmente diferente, no la pendiente que tiene acá es diferente a la pendiente que tiene por acá, a la pendiente que tiene por acá, a la pendiente que tiene por acá.

00:39:40:15 Entonces dado esos cambios de pendientes, por eso yo les había dicho que no se le puede dar una interpretación directa a esos coeficientes de acá. Dados esos cambios en la pendiente, yo ya no puedo interpretar de la misma forma este coeficiente. Acá arriba en la regresión normalita, yo sí puedo darle una interpretación directa a esto, porque es que eso es una recta y esa recta tiene una sola pendiente.

00:40:19:06 Entonces por eso yo puedo dar esa explicación que les daba acá, no sé si me hice entender, espero haberme hecho entender. Entonces con el modelo de regresión logística solucionó todos estos problemas y puedo entonces acá hallar probabilidades. Entonces por ejemplo, cuando el carro rinde 20 millas por galón, cuál es la probabilidad de que ese carro sea extranjero a Bueno, acá la tengo buena 20,69% cuando el carro rinde en 50 millas por galón, por ejemplo.

00:40:59:15 Cuál es la probabilidad de que ese carro sea extranjero? 96.9%. Entonces, con esto yo ya puedo también hacer otro tipo de inferencias y puedo decir Oiga, es muy probable que los carros que tengan un alto rendimiento en el consumo de gasolina sean extranjeros, por ejemplo, o de otra manera, oiga, es muy probable que los carros nacionales tengan un rendimiento de millas por muy bajito y entonces son diferentes tipos de análisis que yo puedo hacer sobre esa información.

00:41:28:22 Eh? Eso es, digamos que hasta acá iría la el ejercicio. Voy entonces a proceder de intentar responder a la mayor cantidad de preguntas que pueda. Y vamos a ver, por cambio yo sé que es un tema quizá un poco denso, por así decirlo, y es muy difícil, yo creo que casi imposible entenderlo a la primera y en una sola hora no?

00:41:51:16 Pero. Pero bueno, digamos que la idea de esto es mostrar un poco cómo se utiliza Stata para realizar un modelo de regresión holística y entender también un poco el trasfondo de ese modelo de regresión logística. Por qué utilizarlo? Porque yo perfectamente pude haber venido y decir es una regresión logística, se hace así para ir contando. Pero la idea es que entendamos un poco el trasfondo de una pregunta.

00:42:27:03 Es ya Infanzón dice cuáles son los tests más usados para evaluar la significancia de los parámetros e hipótesis individual y conjunta? Listo. Ya en este contexto, con este ejemplo de acá, en teoría deben estar viendo por acá, digamos que cuando hacemos una regresión sin importar y es una pregunta interesante, sin importar si es una regresión lineal o una regresión logística, yo puedo evaluar la significancia de estos parámetros, estos de acá y con tres pruebas a nivel individual.

00:42:53:03 Cuáles son esas pruebas? Esta prueba que tenemos en esta columna, si puedo usar esto acá, esta prueba de esa es una prueba, la otra es la prueba con el valor P y la otra es el intervalo de confianza. Están ahí pegaditas. Entonces, con estas tres pruebas de acá, yo puedo evaluar la significancia estadística individual de estos, de estas variables.

00:43:20:14 Ojo, la significancia individual de estas variables es la más fácil para no entrar una a una, porque tú me estás preguntando cuál es mi? Entonces estos son la más rápida, por así decirlo, es la prueba. P Y es que si este valor P es menor al 0.05 es porque la variable es significativa estadísticamente. Entonces este es cero. Entonces es, es, es, es, es estadísticamente significativo.

00:43:49:12 Este cero también no sirve. Esta es ocho 0.008 también es casi cero. Esto es mayor al 5%. Aquí tenemos un 85%. Entonces esto nos indica que esta no es estadísticamente significativa. La constante en teoría debería ser significativa, pero entonces esto nos indica que el modelo como que no está muy bien, digamos no porque nos dice que no es significativa, eh, la otra prueba que yo puedo usar.

00:44:12:10 Ah, bueno, entonces esa es a nivel individual lo que tú me preguntas por los parámetros a nivel individual, a nivel conjunto, como tú lo preguntas, existe algo que se llama la prueba de significancia global, pero de significancia global, y eso yo lo puedo ver aquí con la prueba, con este estadístico. F Es que tenemos aquí F Es la prueba de significancia global.

00:44:37:10 Entonces por lo general cuando esta F es cercana a dos o menor o igual a dos, me indica que el modelo en conjunto a nivel global es un buen modelo cuando esto es cercano a dos menores igualados. Aquí tenemos un F muy grande, lo cual nos indica que el modelo como tal en su conjunto no es un buen modelo.

00:45:11:17 Y por eso yo les decía oiga, es raro porque con la constante debe ser estadísticamente significativo. Entonces aquí hay algo raro, entonces este modelo no de pronto que nos está haciendo ruido o incomodando, es de estas millas por galón que no es estadísticamente significativa. Quizás si la sacamos y volvemos a correr la regresión, el modelo mejor y demás, pero bueno, prueba de significancia global para evaluar el modelo y prueba de significancia individual lo podemos hacer con estas tres variables de por acá e this needs.

00:45:55:11 La regresión logística solo es posible utilizarla cuando nuestra variable es una probabilidad o se puede utilizar para una variable dicotómica. Sí, es decir, cuando tenemos variables categóricas o dicotómicas, como mencionas que puede tomar dos variables binaria, también deberíamos utilizar numerología. Adriana Listo, ya te respondí. Por otro lado, cuando se tienen variables categóricas ordinales como explicativas dos o tres o bueno, eso de dos o tres, yo creo que no sé si estoy bien, pero posiblemente y me confirma eso los abstracto que vienen a ser estos efectos marginales, estoy acá, que fue lo que te expliqué.

00:46:20:00 Luis nos pregunta Es necesario conocer la distribución de cada variable, no? Luis No es necesario conocer si la variable se comporta como uno, no sé, una variable normal o una logarítmica o una triangular uniforme. En este caso no, no es indispensable conocer si es útil, si es útil conocer qué tipo de distribución tiene la variable, pero no, no es necesario.

00:46:47:03 Otra pregunta si se tienen varias categorías en una variable binaria, no sirve esta misma regresión? Si y no se pregunta Jennifer si yo tengo una variable categórica que ya no tiene solamente dos estados de cero o uno, sino por ejemplo tiene 0123, no sirve. Nos sigue sirviendo la regresión logística, pero entonces ya hay que hacerle algún otro tipo de modificación y otro tipo de análisis.

00:47:15:20 Pero la regresión logística sigue sirviendo. Sandra nos dice es decir que para hacer una regresión debo hacerla con variable continua y para lógica un variable categórica. Si Sandra está bien, digamos que tu análisis, si yo voy a hacer una regresión para una con una regresión cuya variable dependiente es continua, podría hacerlo con regresión lineal, con mínimos cuadrados ordinarios y no habría problema.

00:47:49:06 Y cuando quiero usar una variable categórica, debería hacer lo mismo con objetos para evitar los problemas que ya se mencionaron durante la presentación. Eh, por acá. En ese caso, el valor del parámetro que me indicaría Juan David el valor del parámetro este aquí es también. Ya lo expliqué, supongo que me estás preguntando por este. Juan David Pulido Este parámetro se se interpreta el signo, más no el el valor como tal, porque ya lo mencioné, la pendiente y demás.

00:48:17:11 E Cuáles son los valores posibles de lugar del lote Like Eliwood en este caso? No, no nos enfoquemos quizá en estas iteraciones porque lo que está haciendo es probando diferentes iteraciones para ya sacar la regresión logística como tal. Entonces estos valores no nos afectan en un primer momento no nos afecta. Esto de acá es lo que tú estás preguntando.

00:48:48:15 Juan Diego pregunta también por los odds ratio, como puedo interpretar estos resultados? A ver, perdonen la ignorancia, pero para mí estos o tratados que ustedes han preguntado vienen a ser estos efectos marginales. Si no es así, porfa corrígeme estos margin sessions o treasure para mí viene a ser esto, no? Y pues es la probabilidad de que en una regresión logística terminamos aquí encontrando las probabilidad no?

00:49:21:18 Dado que ocurre esta X, voy a voy a cambiar de pantalla un momento para ver si esto funciona mejor. Un dado que ocurre esta X de acá estoy acá. Cuál es la probabilidad? Eso es lo que yo estoy haciendo en ese momento. Dado que ocurra esa X, entonces dado que ocurra esta XX12345. Cuál es la probabilidad? Estoy acá.

00:50:13:19 Eso que tenemos aquí. La primera columna y seguimos. Seguimos por acá con preguntas y respuestas. Pero tú dices que esto colapso, eh? Ya, aquí ya deberían estar viendo esto y status. Vale, seguimos en cuál es esto? Ya no se recomienda usar regresión logística. Bueno, Adrián, eso ya depende de esto. Es como respuesta de abogado, depende de la metodología que tú estés utilizando, porque muchas veces queremos, conocemos el uso de regresión logística y entonces ahora vamos a querer usarla siempre y pues no, y pasa lo mismo con la regresión lineal, sabemos utilizar una regresión lineal y ahora queremos usarla siempre, pero pues hay que evaluar qué tipo de datos tienes, como están organizados, si es una

00:50:52:20 serie de tiempo, por ejemplo, o si son datos construidos de datos de corte transversal de datos panel. Bueno, todas estas cosas pues dependiendo de lo que tú tengas como información, pues vas a vas a utilizar una metodología u otra, eh? Se puede calcular el DIF cuando se ingresa más de una variable independiente al modelo SI 11 o José Hugo Arias, que pregunta si se puede calcular el factor de varianza, la inflación y creo que es el BIF cuando se ingresa más de una variable independiente del modelo.

00:51:23:05 Si se puede calcular, podría explicar un poco los comandos de esta tan. Um. Bueno, vamos aquí a pasar por encimita. El modelo de regresión que hice acá inicialmente, entonces rec para regresión y aquí tras las demás variables. Este es un lo que busca es un summary, un resumen de esta variable precio. Entonces aquí, mientras un resumen de esas variables observaciones promedio desviación estándar mínimo y otra vez regresión.

00:51:50:21 Este Scatter es para una gráfica de dispersión de la variable forty y millas por galón. Y aquí le estoy diciendo que me ajuste una línea recta acá es lo que le estoy diciendo. Márgenes para traer entonces estos valores de aquí abajo estoy acá y en márgenes, vean qué les digo, que vaya cambiando de uno en uno, que vaya desde cero hasta 50 y que vaya cambiando de uno en uno.

00:52:16:08 Entonces, por eso va cambiando aquí de uno en uno. Eso yo también lo puedo modificar. Y finalmente buen margen. Plot es para la gráfica que les mostré a lo último estas dos gráficas de por acá. Pues en que se hicieron estas gráficas de acá con esto cosa como artista? Y finalmente el comando para la regresión logística, que era lógico que se me fue por acá.

00:52:48:02 Lodge Entonces esas fueron como los comandos, así a groso modo para que ahí la pregunta para qué tipo de data puede utilizar el modelo lógico y puedes usarlo para series de tiempo, puedes usarlo para bases de datos, digamos de corte transversal. También puedes utilizar ya para todo panel, no estoy muy seguro si se puede utilizar, no estoy muy seguro, pero sé que para esos otros dos sí, sí se puede, eh.

00:53:15:00 Adriana Pregunta Influye la anormalidad de los datos para hacer regresión logística? En primera instancia no, en primera instancia no influye. A ver, nosotros siempre hacemos dentro de la mayoría de veces, cuando corremos modelos hacemos ese supuesto que los datos se distribuyen de una manera normal. Entonces, el hecho de que sea o no sea así en un primer momento no termina influyendo.

00:53:35:22 Ya cuando tú empiezas a aprobar todos estos supuestos que yo les mencionaba antes de procesos, quisiera la normalidad precisamente y los errores a probar que el valor esperado del error sea cero. Cuando empiezas a probar ya todas estas cositas, te vas dando cuenta que los datos no siempre se comportan como una normal. Entonces de nuevo debes tomar decisiones.

00:54:04:15 Ok? Continúo utilizando este mismo modelo o me pasó a otro modelo? Roberto pregunta Cuáles son las pruebas para validar el modelo? Eso creo que ya lo expliqué. El modelo binario presenta auto correlación, pero sé actividad multi correlación. Pues para eso con la respuesta anterior, para mirar si presenta todas estas condiciones, hay que hacer diferentes tipos de prueba. La prueba bajar que verá para normalidad de las otras pruebas de que no sea excesiva.

00:54:32:23 Débil, eh? Roberto pregunta la diferencia entre lo oye y logística ninguna es lo mismo. Modelo de regresión logística modelo LOLLY Pues logística va a ser logística en inglés, no? Modelo de variable dependiente binaria también viene a ser lo mismo. Entonces no hay diferencia, eh? En variable continua requiere un censo. Es normal esto? Pues creo que también yo ya le respondí.

00:55:05:06 Podría decir cuáles son las pruebas para los modelos Dolly, sobre todo cuando se sacan esos efectos marginales. Bueno, en primera instancia pruebas para estos modelos Logic viene a ser lo mismo. Aquí ya no vamos a tener una. Pruébate, por ejemplo, aquí estoy acá. A ver, van a hacer las mismas pruebas. Por ejemplo, aquí ya no tenemos una prueba té en la primera columna, sino una prueba Z que no la explico por presión de tiempo.

00:55:34:19 De nuevo aquí la más fácil es mirar esto de acá el valor de que nos dice que sí es significativa o mirando también el intervalo de confianza. Cómo miro yo el intervalo de confianza? Por ejemplo, buscando el cero. Acá yo tengo un valor inferior en mi intervalo de confianza y acá un valor superior o máximo si el cero cae dentro de este intervalo de confianza, eso me indica que la variable no es estadísticamente significativa.

00:55:59:03 Si el cero cae aquí, vean que el cero no cae dentro de esa variable, porque cero está como si trazamos una línea recta. El cero está hacia la izquierda porque acá tenemos 0.05, eso es mayor a cero y esto es mayor a cero. Entonces el cero no está dentro de ese intervalo de confianza. Si estuviera dentro de ese intervalo de confianza, me dice que la variable no es estadísticamente significativa y estas tres pruebas tienen que coincidir.

00:56:27:14 Es decir, si la prueba P me dice que la variable es estadísticamente significativa, el intervalo de confianza también debe darme el mismo análisis y la prueba Z debe dar mi mismo análisis. Todas las pruebas tienen que coincidir. Bueno, veo que aun sigue desaparecido. Muchas preguntas, pero por cuestión de tiempo no, no voy a poder responderlas todas, dice Javier.

00:57:01:19 Cuál es el criterio para saber si es lógico proveído? Toby, tú puedes, digamos, intentar hacer las tres, intentar correr un modelo lógico, un modelo proveído. Toby Y mientras analiza los resultados y pues digamos que debes tú determinar cuál viene arrojarte mejores resultados, cuál presenta quizá un menor margen de error, por ejemplo, cuál presenta un mejor cuadrado. Por ejemplo, aquí, por ejemplo, en la lógica no tenemos el r cuadrado como tal, sino un pseudo cuadrado.

00:57:29:06 Entonces ya tú tienes que entrar a mirar, a comparar los tres modelos, porque los tres se van a servir Logic Pro y mientras van a comparar los resultados y pues determinas cuál viene a ser mejor. Qué quiere decir que una variable sea estadísticamente significativa? Listo, una variable que es estadísticamente significativa me indica que efectivamente esa variable me está explicando en alguna manera a mi variable dependiente g.

00:57:59:10 Es decir, si millas por galón es estadísticamente significativa, quiere decir que millas por galón. Si me está explicando de alguna manera los cambios en mi variable dependiente, entonces en este caso viene a ser form, en este caso de aquí arriba en las grandes, en esta regresión, por ejemplo, millas por galón, no es estadísticamente significativa, es decir, que el precio no se ve explicado en promedio por las millas por galón, no?

00:58:35:17 Entonces eso, eso quiere decir a groso modo, porque hay otros supuestos detrás de que la variable es diferente de cero y en fin. Pero digamos que a Grosso modo, eso es lo que quiere decir que una variable sea estadísticamente significativa. Y bueno,

16:00 de la tarde y veo que siguen y siguen y siguen apareciendo preguntas. Entonces vamos a bajar hasta acá, voy a compartirles mi correo para que por favor hagan llegar sus preguntas por correo porque ya por tiempo no alcanzo a responderlas.

00:59:13:15 Ehm. Gracias Jessica. Ahí está, en tres punto Cruz Arroba Septentrión. Siete punto com. Me pueden hacer por favor llegar sus preguntas y con el mayor de los gusto lo estaré respondiendo en la medida de lo posible. Muchas gracias a todos los asistentes. Una muy buena asistencia, casi 120 personas. Muchas gracias a todos por su tiempo, sus preguntas y los invito a que estén pendientes de las demás capacitaciones que se van a seguir haciendo con este software y con todos los demás que tiene software.

00:59:37:22 Y les deseo que tengan un excelente resto de día. Hasta Luego que se muy bien. Para mayor información respecto al software o en temas relacionados, no dude en contactarnos a través del correo electrónico. Entrenamientos a software, guión Ya.com o visitar nuestra página web triple o punto Software Guión Ya.com.

Modelo de Regresión Logística en Stata 17


La regresión Logística o Logit, es utilizada para pronosticar el comportamiento futuro de una variable categórica. Este modelo determina la probabilidad con la que un evento ocurre según unos factores explicativos. En este webcast se ejecutarán algunos modelos de regresión logística y se analizarán los resultados estadísticos obtenidos. De igual forma, se realizaron algunas gráficas para analizar dichos modelos y su nivel de ajuste.

Etiquetas relacionadas

  • Gráficas
  • Pronósticos
  • Regresión Lineal
  • Visualización De Datos
  • Visualización de información

¡Comparte este video con tus colegas!

Compartir

Ver más

Cotizar
Próximos
Eventos

X

Mis cotizaciones:

Comentarios a tu solicitud:

Cotizar