SS_Logo

Regresión Lineal Simple con apoyo de Stata 18

Autor: Erika Paola Laitón Castellanos / Portafolio: Quantitative / Vie. 14 de Jul de 2023

Transcripción de este video

00:00:30:03 Shopper Shop, la empresa líder en la implementación de herramientas analíticas y software especializado en Latinoamérica, les da la bienvenida a esta presentación. El día de hoy contamos con el acompañamiento de la instructora Erika Paola Light, gerente del portafolio cuantitativo en Software Show. Experiencia en el uso de tecnologías para el análisis de datos cuantitativos aplicadas a investigaciones sobre política pública, estudios de género y educación.

00:01:06:00 Actualmente apoya a grupos de investigación y entidades públicas y privadas en temas relacionados con gestión y análisis de datos y trabaja en proyectos de integración de datos mixtos para entidades que manejan grandes cantidades de información. Bienvenidos pues de nuevo entonces. Muy buenos días para todas las personas que ya se encuentran conectadas. Bienvenidos entonces a este espacio. Como ya les mencionó Liza, el día de hoy vamos a trabajar sobre y la parte de la regresión lineal en su estructura, tal vez más sencilla, la regresión lineal simple.

00:01:50:13 Y de allí pues lo que vamos a abordar principalmente son tres cosas. La primera corresponde pues a la interpretación del modelo a que corresponde cuando cuando hablamos de la regresión simple. La segunda va a estar relacionada justamente con los datos que nos arroja estrato y los diferentes comandos que podemos aprovechar allí. Y la tercera, pues va a ir directamente de la mano con la opción que tenemos desde visualización de algunas posibilidades que se van dando al momento de trabajar con la regresión y por supuesto, la exportación de este resultado mediante, mediante algunos comandos y puntualmente a un documento en Word.

00:02:20:09 Entonces, pues para iniciar, voy a dejar aquí un permítanme acomodar un poquitico la pantalla para estar atenta a las preguntas que puedan surgir en el chat y pues ir respondiendo tal vez de manera inmediata y durante la presentación. Entonces permítanme, voy a tener también el video. En tanto quienes estén en un dispositivo móvil les es más fácil ajustar su pantallita sin la cámara disponible.

00:02:58:04 Entonces, pues acá empiezan a surgir algunas preguntas sobre la presentación. El video estará disponible a partir de la próxima semana. En un momento les compartimos los enlaces donde podrán encontrar la información y la pueden consultar, como les digo, a partir del lunes o martes de la semana siguiente. Entonces, como ya les mencionó, Lisa hace un momentito, pues el objetivo va en disposición de conocer las diferentes posibilidades que nos da, particularmente la regresión lineal en la versión 18 del software.

00:03:31:13 Sin embargo, pues todos los comandos que mostraremos y las herramientas que trabajaremos están disponibles en versiones anteriores. Entonces allí no vamos a tener ningún inconveniente. Lo primero, pues, es mencionar que es justamente la regresión, y digamos que si lo pensamos de manera general y de la manera más, más sencilla, es una relación. Entonces, qué es lo que nos facilita este tipo de técnica e verificar la relación existente entre variables.

00:04:00:23 Particularmente cuando hablamos de la regresión lineal, pues estamos hablando de una relación lineal entre variables y como dijimos que vamos a abordar. Y pues justamente el caso más sencillo de este tipo de modelos, pues entonces diremos que es una técnica que nos permite predecir una variable según otra variable. En ese caso estaremos hablando de una regresión lineal simple cuando no tenemos una sino muchas variables adicionales.

00:04:33:23 Entonces vamos a hablar de un caso múltiple. Diríamos entonces que estaríamos en una regresión lineal múltiple en ese sentido, pues entonces la regresión lineal simple trata de explicar la relación que existe entre una variable que nombramos comúnmente como respuesta y que generalmente la vamos a encontrar como ñe e y una variable que llamaremos explicativa y que será de nota como x y vamos a encontrarnos en la literatura con diferentes nombres para para la variable respuesta y la variable explicativa.

00:05:04:20 Pero al final, pues digamos que nos están correspondiendo justamente a la explicación de esa relación. Entonces pues bueno, se le conoce a ese modelo de regresión y pues al modelo matemático que busca determinar esa relación lineal, como les digo, entre las dos variables, eso representa o por por una función que va a estar asociado a una, a un segmento de recta, una línea recta e y pues se incluyen diversas metodologías para calcular esa relación.

00:05:25:09 Uno de ellos es tal vez el de los más conocidos, pues es el método de mínimos cuadrados. No es el único, pero pues tal vez es uno de los más numerosos, es las dos variables que hacen parte de la regresión, pues van a estar denominados según su información y así mismo les vamos a llamar en nuestro modelito de regresión.

00:05:59:15 Ya en un momento haré precisión dentro de esta. A que me refiero con que así como están denominadas como dependientes, dependiente e independiente? Dependiente, perdón, las vamos a llamar en ese mismo, en ese mismo orden y en la información. Entonces de nuevo, pues la variable independiente, explicativa, predictor o regreso era pues va a representar esas entradas del modelo y la variable dependiente explicada o de resultado, pues va a arrojar los valores de esa variable que depende de los resultados.

00:06:47:12 Es un resultado de los valores de otra variable. Entonces en ese caso, pues podríamos decir de forma general y que estará en función de X mixto. Entonces yo digamos de una forma más estructural. El objetivo de ese modelo de regresión es tratar de explicar esa relación entre la variable dependiente variable respuesta y un conjunto de variables independientes. De nuevo, cuando hablemos de y ese conjunto lo haremos del caso múltiple, que serán las variables explicativas y que comúnmente las encontramos como X1X2 está xn, pues según sea el caso del número de variables, entonces con esa estructura general, pues vamos a encontrar un modelo para obtener ese mejor ajuste de nuevo de esa línea recta, y lo

00:07:15:15 que buscamos es obtener la mejor proyección, pero que a su vez e minimice esa diferencia entre esa información y en esa misma, en esa misma, en ese mismo método. Siempre vamos a encontrar un error asociado a la predicción y ya lo veremos un poquitico más adelante. Entonces, en efecto, pues permítanme aquí voy a usar un par de de apuntadores y un par de datos.

00:07:49:15 Entonces, lo que ustedes están viendo aquí, pues corresponde a las observaciones que las están viendo señaladas con los puntos EM, lo que lo que nos indica, pues teóricamente esta información es que, bueno, podemos suponer, podemos pensar que hay muchos más puntos. A ver donde se ve que se está ahorrando ya podríamos suponer, pensar que hay muchos más puntos y dentro de esta, dentro de esta gráfica y así como podemos encontrar más puntos, pues entonces podríamos encontrar más rectas.

00:08:15:00 Dijimos que lo que queríamos era la recta que mejor represente esa información. No es por eso, pues el ajuste que se va a dar corresponde tal vez a la que mejor describa el comportamiento de estos puntos según según la recta que vamos a tomar. Permítanme, vamos a borrar estos aquí. Y ustedes notan que aquí hay una pendiente, cierto?

00:08:39:19 Entonces, pues justamente vamos a construir esa información a partir de lo que tenemos aquí. Entonces dijimos vamos a tener una variable, ya que será la variable dependiente, es la que depende de las demás variables. Y entonces tenemos una variable y y comúnmente nosotros nos encontrábamos con esta ecuación es igual a mx más v sí. Entonces aquí la podemos recordar rápidamente.

00:09:16:12 Fíjense que cuando vamos a recorrer la parte superior nos aparece un beta cero, un beta uno x y como les dije antes, un error. Si es que encontramos, tenemos nuestra variable pendiente, en este caso beta cero, le llamaremos intercepto, que pues va a corresponder justamente a la información que encontramos aquí con el intercepto LGG Beta uno pues está acompañando la X y si recordamos la que estaba, la que les estaba mostrando es momentico de mx más B pues vamos a encontrar entonces nuestra pendiente que va a corresponder a quien?

00:09:40:21 A la variación en ñ, cuando x cuando perdón se tiene una variación en x? Listo, entonces aquí ya tendremos estos dos primeros datos. La X, pues entonces va a variar de acuerdo a la naturaleza de nuestra información. En este caso solamente vemos Beta uno, aquí falta uno beta 1X1 y este pues variaría de acuerdo a la cantidad de variables independientes que tomemos.

00:10:13:03 Si en este caso pues de nuevo estamos en el caso más sencillo, que es el modelo de regresión lineal simple y por supuesto, pues como hablamos aquí, en este caso en términos estadísticos y sabemos que existe y pues algunas opciones que se van a quedar por fuera, por eso damos un término de error, entonces tenemos aquí la información completa que nos va a mostrar nuestro modelito, una variable dependiente, un intercepto, la pendiente y la variable independiente.

00:10:44:11 Con esto entonces permítanme, vamos a irnos a esta y vamos a empezar a construir nuestra información y a ir revisando pues los distintos datos que nos va a ir arrojando justamente nuestra, nuestra regresa, es nuestro modelito más sencillo. Entonces permítanme, voy a dejar aquí la presentación un segundo. Listo? Y me voy a mover ahora sobre mi espalda. Entonces.

00:11:35:06 Bueno, antes de iniciar, tal vez me detendré sobre. Sobre estad. No sé si me cuentan de pronto en el chat, si han trabajado antes con Stata y se han trabajado particularmente este tipo de procedimientos en su interfaz. 18 Entonces les estaré leyendo pura. Entonces fíjense que pues que tenemos en en este caso pues una sección asociada a las variables, una sección asociada a las propias, este de otro lado tenemos una ventanita de revisión y en la pantalla central en este caso pues que ustedes están viendo que hice esta ATA 18, pues corresponde justamente a la información que se va a ir arrojando desde desde la ventanita cuando vayamos trabajando.

00:12:10:23 Cualquiera de las opciones en esta entonces no se ve. Me podrían confirmar si se está viendo? Permiten vamos a poner un apuntador en color rojo para que me puedan indicar si ya logro ver no se ve la pantalla según. Bueno, vamos, una una. Muy fácil. Dejemos de compartir y volvamos a compartir aquí la información. He visto un alguno me podría confirmar si ya estamos viendo nuevamente.

00:12:49:20 Muchísimas gracias. Por acá. Listo, perfecto. Bueno, como hay algunas personas que nos indican que no conocen. Vamos a hacer dos cositas, vamos a movernos aquí sobre la interfaz general y ah, bueno, por acá nos cuentan algunos y han trabajado, algunos no han trabajado con data eh? Con respecto al material, bueno, en un ratito cuando este lista les comparta la la encuesta, sí, si lo requieren podrían hoy incluir su comentario para que podamos tener contacto posterior y pues allí les comparto la información por ahora voy a trabajar desde cero para que vaya quedando la información justamente en la ventana de revisión.

00:13:42:02 Entonces, y permítanme un recorrido realmente muy, muy rápido por la interfaz para que sepamos sobre que nos vamos a mover. Entonces les decía una ventanita de variables y de propiedades, una ventanita de revisión que justamente pues esta va a ser la que nos permita replicar los resultados y poderlos compartir. Una ventanita asociada a los resultados y una inserción mediante comandos stata pues es un software que nos permite trabajar mediante ventanas, según lo pueden ver en la parte superior, pero también nos permiten hacer trabajo mediante mediante comandos e incluso nos permite integrar diversos lenguajes de programación y uno de ellos mata, que corresponde al lenguaje matricial de Stata E y pues también nos permite trabajar con

00:14:18:09 este comandos desde desde python. Entonces pues esa es otra de las posibilidades. Bien, entonces ahora como quiero trabajar una tabla de datos, pues que pudiésemos pudiesemos replicar y que podamos compartir sin mayor inconveniente. Entonces pues voy a usar justamente una tablita de datos que está en y stat y que pueden instalar. Les voy a dejar aquí en los comandos un segundito, les voy a dar aquí en los comandos la instalación de esta serie de tablas de datos.

00:15:12:20 Aquí se las pongo y esa está asociada justamente con un texto y de las de los textos de Stat. Entonces voy a trabajar con esta tablita y de RM Punto de team. Limpiemos por acá la memoria para que no tengamos ningún inconveniente. Listo. Entonces es la que voy a indicar aquí mediante la instrucción de he de trabajar con mis datos la o indicar mediante los comandos que esos eventos no recuerdo puntualmente en qué carpeta platico y voy a iniciar aquí una grabación de mi archivo log para que quede almacenada, pues justamente al finalizar esta esta sesión, entonces déjenme, la voy a guardar aquí en mi escritorio y la voy a poner por acá y y

00:15:33:01 la voy a poner por acá. Puede ser, entonces a este le voy a poner webcast de regreso, listo? Entonces dice bueno, voy a empezar a grabar desde el minuto y 17 a las

11:00. Perfecto. Entonces voy a decirle ahora también que vamos a definir un directorio de trabajo para que no me pase lo que me acaba de suceder.

00:15:59:11 Que justamente es que no recuerdo donde instala la tablet. Listo. Y vamos a guardarlo justo ahí. Bien, entonces, como ya tengo mi tablita, fíjense, aquí tengo cargada la tablita, voy a mostrárselas aquí rápidamente y ya está listo. Entonces, como me muevo sobre la visualización, voy a la parte superior en el botón editor de datos, donde está la Lupita que tenemos en esta tabla?

00:16:24:14 Pues es una encuesta en la que a las personas se les ha consultado por su año de nacimiento y se les pregunta si el sexo al nacer el estado civil y se les pregunta si tienen o no tienen hijos, se les pregunta por la educación de los padres, se les pregunta el número de años y de educación que tiene cada una de esas personas, su estado de salud.

00:16:52:04 Y bueno, hay diversas diversas preguntas en esta tablita. Yo me voy a quedar únicamente con una parte de los datos. Entonces voy a quedarme y mediante, mediante un KEEP podría trabajar con una sección de subconjuntos y o con unos frames. Los frames in stata, pues hacen referencia justamente a poder tener subconjuntos dentro de una misma sesión y podría trabajar sin ningún inconveniente.

00:17:28:04 Entonces, por ejemplo, podría iraquí, el manejador de marcos de datos por acá, y entonces podríamos crear 1/2. Entonces podría poner por ejemplo break para que sea la regresión y me podría mover sobre REC. Fíjense que aquí lo que pasó fue que quedó en blanco mi tablita y entonces pues voy a decirle a bueno, con los datos originales, cierto, no hay perdón, aquí me quedo el el archivo listo con los datos originales que ese solamente con esta parte.

00:17:55:08 Entonces me voy a regresar aquí en mi otro frame. Fíjense el listo que es el que se llama default para no movernos aquí que viene, por lo que me moví dos veces, entonces me quedo ir, el error se muestra, entonces aquí le digo bueno que es con estas, con estas observaciones nada más y fíjense, entonces me dice ah bueno, ya no tiene las 54.000 observaciones, sino que tiene 930 observaciones, etc.

00:18:27:00 Entonces qué es lo primero que hacemos cuando iniciamos? Pues con nuestra información, pues irnos al menú de datos y conocer y nuestra tablita vamos a ir a datos, le vamos a decir bueno, escríbame rápidamente estos datos y puedo aquí mediante la opción OK o mediante la opción enviar y generar una descripción del contenido de una información si le doy o que hay la opción se ejecuta y se cierra automáticamente la ventana y enviar la opción se ejecuta pero se mantiene abierta la ventana.

00:19:07:16 Pues fíjese que me hallé aquí el el el conducto, la descripción de mi información y noten además que siempre tengo algo, algo muy bonito y que me parece muy importante es revisar las etiquetas y las etiquetas de valor. Y entonces fíjese que aquí me muestra mis etiquetas y mis etiquetas de valor asociadas. Entonces, como tenemos algunas variables asociadas, por ejemplo a la educación de los encuestados y la educación de sus padres, pues vamos a iniciar justamente revisando esto, pues haré una tabulación, pues podríamos ir aquí a la sección Estadísticas de Ventanas para que se vea un poco más, más y para que se tenga una opción más visual.

00:19:39:23 Entonces puedo hacer la tabla de frecuencia. Espero la tabla de frecuencias y de mi variable dijimos educación. Pues acá está la variable educación. Enviamos nuestros datos. Fíjense, entonces las personas pueden reportar desde cero hasta 20 años en nuestra tablita. Perfecto. Veamos, por ejemplo, la tabulación de la educación de los padres, que está nombrado como pa educ. Podemos escribirlo, podemos buscarlo desplazando el cursor, tal como lo muestra su momento.

00:20:05:16 Entonces tenemos nuevamente de 0 a 20 años y la educación de las madres. Entonces usemos ma educ. Y de nuevo, pues entonces tenemos nuestra información y esto. Entonces veamos lo siguiente vamos a hacer un sumario para estas tres variables, entonces podemos ir aquí a la sección Estadísticas, Sumarios, Tablas y test Sumario de Estadísticas y seleccionamos las variables que requerimos.

00:20:35:05 Entonces dijimos vamos a ver la variable educación, que es la educación del encuestado, vamos a ver la educación del padre y vamos a ver la educación de la madre. Entonces vamos a generar, usamos pues esa visualización en nuestro sumario. Noten aquí lo que aparece, tenemos nuestras observaciones y la media aquí asociada en años de educación, la desviación de nuevo, pues este tipo ya lo conocíamos el mínimo y el máximo.

00:21:08:20 Entonces por aquí no lo están haciendo. Una consulta acá sobre sobre actualización del software. Sí, por supuesto, pueden hacerlo y por aquí les estamos dejando el correo electrónico o si gustan dejarnos su correo y estaremos encantados de contactarles para poderles ayudar. Entonces dijimos pues lo que queremos es ver una relación, cierto? Entonces tenemos aquí nuestros datos y vamos a irnos a la sección de gráficos y gráficos de la entrada, listo.

00:21:34:08 Y vamos a crear un primer gráfico. Entonces vamos a tener un gráfico de dispersión asociado pues, a nuestra información. Vamos a pensar en lo siguiente. Entonces pensemos en la educación del encuestado, como se ve afectada o positiva o negativamente por el nivel de educación de sus padres. Como es una regresión lineal simple, pues entonces vamos a incluir una sola de ellos.

00:22:06:15 Entonces en la variable le vamos a tomar a la educación del encuestado, cierto, y en la variable X vamos a tomar la educación, por ejemplo, el padre listo. Tenemos entonces nuestro primer gráfico asociado y le vamos a decir aceptar y vamos a decirle además y qué cree? Otro gráfico? Aquí para la educación también escribir acá y la educación de la madre va educar.

00:22:40:09 Listo, aceptamos. Y entonces vamos a desactivar por ahora el gráfico, lo vamos a enviar el primer gráfico gráfico. Fíjense, entonces tenemos los años de educación del padre y los años de educación del encuestado. Entonces fíjense el comportamiento que va a tomar esta información. Dijimos Ah, bueno, esto de hacer una regresión es trabajar con un modelo que me permita crear una recta y que visualice el comportamiento de esta parte.

00:23:10:05 Entonces, en este mismo este, en esa misma ventanita de los gráficos, pues vamos a crear un tercer gráfico en donde vamos a irnos a los gráficos de ajuste de modelos. Aquí tenemos diferentes ajustes y particularmente nos vamos a fijar en el de predicción lineal y aquí pues vamos a tomar nuevamente nuestras variables, nuestra variable, y es la educación de la encuesta y nuestra variable x es la educación de el padre y la encuesta.

00:23:39:02 Listo, aceptamos. Enviamos nuevamente. Fíjense que el gráfico está inactivo y tenemos aquí e pues nuestro ajuste de proyección lineal para este caso sí. Entonces ahora lo que vamos a hacer es describir justamente esa información para al final poder tener algo similar a lo que teníamos en la diapositiva donde teníamos nuestro gráfico y teníamos aquí el modelo que describía temáticamente está esta recta, ese segmento de REC.

00:24:07:00 Bien, entonces fíjese que hasta ahora hemos estado moviéndonos justamente sobre la sección de los gráficos. Hagamos el mismo ejercicio. Ahora desactivamos el uno y el el tres y y activemos aquí el dos y creamos 1/4 gráfico. Ya sabemos cuál es el ejercicio. Entonces vamos a ir al ajuste de modelo Proyección lineal educ. Y nos vamos a acá a la educación de la madre.

00:24:31:01 Listo. Aceptamos, enviamos, entendíamos que está en activo los otros dos y de nuevo pues tenemos la información. Fíjese que en el otro lado habían unos puntitos que quedaban un poquito más arriba y solamente habían unos valores atípicos por acá. Entonces hay un pequeño cambio, un pequeño cambio. Sin embargo, pues la información es muy similar. Entonces ahorita corremos los dos modelitos para que veamos como se comporta.

00:24:58:18 Entonces bueno, hasta ahora estamos en esta primera parte de la visualización y ya tenemos pues justamente ese modelo de manera general donde encontramos la regresión en stock. Entonces en la sección estadísticas, fíjense que esta en general está organizado de menos a más y de lo más transversal a lo más particular. Si ustedes notan este menú estadísticas, lo primero que nos muestra es justamente los sumarios, que fue lo que usamos.

00:25:28:23 Y nos aparecen las tablas y los test de hipótesis. Podríamos, por ejemplo, incluso antes de esto, generar un test de hipótesis clase. Conteste, por ejemplo y para, para hacer una revisión antes. Y lo segundo pues que aparece en esta misma tablita de las estadísticas y es la parte de modelos lineales y afines. Si nos vamos moviendo cada vez más abajo, pues encontramos cosas un poquito más particulares siempre que nos vayamos desplazando.

00:26:02:09 Por ejemplo, encontramos la parte de análisis Valles llanos, la parte de muestreo, la parte análisis y multi variado, y así con cada una de estas ventanitas. Entonces vamos a regresar aquí a la primera partecita, modelos lineales y afines. Y fíjense que la primera que aparece es la regresión lineal. Entonces, teniendo la regresión lineal, nuestra estructura, y aquí entra lo que les estaba contando hace un ratito y en términos de las J y de las X, entonces lo primero que vamos a añadir es la variable pendiente.

00:26:34:07 Cierto que nuestra variable pendiente es educación y nuestra variable independiente va a corresponder a la educación del patrón educ. Listo, la tenemos. Vamos a darle clic en Enviar para que se mantenga abierta Distopia ya. Y tenemos entonces nuestra primera regresión y la la deje abierta para poder añadir aquí un par de cositas. Entonces ahora le voy a decir soñarme, por favor, el de la educación de la madre.

00:27:03:21 Podríamos crear un tercer modelo de nuevo, que ya no hablaríamos de regresión lineal simple, sino de regresión lineal múltiple cuando incluyamos las dos variables. Entonces le voy a dejar solamente para mostrarlo en un segundo y que podamos hacer una revisión general. Listo. Entonces cuando generamos nuestra regresión, fíjense que tenemos algún valor chicos, y que resultan pues de interés en nuestra salida de Stata.

00:27:36:13 Entonces tenemos pues nuestro modelo aquí, la sección de los cuadrados. Entonces aquí nos dice pues que también está ajustando nuestra información. Este valor se mueve entre cero y uno y pues entre más grandes y hace valor, pues y mejor va a tener ese comportamiento y pues asociado a la predicción de nuestra información, entonces veníamos por acá y la variable y la variable que estamos trabajando para comparar.

00:28:02:09 Entonces yo hice por aquí en un segundo en la presentación, una pequeña, un pequeño slide para contarles un poquitico sobre los justamente lo que queríamos era construir nuestro modelo, cierto? Entonces aquí atrás en el es la ya anterior, tenemos ya igual a beta cero más beta uno x más en en esta salida, quién es cada uno de estos valores?

00:28:44:18 Entonces tenemos beta cero. Justamente aquí es donde aparece el guión bajo y la palabra cut. Entonces tenemos nuestro beta cero, que es el intercepto y en la parte superior, justo donde aparece el cruce con la variable que estábamos evaluando como independiente, pues encontramos justamente esa, esa pendiente, cierto? Entonces si lo pusiésemos en términos de lo que estábamos construyendo, entonces tendríamos G igual a 9.7, 1.74 más la pendiente que cero 35 e y el X1, que es el que estábamos acompañado.

00:29:11:13 Y le podemos añadir el error, cierto? Entonces si escribimos pues de forma general la la el, el modelo de proyección que estábamos generando anteriormente, pues es justamente este comportamiento el que tendríamos. Bueno, por acá tenemos los valores de t e y y la información asociada a la guía en este caso y el intervalo. Entonces, cómo construimos? Detengámonos aquí, tal vez sobre este.

00:29:53:18 Sobre este valor, si, como logramos obtener este. Ese valor, pues fíjense que en la parte superior lo estoy refiriendo como lo que estamos es validando una, una prueba hipótesis donde vamos a cero, por eso encontramos este, se baja el cero 35, fíjense aquí y lo dividimos sobre el valor sito de la información, del error estándar que es este cero 23, fíjense acá y me da 15,10, que es justamente este valor que tenemos en este caso yo es el 34 cero ocho solo como para que lo veamos por el ejercicio y ya lo realizamos entonces 9.74 sobre 2.85 y tendríamos el l 34 cero ocho.

00:30:44:15 Vamos entonces a hacer ese pequeño ejercicio para que veamos esta información. Sí, es aquí para esta nota nuevamente. Y entonces escribimos esta también tiene una opción de calculadora, entonces es display, fíjense que hay un segundito, acá están los valores, pues display dijimos entonces un 35, este valor, si total vamos a ponérselo completico por aquí y nos puede dar el valor del con y aquí, entonces punto 23 mismo lo ponemos, ay, perdón, aquí me quedó, no me copió correctamente, distorsiona y ya lo copió y listo.

00:31:14:09 Entonces fíjense 15.10, que es el 15.10 que teníamos justo enfrente y el otro entonces display lo mismo, entonces acá nueve como siete, cuatro yori sobre que olorcito entonces punto 28 59. Entonces tendríamos el este para este caso listo? 34 cero ocho lo mismo sucede para el de la. Para el de la educación de la madre y que decíamos en nuestra presentación.

00:31:47:14 Entonces dijimos Ah, bueno, mire qué? Y la información de la pendiente corresponde por acá. Listo, así corresponde. A qué corresponde? A una variación en sí, una variación en unidades asociadas en ye e cuando se tiene una variación en X y esto entonces es lo que tenemos justo aquí. Entonces regresemos aquí a nuestro modelito. Pues y hagámoslo con este primerito que tenemos acá, con el de educación de los padres.

00:32:22:09 Entonces fíjense que justamente este modelito nos quedaría la educa ción. Igual vamos a aquí un pequeño asterisco. Listo? Y ahora sí. Entonces 9.74. Si en ángulo con dos cifras nada más y más, un 35 sin arte X, que es la educación en este caso de El padre educa y dijimos le sumamos siempre el error, cierto y perfecto. Lo dejamos ahí.

00:32:55:09 Qué quiere decir esto? Entonces, por cada año de educación del padre, pues se ve afectada la educación en 0.35, la de la educación de la encuesta. Listo entonces lo mismo sucede por acá. Entoces veamos el otro, el otro modelito que teníamos acá con la educación de la madre. Entonces nuevamente pongámonos en unas fresquito, la educación igual por acá, entonces este es 9.58 qué?

00:33:43:17 50, ocho, discúlpenme 58 y más. Entonces tenemos punto 36. Ciertos siete, tres y tenemos entonces la educación de la madre Mineduc. Y pongámosle aquí entonces el término de error. Y esto sucede mucho y en ambos casos pues nuestro modelito. Fíjense que aquí la regresión de El Padre, por ejemplo, podría resultar de interés y pues en muchos ejercicios lo vemos y que podemos usar la ecuación de la regresión esta que obtuvimos aquí arribita justo acá para calcular la media predicha de la educación del encuestado para cualquier nivel dado y dado el nivel de educación del padre.

00:34:22:22 En este caso, por ejemplo, entonces decimos no sé si el padre tuvo ocho años de educación entonces y sustituimos pues acá en en Facebook la información por ocho y entonces eso nos daría como resultado. La media pronostica y para ese caso es data. Nos facilitan esto mediante el comando margin y lo podemos correr así. Margen le decimos cuando pase y tal cosa, entonces le vamos a ver aquí la variable que vamos a sustituir, déjenme ver aquí lo buscamos, mírenlo acá antes y la podemos simplemente traer.

00:35:02:20 La educación del padre va a ser igual y mucho. Y el ejemplo ocho entonces de una manera bonita, listo. Y corremos entonces nuestro margin simplemente le damos un entero y fíjense, pues tenemos entonces la información asociada. Entonces esperaríamos pues que y la media pronosticada sea de 12.60 y 62. Pues ir ahí entonces es lo que nos calcula este comando y puede ser también que nos interese conocer, por ejemplo, y no sé, la educación por varios años de acuerdo a este.

00:35:48:17 A este caso. Entonces vamos a decirle ah, bueno, entonces lo quiero para que valores lo ponemos aquí entre paréntesis el 11 para le para ocho, para 12 años de educación había otro que era 16, sino la tablita que había por ahí y el máximo bloque era 20. Y si mal no recuerdo, en la sociedad, obviamente la tabulación de la educación del padre, si el máximo es 20, un sí se ofreció como lo correcto, aunque aquí hubo lo que tenía esto digamos, puesto 12 más sumémosle a cuatro, 16 y 20, y entonces tenemos pues nuestra información para acá de nuevo.

00:36:26:05 Si lo que queremos es verificarlo, pues entonces podríamos usar la opción Display. Por acá teníamos nuestro, nuestro mundito acá, entonces lo que haríamos es tomar nueve 74 más 0,35 y esto lo multiplicamos por el valor que en este caso sería, digamos ocho. Acá listo, me faltó poner el display listo porque no, no se rompieron bien. Y fíjense entonces tenemos ahí nuestra información.

00:36:57:08 12.64 listo, entonces vamos con, vamos con y bueno, usemos este mismo de Martínez con educación para ocho y usemos este mismo con educación para ocho, 12, 16 y este listo no tenemos acá. Entonces fíjense que lo que vamos a hacer es lo siguiente ah, bueno, una forma es es mediante esta sección y desde la revisión no, pero ahora y bueno, veámoslo de manera gráfica.

00:37:26:11 Entonces, qué podemos hacer para ver esto de manera gráfica? Fíjense que está también tiene una opción que es el margen slots, entonces ah, bueno, esto es importante, la el margin, cuando lo generemos, digamos en este caso sobre la educación del padre, lo va a generar inmediatamente después de la regresión y de educación del padre. Sí, sí, lo generamos después de la regresión de la madre y pues entonces nos va a indicar que la información está errónea porque no encuentra justamente la regresión anterior.

00:38:05:02 Listo entonces margin, le vamos a decir. Y Martins Klotz esto para este caso pienso que lo que nos indicó fue lo siguiente los valor sitos 12, 61, 14, 15, 16 y miren aquí los intervalos de confianza, pues que va a arrojar este gráfico. Vamos a crear cada uno de los puntos sí, en los que lo solicite. Miren, es este ocho, 12, 16 y 20 que son los que están acá y lo que me está mostrando entonces el puntico, el centro, va a corresponder al dato que me esté arrojando aquí en esta columnita que ha llamado margin y.

00:38:31:17 Y los segmentos, los los bigotitos de cada uno de estos puntos van a corresponder. Perdón, me voy a mover acá al intervalo y con un 95% de confianza. Pues bien, ahí los ponemos, los podemos revisar, veamos el último, por ejemplo. Entonces este puntico tiene que estar en qué? En 16, 92, miren acá, si lo quisiéramos verificar, pues lo que hacemos es construir y unos uno segmentos, perdón, de recta.

00:39:13:17 Entonces podríamos decirle a bueno, yo quisiera un segundito, yo quisiera construir un segmento en X y un segmento en ya nuestra aquí tomando el pelo, la en mano, no trato, es que me crea mucho y ahora entonces pienso que si lo que construimos es lo que trazamos, pues correspondería justamente el valor sitio en la parte súper bueno, hagámoslo con ese que está acá más visual rápidamente.

00:39:44:13 Entonces 12.61 es este puntito de acá y si nos vamos a la parte superior y de su bigotito, entonces vamos a encontrar 12.86 justo acá y 12.36 justo aquí. Bajito sí, y así con cada uno de los valores. Lo interesante ese Martins Pilot, es que lo podemos obtener y para cualquiera de los de los valores que estamos trabajando con con, pues el caso de la Media Premio de la Educación, listo ese gráfico, por ejemplo.

00:40:27:03 Entonces dijimos que queríamos ver opciones de exportación de nuestra información. Ah, bien, sé lo que pasó ahí, no le voy a abrir el margen de la educación. Ahora sí y ahora sí, pero no sé si el gráfico, que es lo que les comentaba hace un ratico. Entonces voy a guardar este gráfico. Me lo voy a guardar pues en mi, en mi directorio de trabajo le voy a poner Martín uno listo, lo guardo y bueno, otro, otro tipo de gráfico que podemos obtener es justamente cuando vemos las banditas de confianza y no con los segmentos, sino con la banda total de nuestra información.

00:40:48:10 Entonces sí se lo corremos de la siguiente forma en un segundo corremos un momento más bien aquí para que lo vean. El comando de nuevo es Martínez Plop! Pero cómo le vamos a dar una opción? Entonces lo que hacemos es decirle Gomita, le vamos a decir que nuestras y las líneas y que nos trace también el área para el intervalo de confianza.

00:41:31:02 Entonces Kast e interviene confianza y vamos a trazar el área de nuestra información. Cierto? Entonces vamos a darle aquí un clic y pum, pum, pum, listo. Y fíjense, pues acá nos arroja nuestro gráfico listo. Entonces me indica que pasó, me dicen que se detuvo nuevamente la pantalla. A ver, ya veo que ya me confirman. Yo también en este momento el gráfico con las banditas ajustadas en color azul, por favor.

00:42:02:06 Listo ya. Entonces aquí pues podemos ver justamente la información que teníamos en el caso anterior, pero ya con las bonitas de confianza asociadas de nuevo, pues esto lo podemos guardar y lo podemos trabajar. En este caso le voy a poner en dos por aquí. Veamos aquí nuestra información Guardar. Listo, entonces tenemos nuestros nuestro regresiones. Ahora lo que voy a hacer es correr nuevamente.

00:42:28:08 Ya vimos como la interpretación en cada uno de los casos hemos visto pues la información asociada a cada una de las de las posibilidades de esta regresión. Veíamos por aquí el de el de la educación del padre y la madre y voy a aquí va a correr simplemente por. Por último ejercicio y fíjense que entonces lo que acompañaría a beta uno x y aventados EX2, pues correspondería a los coeficientes que va notando aquí.

00:42:51:10 Visto desde esa manera, pues lo vamos a poder crear nuevamente de nuevo, pues no es como el el énfasis que quiero trabajar en ese momento que estamos trabajando con la regresión lineal simple, pero para la lineal múltiple pues sería, sería este el caso. Y cuando van incluyendo más y más variables, fíjense que el el R cuadrado, miren cómo se modifica.

00:43:22:10 Déjenme, voy a incluir solamente una deducción de la madre y la educación del país. Fíjense, escalera y cuadrado, en este caso 24. Aquí es 19 0.19, perdón, y acá es 0.27. Entonces se está describiendo mucho mejor este último en el que están las dos variables y para el gráfico con la banda. Sí, claro que sí. Denme un segundo y lo corro.

00:44:04:03 Entonces voy a correr acá el margen para la si por último, que corre. Sí, para la educación y el gráfico es es es lo de más. Diez blogs le dicen que quieren graficar la línea, que quieren graficar el área para y se los dejo por acá si quieren para el área de el intervalo de confianza ahí se los pongo listo entonces y me regreso aquí rápidamente en lo que quería mencionarles este justamente yo aquí en la regresión y en este caso, y pues una de las de las cuestiones que resultan interés es podernos llevar estos gaticos por fuera.

00:44:48:10 Es plata sin tener que de pronto seleccionar y copiar esto como cuadro o copiar. Y esto asociado pues a la información en una tablita o algo por el estilo. Entonces lo que hacemos pues es trabajar directamente con un como han dicho que se llama o Greg dos. Seguramente si han trabajado antes con y con la parte de regresiones en stata y con o sin, pues este como han dicho Rig dos, este si no lo tienen instalado lo pueden instalar de la siguiente manera sss install o dos no lo instalan de esta forma se los dejo en el chat huracán, se los pongo para que lo puedan trabajar.

00:45:18:19 Listo entonces aquí y rápidamente. Entonces voy a correr y la información de mi regresión y como lo como lo hago entonces genero mi última regresión, la que quiero guardar en este caso quiero guardar este. Tengo une digamos una tienda de de estimaciones. Entonces le voy a decir que quiero guardar esto es Storch. Entonces esto lo voy a guardar como una regresión.

00:45:49:20 Voy a poner REC uno. Sí, entonces voy a guardar, le voy a poner también este store, que es exactamente lo mismo si lo trabajan de esa manera. Y por acá les pregunto la utilidad de Martins? Bueno, lo que les dije hace un ratico antes podemos usar esto y en términos de poder usar la ecuación de la regresión para calcular la media predicha de la de la educación, en este caso de la encuesta para cualquier nivel de educación del padre y y obtener la información.

00:46:28:04 También se pueden usar márgenes para otras cositas y en otras aplicaciones. Pero particularmente aquí lo estamos diciendo para no tener que dedicarnos a correr. Es humano este y que podamos conocer de manera inmediata los valores. Pero. Pero el margen se puede usar para otras cosas. Entonces en este caso. Pues bueno, vamos a guardar esta, hagámosla de la de educación de la madre, generemos la nuevamente y pongámosle ese The Store y le ponemos regresión dos y listo y por acá teníamos otra.

00:47:07:02 Se acuerdan la educación de Eric para escurra nuevamente? Estimado Short y guarde émulo y con regresión tres para conservar la misma estructura. Listo. Y tenemos esto guardado, pero no lo hemos exportado y lo tenemos ahí en una tablita no estamos. Fíjense que si nos vamos a acá lo que estamos es generando unas columnita asociadas a nuestra información, más no hasta ahora, pues hemos generado algo adicional, no hemos generado una tabla por fuera, solamente estamos generando su columnita para poder exportar nuestros resultados.

00:47:50:21 Entonces fíjense, fíjense que sí, bueno, aquí lo tengo, tenemos las tres, las tres columnas que les menciono y si hacemos lo siguiente y con el otro ok, entonces agregue dos y vamos a llamar por ejemplo primera regresión, ya me muestro, llamamos con corchetes, cuadra con corchetes cuadrados, entonces la llamamos regresión uno listo y le vamos a decir usted va a ser eso usando, si qué nombre le pusimos usando y que le vamos a poner?

00:48:21:16 Perdón, una tablita que se llama una vista que se llama regresión, perdón, cientistas para que no se vuelva a confundir regresión y esto va a generar un documento 3.2 y le vamos a escribir replace por si hay algún documento que se llame así listo? Y entonces con esta, con esa instrucción, permitanme se las copio por acá en el chat para que la puedan también replicar y a ver, listo.

00:48:46:14 Y fíjense que al correr esa instrucción aparece aquí un espacio sito en color azul para poder ver nuestra información. Yo voy a correr eso mismo. Solo voy a indicar que incluya las otras regresiones para que nos deje ver todas las demás. Entonces mejoramos esta era, esperamos que abra el Word, fíjense, entonces me muestra la primera regresión de la educación.

00:49:35:06 La educación del padre. Y aquí fíjense, nos arroja la E, el R cuadrado y la cantidad de observaciones que está evaluando. En ese caso, listo. Voy a cerrar esta vez pestañita del Word y me voy a regresar a Capotillo. Y le dije que yo quiero guardar todas las regresiones en este mismo, entonces es el otro. Si llamo a dos y el otro se llama regrese cinco, así que le puse cinco, tres listo Gimp, simplemente podemos hacer clic fuera de nuevo, pues abrimos acá nuestro documento y aquí pues me guarda mis dos regresiones, fíjense que ya tengo pues los dos archivos.

00:50:06:08 Ah, bueno, casi siempre acá casi siempre nos arroja esta misma información, aquí el ver, el ver ahora, entonces lo podemos trabajar aquí dentro de la misma información, listo, aquí lo podemos ir revisando que nos permite ver dentro de esta tabla la misma información. Listo, entonces voy a cerrar por acá y he tratado y respondiendo la mayor cantidad de preguntas que han ido surgiendo por aquí.

00:51:01:05 Este por acá les comparto. Ah bueno, el último comando ya se los envío a ver, este es el out que acaban de ver ustedes notaron que yo no lo corrí sino que simplemente le di clic a la instrucción, ahí se los pongo en el en el chat y bueno pues entonces con esto voy a regresar nuevamente a mi diapositiva principal, vamos a regresar acá y fíjense que si nos volvemos aquí a la a la presentación, a ver esto, pienso que si nos regresamos aquí a la presentación, entonces al generar nuevamente nuestro gráfico, pues este ya que estaría escribiendo la información correspondería a nuestro a nuestro gráfico que estamos bien ahorita con el diagrama de dispersión

00:51:49:16 y demás, y es allí pues en ese caso lo que diría G igual A y 9.74 más 0,35 x uno y más. El error que estábamos notando debería justamente el gráfico que estábamos haciendo al principio asociado a esta regresión inicial. Bien, entonces, pues esto era como de manera general un breve recorrido sobre algunas posibilidades que nos da esta data justamente para trabajar la parte de regresión lineal simple y algunas pues pequeñas vistas que tenemos este desde la parte gráfica que pueden resultar bastante útiles al momento de trabajar con este tipo de datos e importante puesto de energía.

00:52:14:13 Encuentra la naturaleza de las variables con las que se va a trabajar y. Y pues los diferentes cambios que se le van a dar. Hay algunas variaciones que se dan justamente cuando trabajamos con los logaritmos de las variables o trabajamos unas variables en logaritmo y otras en lineal, entonces nuestra interpretación va a verse afectada en términos de esos de sus logaritmos.

00:52:50:16 Dentro ya no hablaríamos y en unidades, sino en puntos porcentuales y o en aumentos porcentuales de nuestra información. Este en el enlace que ha compartido mi compañera Lisa anteriormente, podrán encontrar justamente varios de estos videos en los que hablamos de la interpretación esta parte y posteriormente tendremos un evento justo en el que en el que haremos variación en nuestras variables y pues trabajaremos también con la parte de regresión y y project para que veamos como algunas alternativas que surgen adicionales a esto.

00:53:13:08 Entonces bueno, creo que he respondido las preguntas que han ido surgiendo en el chat, no se hélices y por ahí se me quedo alguna, tal vez. Lo que no, no señora, y en redes tampoco tenemos consultas. Entonces en este momento voy compartir la encuesta. Si estás de acuerdo, perfecto, voy a dejar de compartir mi pantalla.

00:53:54:02 Invitamos entonces a nuestros asistentes que nos apoyen con el diligenciamiento de esta encuesta. He venido compartiendo el enlace donde ustedes van a poder encontrar la grabación de esta y otras presentaciones realizadas tanto por Erika como con otras personas del grupo de instructores de South Park. Sobre Erick. Algo que quieras agregar antes de finalizar y no dejarles allí la invitación a que nos puedan apoyar con la encuesta a las personas que estaban solicitando la información pues de él y del archivo de lo que venia corriendo, tal vez que no lo hagan saber por por sus comentarios.

00:54:23:03 En la encuesta también vi que habían algunas preguntas sobre licenciamiento y actualización del software, pues también agradecimos y no lo dejan saber en las. En las preguntas de él. En el último. La última pregunta del cuestionario este y. Pues cualquier inquietud. Cualquier duda pues estaremos encantados de responderlo vía chat, vía correo electrónico también allí les hemos dejado el correo.

00:55:17:21 Y sobre las grabaciones de nuevo, pues lo que ya les comentaba Lisa, lo encontrarán pues en los enlaces que ya compartió compartido previamente y sin más, pues darle las gracias por sus participaciones el día de hoy, por su asistencia, dejarlos invitados como ya les mencionábamos a los eventos próximos y también contarles que el día miércoles de la otra semana realizaremos un taller virtual gratuito que será totalmente práctico y este por acá les dejamos también el enlace para que se puedan inscribir con este taller, pues vamos a abarcar algunas opciones de machine learning y que se pueden trabajar en stata y los participantes tendrán acceso a una licencia demo para que puedan ir interactuando este de

00:55:50:08 manera inmediata con el instructor y que puedan realizar de forma práctica los ejercicios que abordaremos. Y por acá, déjenme ver si puedo, no sé donde enviarles el enlace de inscripción, tal vez en sus correos también lo recibieron entonces pues dejarles extensiva esta esta información y. Y de nuevo pues el día lunes o martes tal vez llegará pues la información correspondiente a la confirmación para que puedan asistir a ese taller.

00:56:22:16 Ese taller será de cuatro a

19:00 de la noche, hora, hora Colombia. Y serán pues como les digo, tres horas en la que trabajaremos de forma práctica con el software y trabajaremos pues algunas opciones de manera teórica que se pueden ir abordando desde la estadística y como lo trabajamos en Stata, pues esos ejercicios entonces se puede. Esperamos entonces encontrarlos en esas sesiones.

00:56:58:15 Nos vemos entonces en una próxima oportunidad desearles que tengan un feliz resto de día y pues que estén muy bien. Hasta pronto. Gracias Erick, hasta pronto. Acabo de dejar en el chat la información del taller para las personas que estén interesadas. Feliz este día para todos y buen fin de semana. Gracias Erika. Para mayor información respecto al software o en temas relacionados, no dude en contactarnos a través del correo electrónico, entrenamientos a software, guión Ya.com o visitar nuestra página web triple OLE o punto Software Guión Ya.com.

Regresión Lineal Simple con apoyo de Stata 18


Al realizar un modelo de regresión lineal simple, se tiene la intención de explicar la relación lineal existente entre dos variables, una de ellas, denominada respuesta y la otra variable explicativa. Stata, en sus múltiples funciones cuenta con un menú dedicado a la regresión lineal, así, en esta presentación se mostrarán algunos ejemplos sobre las diversas características y funcionalidades con las que cuenta el software para llevar a cabo dicho procedimiento, así como, la interpretación y exportación de resultados.



Etiquetas relacionadas

  • Análisis de datos
  • Enseñanza
  • Estadística

¡Comparte este video con tus colegas!

Compartir

Ver más

Cotizar
Próximos
Eventos

X

Mis cotizaciones:

Comentarios a tu solicitud:

Cotizar