SS_Logo

Georreferenciación de datos con Stata 17

Autor: Erika Paola Laitón Castellanos / Portafolio: Quantitative / Vie. 21 de Abr de 2023

Transcripción de este video

00:00:43:23 Somos un equipo autogestionado, responsable, proactivo y autónomo, con gran compromiso social, aportando el pensamiento científico y el desarrollo latinoamericano, promoviendo el uso de software para investigación en todas las áreas del conocimiento. Generamos contenido de alta calidad teniendo en cuenta las distintas necesidades del mercado. Realizamos actividades gratuitas constantemente. Abordamos temáticas vigentes, aplicaciones especializadas y elementos metodológicos que te permiten interactuar y generar redes para la difusión de tus proyectos.

00:01:10:22 Contamos con servicio de asesoría, consultoría y acompañamiento personalizado, certificaciones internacionales, entrenamientos especializados y talleres prácticos. Nuestro principal objetivo es promover el uso de tecnología en el campo investigativo, generando un impacto significativo en la región y de esta forma contribuir a la creación de comunidad para compartir conocimiento.

00:01:49:20 Te invitamos a ser parte de este gran equipo Software Shop. Visita nuestra página web y conoce nuestros servicios. Software Shop La empresa líder en la implementación de herramientas analíticas y software especializado en Latinoamérica, les da la bienvenida a esta presentación. Este espacio contará con el acompañamiento de Erika Paola Layton, instructora del portafolio cuantitativo en Software Shop, con experiencia en el uso de tecnologías para el análisis de datos cuantitativos aplicadas a investigaciones sobre políticas públicas, estudios de género y educación.

00:02:03:08 Actualmente apoya grupos de investigación y entidades públicas y privadas en temas relacionados con gestión y análisis de datos. Trabaja en proyectos para integración de datos mixtos para entidades que manejen grandes cantidades de información. Bienvenidos.

00:02:06:00 Bueno, pues muy buenos días para todos, y como ya les mencionó Luis hace un momento, el día de día de hoy, pues nuestra sesión estará encaminada.

00:02:12:20 A revisar algunas herramientas de gestión que nos faciliten la combinación de información y que cuente con una característica particular. Y es justamente que la podamos visualizar bajo un entorno de mapas e puntualmente apoyándonos en las herramientas con las que cuenta Stata.

00:02:32:00 En su versión 17, para permitirnos trabajar esa parte de la georreferenciación y la ubicación.

00:02:38:21 -

00:02:40:00 Orador 3 Espacial de nuestros datos.

00:03:26:19 Y si bien, pues voy a hacer una introducción, quiero compartir con ustedes algunos documentos que les puedan facilitar la profundización en esta herramienta y algunos comandos que se han venido incluyendo, pues justamente este al momento de trabajar con la herramienta. Entonces pues para iniciar me encantaría y saber por aquí es de que nos están acompañando y también se ha trabajado antes con Stata, si han trabajado en esta versión, en versiones anteriores, como les menciono Elisa, al final vamos a compartir una encuesta para que nos puedan contar qué temas les interesaría que trabajáramos, para que así mismo podamos seguir alimentando ese pull de contenido que semana a semana.

00:03:35:00 Pues queremos compartir con ustedes. Entonces, después de estar releyendo por acá en el chat, permítanme verificamos una cosita.

00:03:37:10 No era aquí.

00:03:40:04 Listo el estar leyendo antes aquí en el chat.

00:03:40:15 Voy a tomar las montañitas para que no me vayan a causar inconveniente en el momento estar leyendo.

00:03:54:14 Ahora que nos cuentan que trabajan en salud por acá nos dicen que se conectan desde Colombia, de Manizales, desde Perú.

00:04:27:20 Han trabajado antes con esta data, pero no puntualmente con la opción de georreferenciación. Desde España por acá nos cuentan que trabajan en el área investigación en economía, en ecuaciones estructurales. Por acá nos cuentan también que trabajan en salud, en medicina, en epidemiología. Bueno, quiero contarles, aprovechando aquí que hay que mencionar eso, que estaremos fortaleciendo pues muchísimo esta línea y próximamente tal vez en unos ocho o 15 días estaré llegando, estará llegando.

00:04:36:13 Perdón, una invitación para que nos acompañen a un evento muy especial. Pues para el área de salud de pie en biología evidentemente.

00:04:52:00 Pues todos están cordialmente invitados, pero pues haremos algo en particular en estas aplicaciones. Por acá nos cuentan que trabajan con datos sociodemográficos en otros programas como Aries, perfecto en el sector agrícola.

00:04:52:23 Y por acá. Bueno, más personas en Colombia, en Medellín. Bueno, el súper por acá nos van contando también.

00:05:34:20 Tenemos muchas personas de varios países y de varias áreas de conocimiento. Veo también por aquí algunos nombres conocidos, este bueno pues entonces extenderles un saludo, dejarles ahí la invitación que les menciono. Um y bueno, entonces digamos que muchos de los procedimientos que hemos venido trabajando en las últimas presentaciones con Data han sido muy dirigidos a poder trabajar de manera transversal con la herramienta Curso.

00:05:40:12 Por qué la idea pues de esta, de esta herramienta, de este software estadístico.

00:05:41:06 Va encaminada hacia esto, no hacia poder eh, aplicarlo en distintas áreas de conocimiento y justo, porque pues va muy entrelazado con con la idea de lo que es la estadística.

00:06:14:19 Facilitándonos pues contar historias con nuestros datos, pero adicional ser soporte y ser herramienta en los distintos procesos que vamos trabajando a medida que vamos avanzando en un análisis cuantitativo. Y hay varias cuestiones que se entrelazan aquí y sobre todo, pues la parte de métodos mixtos.

00:06:40:20 Nos ha abierto pues varias posibilidades en términos de poder poner a conversar las áreas. Y es que justamente la estadística y pues digamos se ha pensado de esa manera para ser una herramienta de diálogo. Y nuestro ejemplo de hoy va a trabajar datos reales asociados al conflicto armado puntualmente en Colombia.

00:06:42:16 De esto pues.

00:06:44:13 Es un hecho de larguísima data.

00:06:47:03 Pues en este país.

00:06:52:15 Y a partir de esto pues los distintos organismos y.

00:06:53:16 Las EM.

00:06:56:06 Las y las distintas entidades encargadas.

00:06:56:19 De restablecer memoria han recopilado información que se ha puesto a disposición de manera pública, particularmente el Centro Nacional de Memoria Histórico y ha establecido un repositorio que se llama El Conflicto armado en cifras. Ya les compartiré en un ratito el enlace para que si quieren seguir el ejercicio lo puedan hacer sin ningún inconveniente y nos estaremos apoyando puntualmente. Pues en los mapas de municipio y departamentos para para Colombia no quiere decir que sean los únicos regiones que se puedan trabajar.

00:07:30:12 Se puede trabajar cualquier región. Ya les contaré un poco más adelante.

00:07:43:22 Varios la ventana de las gracias. Perdón que tenemos aquí? Un pequeño inconveniente con un audio. Esto perfecto. Eh?

00:08:21:14 Y pues digamos que la idea general de esto va a estar muy encaminada a que podamos justamente aprovechar distintos suministros y pensando en esa transversalidad que les cuento y podamos también pues graficar diferentes regiones, entonces tres cosas a tener en cuenta que sobre las que vamos a estar moviendo, digamos que en toda la sesión eh? Que se reducirán básicamente en un par de pasos, pero, pero pues bueno, tal vez para que tengamos como un contexto general para quienes nos mencionaban que nunca he trabajado con Stata, les permítanme contarles que Stata es un software estadístico que se encuentra en su versión 17.

00:08:37:10 Es tal vez el software con mayor documentación y en términos de que cuenta con un editorial propio que cuenta con una revista y que cuenta adicional con una comunidad en línea a la que pueden hacer distintas consultas y verificar pues las distintas soluciones que plantean los demás usuarios.

00:08:38:20 En su ejercicio de permitirnos trabajar con e varias herramientas estadísticas, pues nos permite importar distintos tipos de información, los que podemos importar stata que podemos traer a Stata como archivos en Excel, podemos ver archivos en su web, podemos traer archivos en formatos de otras herramientas estadísticas. Podemos cargar información desde formatos en tablas y externos de bases de datos externas.

00:09:06:17 Y podemos traer archivos como los que vamos a trabajar el día de hoy, que son los archivos sh p y los archivos de BF que van a contener mejor la información de coordenadas para sitios particulares.

00:09:20:06 Y lugares.

00:09:25:11 Y regiones que quisiéramos visualizar bajo nuestra herramienta y de esa manera pues poderlo.

00:09:25:23 Aprovechar.

00:09:31:17 Permítanme, voy a cerrar la cámara para quienes están trabajando de pronto en alguna.

00:09:32:03 En algún dispositivo móvil que sea más fácil.

00:09:37:14 Ampliar la información en un ratico si quieren.

00:09:40:08 Nuevamente para la sesión de preguntas.

00:09:50:18 Bueno, entonces lo que vamos a traer pues es justamente esos archivos. Entonces vamos a importar. Y aquí vamos a seleccionar la información, esos archivos que vamos a requerir para la graficación.

00:10:16:03 Vamos a tener presente siempre que tenemos que traer un archivo, es HPI, un archivo PDF que tienen que estar ambos en nuestra información. Los podemos tener comprimidos, no los podemos tener comprimidos aquí no vamos a tener ningún inconveniente y vamos a a partir de esos datos a crear un archivo en un formato de tema. Quienes son usuarios de SATA sabrán que el archivo de T corresponde a un conjunto de datos.

00:10:50:05 Quiénes no? Pues es simplemente el formato en el que vamos a guardar nuestro conjunto de datos, nuestras tablas de datos dentro de Stack. Listo? Entonces allí no tenemos mayor inconveniente, simplemente la traemos hasta acá, la guardamos para poderla reproducir y verla posteriormente. Y cuando vamos a trabajar con nuestros datos y queremos contar historias, digamos, acertadas, queremos no mentir con nuestra información y queremos pues optimizar nuestros diferentes procedimientos, pues requerimos de procesamientos y gestión sobre nuestras tablas de Hatch.

00:11:10:04 Entonces aquí vamos a encontrar, por ejemplo, la descripción, vamos a encontrar por ejemplo la administración, vamos a encontrar, por ejemplo, las distintas posibilidades para trabajo directo con nuestras tablas de datos veremos un par de ellas y como tenemos distintos formatos de archivo, pues entonces nos vamos a apoyar particularmente.

00:11:18:14 Orador 2 En diferentes espacios que nos facilita Stack para elaborar estas cuestiones, que en esta pues los vamos a denominar los frames.

00:11:21:05 Esto de acá, entonces qué va.

00:11:55:15 A corresponder a un frente? Pues los distintos espacios en los que yo puedo cargar una tabla de datos dentro de mi sesión de stack. Y esto ya no solo lo vemos sobre la sobre el ejercicio y el tercer paso, pues va a estar y digamos que de la mano con la combinación de información, primero vamos a combinar dos tablas, veremos cuál es la la el ejercicio pues que se debe llevar a cabo para la combinación y la unificación de variables y posteriormente vamos a cargar ese archivo, ese HPS archivo con las coordenadas, lo vamos a combinar también con nuestros datos y al final pues vamos a graficar variables.

00:12:09:00 Veremos algunos ajustes que se pueden dar sobre esta información y con estos pues ya podremos entonces elaborar las distintas tareas que vamos a llevar a cabo durante el durante la graficación de Maps.

00:12:13:15 Entonces permítanme, vamos aquí a minimizar y.

00:12:15:03 Vamos a abrir aquí una sesión nueva.

00:12:19:07 Esta a ver entonces llevémoslo por acá.

00:12:24:01 Rápidamente para.

00:12:25:17 Para quienes.

00:12:53:17 No están de pronto familiarizados con la interfaz, un recorrido muy sencillo en la ventana central. Verán que cada vez que ejecutemos alguna acción esta se va a reproducir, pues nos va a mostrar los resultados. Sobre este recuadrito la ventana central tendremos también en un espacio de variables, un cajoncito para las variables. Una vez carguemos nuestros datos, pues entonces nos va a aparecer el nombre de la variable y la etiqueta con la que se va a anotar.

00:13:08:09 Pues dentro de mi archivo otro cajoncito que nos va a hablar de las propiedades. Esto va a ser muy útil porque pues vamos a conocer básicamente lo que hay en nuestro conjunto de variables. Entonces nuestro conjunto de datos, cuánto pesa, que formato tiene nuestra información.

00:13:30:17 Vamos a hablar también de los archivos, del tipo de variable que tenemos cargada, si tiene una etiqueta de valor o no la tiene. Y toda esta información la vamos a encontrar directamente una vez demos clic sobre esta práctica. Esta otra pues es una herramienta muy amable con el usuario en términos de facilitarnos pues las distintas ventanas que encontrarán en la parte superior y esto significa adopción.

00:13:59:07 Pero también nos permite pues la integración y el trabajo mediante comandos y mediante un lenguaje matricial que es denominado out adicional. En esta versión, pues ya tenemos la conexión con Python y podremos hacer algunas otras modificaciones dentro de este. Dentro de estas líneas de comandos, y tendremos una ventana de revisión que para hacerlo más sencillo, pues simplemente será nuestro historial asociado a las tareas que llevemos a cabo.

00:14:28:18 Entonces fíjense que tendremos una sección por acá de resultados, sí, y tendremos aquí entrelazada una sesión de revisión. Esto es, todos los resultados que se vayan dando, pues provienen de alguna parte, no? Entonces estos dos buenas estar entrelazados justamente por eso, por lo que cargamos, por lo que trabajamos y por lo que vamos a ir visualizando, descendiendo esa información.

00:14:42:09 Perdón, voy a crear mi apuntador para que sea más fácil de seguir mi curso. Entonces vamos a aprovechar varias de las opciones que nos facilita Stack. Lo primero que vale la pena mencionar es que vamos a crear un directorio de trabajo.

00:14:44:02 Entonces permítanme.

00:14:46:12 Vamos a minimizar aquí un segundo y voy a ir a mi escritorio para mostrarles una lista.

00:15:00:03 Entonces fíjense que en el escritorio tengo una carpeta, mi carpeta se llama Webcam Gráfica.

00:15:30:01 Y de manera particular el título de mi, de mi carpeta, el nombre de mi carpeta no tiene algún espacio, puede tener caracteres especiales y demás, pero no tiene espacios. Esto está está de forma intencional porque está. No, no me permite graficar cuando la carpeta tiene espacios donde está contenida la información tiene espacios, me va a mostrar errores y esto entonces para que tengan eso presente y que tal vez pues no les vaya a causar inconveniente al momento de estar trabajando mismo.

00:15:35:08 Voy a regresar entonces Data. Y cuál es la tarea del directorio de trabajo?

00:15:36:03 Pues el Directorio de trabajo lo que va a hacer es establecer un espacio en el que me voy a estar moviendo todo el.

00:15:41:11 Tiempo.

00:16:03:21 Pero que adicional va a guardar todo lo que yo genere. Y yo tenemos una bitácora y esas bitácoras pues va a corresponder al archivo log y básicamente lo que va a hacer es grabar o guardar todos los resultados que vayan apareciendo en mi ventana de resultados. Entonces vamos a iniciar con esto, vamos a dar aquí, comenzar, lo voy a guardar acá en mi, en mi carpeta.

00:16:05:08 Le voy a.

00:16:07:01 Poner acá webcast.

00:16:11:00 Aplicación, listo un.

00:16:11:13 Módulo y nada.

00:16:15:00 Más y guardemos acá es.

00:16:28:14 El me indica que va a empezar a grabar el 21 de abril desde las

11:17 como 29, según lo que haya pasado antes, no almacenarlo, lo que vaya a pasar después, siempre y cuando esté ejecutándose el loop, es lo que me va a guardar.

00:16:29:03 Listo.

00:16:45:07 Entonces voy a ir a Archivo y aquí voy a cambiar el directorio de trabajo, que es la carpeta que les contaba hace un momento. Tengo en mi escritorio. Y por qué va a ser importante esa terapéutica? Pues para que puedan almacenar todo, que lo puedan encontrar de manera rápida y que lo puedan administrar sin mayor inconveniente.

00:16:46:22 Listo.

00:17:05:08 Entonces tenemos una carpeta sin espacios, tenemos nuestra bitácora corriendo. Fíjense que las acciones que ejecutado las he llevado a cabo mediante la cintilla de opciones, pero en mi ventana de revisión va apareciendo la información asociada a esas tareas distintas. Básicamente es como cuando estamos en el navegador, la página de internet.

00:17:05:23 Y.

00:17:10:17 Si queremos revisar a qué partes ingresamos, entonces simplemente nos vamos a la historia.

00:17:11:06 Listo?

00:17:15:09 Vamos a ir por acá a la sección Archivo.

00:17:16:04 Y.

00:17:45:18 Fíjense que en la parte superior también aparece la sección de importar. En la parte superior derecha, en la parte inferior aparece la sección de importar y los distintos formatos que podemos traer a Start. Entonces quiero aprovechar otra herramienta también de SATA, que son los manejadores de proyectos, porque voy a cargar distintos tipos de archivo, entonces los voy a administrar desde acá para ejecutar los manejadores de proyectos, pues entonces nos dirigimos a la sección de los archivos du, entonces los archivos de una vez les cuento.

00:18:04:15 Hemos mencionado tres tipos de archivos hasta ahora, los de TED, que serán los conjuntos de datos que van a estar relacionados con las variables, los archivos log, que serán las bitácoras y los archivos que van a corresponder a la historia. Todo esto que va quedando aquí almacenado, pues lo vamos a ver posteriormente, justo en este, en este blog que se acaba de abrir.

00:18:16:01 Pero ahora no vamos a correr ningún archivo. Lo que quiero es abrir un proyecto, entonces voy a cargar un nuevo proyecto al que llamaré Graficación de Mapas, lo voy a guardar acá, le voy a poner.

00:18:25:22 Mapas y listo. Ok, vamos a guardar.

00:18:55:11 Los. Fíjense que acabo de aparecerme un espacio. A quién? En el lateral que hice Project. Cuál es la función de este proyecto? Si, la carpeta de trabajo, pues lo que voy a hacer es almacenar todo en un mismo lugar, pues este proyecto lo que va a hacer es permitirme tener todo en esta dentro del mismo sitio, sin importar de que formato sea, sino sin importar que sea de un formato diferente a Stack.

00:19:22:12 Entonces le voy a decir agreguemos un directorio, el directorio que voy a poner por supuesto, pues es el de la carpeta que acabo de crear. Lo voy a añadir acá y fíjense que aquí me carga todo lo que les he mencionado. Entonces tengo la información para las tablas asociadas que quiero visualizar, que están en formato Excel. Tengo unos formatos en archivo de tema, tengo algunos formatos en duh, tengo algunos formatos aquí, tú también aquí y unos formatos en punto.

00:19:23:10 Texto listo.

00:19:44:08 Entonces que quiero hacer? Yo quiero visualizar todo dentro de un mismo espacio que llega acá, me acaba por hacer un asterisco en rojo. Esto no es porque sea un error, sino porque lo que me está indicando es que hay información sin guardar que fue la que acabo de generar. Entonces, bueno, tenemos todo listo, todo el espacio está dispuesto para almacenar nuestra información y vamos a ejecutarlo primero.

00:19:56:12 Yo les decía la información que vamos a trabajar, pues va a corresponder al Centro Nacional de Memoria Histórica. Particularmente, vamos a trabajar con un hecho que es el secuestro y lo que vamos a graficar al final es un par de variables asociadas al.

00:19:57:02 Secuestro.

00:19:58:16 De esa tablet.

00:19:59:11 Entonces, bueno.

00:20:00:15 Voy a mover esto por acá.

00:20:02:01 Para que no nos y.

00:20:04:22 Confunda y me voy a.

00:20:05:03 Ir.

00:20:24:10 A la sección de apps. Entonces les acabo de contar que podemos almacenar todo en un mismo lugar. Entonces, aquí básicamente lo que nos vamos a imaginar, eso es, trata como un maletín en el que podemos guardar varias cosas y un maletín, pues tiene bolsillos. Esos van a ser los marcos de los frames que les estaba contando hace un ratito.

00:20:31:22 Entonces, qué va a pasar con los frames? Buenos frames van a corresponder a espacios donde puedo almacenar diferentes tablas de datos.

00:20:32:18 Entonces.

00:20:44:22 Sólo por comodidad voy a renombrar esto que se llama diseño. Le voy a poner víctimas y por acá voy a crear otro que.

00:20:47:05 Se llame Casos y soy.

00:20:54:19 Lo que estoy creando. Son bolsillos, listo, víctimas, casos y vamos a crear uno para el mapa.

00:20:56:18 Ok, listo.

00:21:04:19 Entonces solo para para revisar. En la parte superior aparece el marco de datos activo en el que vamos a estar trabajando.

0:21:05:19 Y.

00:21:26:19 Pues los podemos cambiar en cuanto sea necesario. Fíjense que yo me puedo mover acá y es donde vemos en que marco de datos estamos. Entonces, aparte de que no estamos viendo que lo podemos ver aquí en la parte inferior, si lo logra notar en donde dice datos permiten muy activar este candado para que en un momento lo veamos en mapa, casos y víctimas y entonces vamos a cargar primero.

00:21:28:06 Las víctimas y esto les.

00:21:30:23 Permite el módulo aquí el candado para que lo puedan visualizar mejor. Miren, acá.

00:21:31:04 Está.

00:21:33:23 La sección de de los marcos.

00:21:36:18 De datos, teniendo la idea de este.

00:22:07:22 Maletín en el que vamos a cargar datos, pues vamos a empezar a traer nuestra información. Ahora por acá nos están preguntando que en dónde lo pueden encontrar. Denle un segundo, por favor. Les comparto aquí la pantalla y les decía sus datos. Los tomó él del Centro Nacional de Memoria Histórica. Entonces, puntualmente aquí pueden consultar las diferentes tablas de datos que se han publicado por esta Para esta parte que les estoy contando, yo voy a trabajar de manera particular con la sección de secuestros.

00:22:08:14 Que está justo.

00:22:12:14 Acá y allí pueden descargar la información si quieren. Denme un segundo, les comparto.

00:22:19:16 El enlace a ver del conflicto armado en pues link si.

00:22:21:06 Quieren al final lo retomamos.

00:22:22:01 No hay ningún problema.

00:22:33:01 Entonces me voy a regresar a Stata y ya en esta data pues entonces voy a verificar en que marco de datos estoy. Ya les cuento porque cree los marcos de datos y para qué los.

00:22:33:18 Voy a usar.

00:22:38:16 Entonces voy a ir a archivo, importar y que voy a traer una hoja de cálculo en Excel.

00:22:39:10 Y ustedes.

00:23:12:03 Las vieron? Las tenía justo aquí en el, en el manejador de proyectos. Entonces vamos a explorar aquí mi información, pues está gusto. Acá dijimos que lo primero que íbamos a cargar era las víctimas. Entonces vamos a abrir aquí la tabla de datos, vamos a cargar en este caso 37.695 datos importante aquí que seleccionemos la opción Importar primera fila como nombre de variables le damos ok y ya entonces y verificamos las diferentes líneas no?

00:23:17:06 Entonces 22 variables 37.694 Observación es tal como lo indica en su.

00:23:17:16 Momento.

00:24:06:00 Y vamos por acá. Entonces revisar qué pasó. Tenemos la tabla de datos. De pronto, qué cosa? Y pues que estamos acostumbrados a ver en una tabla de Excel. Vamos a abrir aquí en la visualización, fíjense, me muestra todas mis variables y es como si estuviéramos viendo una hojita de Excel tal cual. Entonces tenemos distintos tipos de variables. Noten, por ejemplo, que hay algunas variables que podríamos trabajar modificando las por ejemplo, aquí está ese sexo, si la quisiéramos ver como una etiqueta de valor por aquí, entonces vemos la ocupación de las víctimas, que tipo de poblaciones, el grupo armado pues al que se le asignó esta información y por acá entonces tenemos los distintos conjuntos de

00:24:16:06 datos, los distintos perdón y las distintas variables de cómputo de datos, ya si de cautiverio, el número de veces que las personas fueron puestas en cautiverio.

00:24:17:07 Y.

00:24:30:14 La edad de las víctimas en una variable categórica. Entonces dijimos y vamos a ver algunas opciones de manejo, estos de estas variables, vamos a irnos a la sección datos, que va a ser, pues esa posibilidad de poder.

00:24:31:13 Y.

00:25:04:07 Esa posibilidad de gestionar nuestros datos y vamos a tener pues una por acá, que es la combinación y la fusión de los conjuntos de datos. Entonces, qué necesitamos para fusionarnos esos conjuntos de datos? Una variable ya y otro conjunto para trabajar. Entonces dijimos que estábamos aquí en víctimas, entonces vamos a generar aquí un archivo, lo vamos a guardar como un formato de tema listo y vamos a seleccionar entonces el espacio en donde te queremos guardar.

00:25:12:05 Dijimos que esto eran víctimas, entonces vamos a guardarlo como víctimas por acá nos han llegado algunas preguntica ya en un segundo las reviso.

00:25:13:17 Y les contesto.

00:25:26:01 Y por acá. Entonces estábamos en el conjunto de datos de víctimas. Podemos movernos desde acá justo en el candadito. Acá podemos seleccionar la información que queremos, a la que queremos.

00:25:26:21 Ir o.

00:26:03:14 Podemos escribir. Simplemente se doble guf y llamamos el conjunto de datos en el que nos queremos cambiar. Fíjense, por favor, en este caso, que tenemos unos datos cargados, sí. Entonces le voy a poner casos de una mujer sobre casos y automáticamente me deja un espacio en blanco. Entonces por eso la idea del bolsillo, vamos abriendo distintas tablas de datos y ahora aquí, pues entonces vamos a abrir los casos asociados a esta información es importar hoja de cálculo de Excel, le vamos explorar casos y abrimos nuestros datos.

00:26:31:19 Entonces, por qué voy a importar estas dos? Para cada uno de los casos pueden haber más de una víctima y por esa razón noten que hay menor cantidad de información para casos que para víctimas por los rangos de las celdas. Fíjense acá, en este caso voy a cargar 31.164 observaciones, porque la primera corresponde a una, a una al título de las variables, perdón, y aquí pues entonces voy a cargar también mis.

00:26:33:01 Listo.

00:26:59:13 Tenemos entonces la información en ambos casos, pues lo que les decía siempre ponerle aquí la la importación de la variable y me detengo. Ahora vivimos que necesitábamos otro conjunto de datos y que necesitábamos una variable llave. Entonces, cuál va a ser esa variable? Ya la variable en pareja miento o la variable conjunción o la variable de combinación? Pues lo que va a hacer estatal buscar que las variables.

00:27:00:05 Y.

00:27:33:20 Que coincidan en en ambos casos que además tengan el mismo nombre y que sean escritas de la misma forma. Por qué estrato es que hay sensitive y también distingue entre la información en el formato en que se carga. Fíjese que si yo le doy por ejemplo, acá hay Picasso, vamos a subir acá me dice que es un string de seis, de seis espacios, de seis caracteres y por acá aparece el Heidy, el caso relacionado un string d12 y aquí pues entonces que me cuenta el código, el municipio y para el Dane, para la bipolar, la división.

00:27:34:19 Y.

00:28:14:12 Para Colombia el Departamento Nacional de Estadísticas publica pues la información y la referencia con un formato particular que es el código de de la bipolar para poder distinguir las diferentes regiones en Colombia. Entonces encontramos el código, el municipio, el Código, el departamento, la región, la modalidad bajo la que se llevó a cabo este hecho, los presuntos responsables aquí descripciones de la información asociada e y pues algunas variables alternas que pudieron presentarse en cada uno de esos casos respecto a las víctimas.

00:28:24:04 Entonces, fíjense, por ejemplo, que acá hay una variable que se llama número total de víctimas, y de acuerdo al caso, entonces todas esas víctimas que veíamos en el otro lado pueden estar relacionadas en uno de estos.

00:28:26:01 Casos, listo, eh?

00:28:33:01 El tipo de secuestro, la finalidad del secuestro y lo que se solicitaba para la liberación de las personas que se encontraban.

00:28:34:00 Privadas.

00:28:39:18 De su libertad. Entonces nuevamente podremos ver aquí toda la información. Noten, acá está pues.

00:28:40:09 Todos los datos.

00:29:10:02 Ya hemos guardado. Y la primera tabla, perdón, entonces me voy a regresar a esa, a esa primera tabla. Procesé doble F para mostrarles una cosita esto se llama víctimas. Y fíjense que acá también hay una ID y el caso que es justamente la variable que vamos a usar para la combinación, hay dos cosas en SATA, yo les contaba por aquí en la combinación, entonces podemos hacer combinaciones mediante columnas y podemos hacer combinaciones mediante filas.

00:29:14:21 Es decir, vamos a poder combinar variables bajo variables, perdón o ajá, observaciones.

00:29:15:10 Listo.

00:29:38:21 Vamos a usar aquí una opción que dice llamada a formar todas las combinaciones de pares dentro de grupos. Es una opción un poquito más automatizada el yo invito como les mencionaba, pues en este caso teníamos 22 variables. Entonces y digamos, es importante tener presente que puede ser que no solamente sea esta la variable, sino que puedan haber más, los podemos usar.

00:29:58:11 Este yo en byte es muy parecido al merge, solo que aquí lo que voy a hacer, lo que voy a hacer es decirle a Data perdón y ubique dentro de este conjunto las variables y si son posibles combinar. Listo. Ay, perdón, que yo me quedé en el de víctimas, perdón, me regreso acá a casos. Listo, estamos en casos ahora?

00:30:23:07 Sí. Entonces vamos a ir aquí, combinar conjuntos de datos, formar las combinaciones. Le vamos a decir qué fue lo que guardamos. Entonces estamos en casos, vamos a pegarle las víctimas de cada uno de esos casos para referenciar la información. Y aquí me pregunta bueno, usted no va a indicar en las variables o las ubico? Yo no voy a decir hasta que las busque para que me facilite un poco la tarea.

00:30:29:22 Entonces, fíjense que en efecto, pues no era solamente el Heidy el caso y tenemos acá otra.

00:30:32:06 Información de archivo político.

00:30:56:03 Entonces tenemos el allí, el caso, el año, el mes, el día, el código, el DANE por el municipio de departamento en el que se presentó el hecho, que es en el que se repite pues la información. Entonces y qué va a pasar? Pues que vamos a alcanzar la información total, como la veíamos en el otro lado. Entonces 37.694 OBSERVACIONES Revisemos entonces nuestros datos, vamos por acá.

00:31:18:12 Fíjense que en algunos casos aparece, en algunos casos no aparece uso. Por lo que les decía hace un ratito, pueden haber casos en los que haya una persona o en el que haya muchas personas. Entonces nos indica la información y pasamos de 22 variables a 44 variables. Tenemos entonces nuestros datos y pues vamos a cargar entonces aquí los la revisión de los.

00:31:22:12 De los datos que aquí listo.

00:31:32:11 Son algunas variables, por ejemplo aquí extorsión, lesionados, pillaje, tortura, que son hechos que se pudieron presentar de manera simultánea al secuestro. Fíjense que acá está.

00:31:33:10 Pues los datos, no?

00:31:59:03 Entonces vamos a ir por aquí y algunas modificaciones que le podemos dar a nuestros datos. Entonces en este caso ustedes vean que todas las variables son apareciendo en rojo, es por defecto las variables alfanumérica no las muestra en color rojo, las variables numéricas en color azul y las variables asociadas a etiquetas de valor no las va a mostrar las variables etiquetas de valor en color azul y las variables numéricas en color negro.

00:32:30:04 Entonces podemos apoyarnos, por ejemplo, las opciones de crear o cambiar datos y podemos trabajar con los comandos para transformar variables. En caso de que necesitemos hacer algunos ajustes sobre nuestras variables. Entonces, por ejemplo, vamos a usar y una opción llamada en Coat, que es lo que nos permite, pues es largo y fijación de nuestra información, entonces podemos obtenerla desde ahí o podemos obtenerla desde la sección de comandos y pues básicamente la tarea va a.

00:32:30:15 Ser la misma.

00:32:44:00 Y entonces por ejemplo, le voy a decir bueno, yo quiero que me verifique, procesan los datos de cautiverio, entonces transformé eso.

00:32:49:14 Cautiverio y listo.

00:32:51:19 Y le vamos a decir entonces.

00:32:52:12 Ah, bueno, con.

00:32:55:06 Criterio Reich, para que sepamos que es la que.

00:32:57:05 Modificamos, pues fíjense.

00:33:00:00 Acá, pues ya nos indica que la modificó.

00:33:00:21 Sí.

00:33:07:05 Que generó una nueva variable, nos vamos por acá, al final, entonces aquí ya la dejo.

00:33:10:20 Recodificar y perdón por aquí.

00:33:33:11 A esta misma. Antes podríamos aplicarle otras opciones. Bueno, hay algunas posibilidades en la que simplemente nos vamos de un lado al otro. Es decir, si la tenemos como alfanumérica y la queremos volver numéricos y la tenemos como numérica y la queremos volver alfanumérica, esas opciones eran de String, perdón y toString, que las vamos a encontrar también en ese menú.

00:33:37:1 Datos, utilidades. Al cambiar datos es como para transformar.

00:33:38:18 Varios otros.

00:33:47:07 Formatos para transformar variables. Entonces tendremos las dos opciones cambiar variables de tipo alfanumérico numérico y cambiar variables numéricas alfanuméricos. Usemos esta primera que es la que les.

00:33:48:08 Estaba contando Chunk.

00:34:05:18 Entonces, por ejemplo, usemos esos mismos días de cautiverio, podemos convertir la variable principal o podemos crear una nueva variable. Si le decimos convertir la variable especificada, pues lo que va a hacer es reemplazar en la naturaleza de los datos.

00:34:21:11 Entonces días vamos a poner, por ejemplo, perdón, voy a quitarle la piel y la tilde para que la verifique muy rápidamente. Listo. Entonces fíjense que moverme.

00:34:44:05 Brinque y hay dos opciones de modificación, pero en ambas nos muestran cosas diferentes. Había otra variable por aquí que se llamaba sexo. Entonces vamos a hacer aquí una una de categorización de esa información. Permítanme, vamos a usar este mismo. La estructura siempre va a ser la misma para cualquier cambio que le quisiéramos.

00:34:47:08 Dar a los datos los vamos.

00:34:51:00 Aquí a generar bajo la variable que se llamó sexo, aquí el filtro.

00:34:52:11 Y lo hakam.

00:34:54:23 Sexo. Y le voy a decir.

00:34:59:14 Esto se va a llamar sexo recargado y listo.

00:35:28:14 Íbamos a usar aquí la misma Oriol Sexo. Usemos esas categorías para la visualización. Esto la que me refería ahorita con los cambios. Miren que cuando yo estoy aquí trabajando lo que es me está tomando la misma información y me la vuelve categoría. Aquí mil está cambiando la naturaleza a mi variable. Si yo me paro sobre esta variable, miren, me dice ah, bueno, es una variable de tipo long en este caso, y hay una etiqueta que se ha denominado sexo.

00:36:09:15 Y si nos vamos por aquí al manejador de variables puso en la parte superior y vamos a encontrar que estas dos variables que le añadimos, pues las etiquetas, se van a poder distinguir desde acá. Si yo le digo por ejemplo manejar y quiero ver esta que se llama sexo Recope, me va a decir que siempre que aparezca uno va a ser hombre, siempre que aparezca dos es mujer y siempre que aparezca tres es porque no encuentro información por esa razón, fíjense aquí ha creado 33.217 ausentes, valores vacíos y so, entonces hay una cosita por acá, nos vamos a ir a estadísticas y vamos a usar las tablas de cómo usar una tabla de frecuencias para

00:36:13:08 que veamos esos datos. Entonces esta alas a una guía.

00:36:14:11 Acá.

00:36:34:02 Vamos a tomar nuestra variable que creamos aquí texto codificado simplemente para que veamos la información como está organizada y ahí 29.000 hombres reportados en esta tabla hay 6300 mujeres reportadas en esta tabla y aquí hay unos datos pues sin información.

00:36:36:07 Asociados y.

00:36:49:14 Vamos a ver también la variable, pues que se va a convertir en nuestra valía. Le interesa a partir de este momento que es con la que vamos a empezar a combinar estos datos, no? Entonces vamos a revisar aquí las regiones.

00:36:50:13 A.

00:37:08:01 Las regiones y listo. Ahora sí íbamos a mandar esto, pues de forma descendente en la frecuencia. Listo, vamos a ver. Ok, piense que acá tenemos entonces los datos. Aquí pues ya están algunas de las de la región. Este es más por estar.

00:37:09:23 Y por este tipo de hechos.

00:37:12:08 Y fíjense que aquí me aparecen todos los datos.

00:37:34:13 Ya tenemos cargados nuestros datos, tenemos cargada nuestra información y una vez pues culminamos con los ajustes y toda la parte de gestión que quisiéramos darle a nuestra información, entonces vamos a ir al menú Estadísticas y allí vamos a ubicar la sección que se llama Modelos Espaciales Auto Regresivos.

00:37:40:23 Entonces cómo vamos a cargar una nueva tabla de datos? Pues fíjense, lo que vamos a hacer es movernos.

00:37:42:00 Aquí, perdón?

00:37:56:03 Movernos sobre el otro conjunto de datos. Entonces, recuerden, podemos hacerlo. Es de la parte superior. Y usando el manejador de marcos de datos, seleccionamos aquí los datos y aquí vamos a la sección Maps.

00:37:59:08 Listo.

00:38:31:06 Entonces qué tipo de archivos vamos a cargar acá? Que tipo de archivos van a encontrar acá? Son los archivos que están en formato desde HP que les contaba hace un ratico, están justo acá en esta carpeta. Entonces que tengo? A ver, vamos a habilitar esto de aquí, los tengo los departamentos y los municipios para para Colombia en ambos casos pues podríamos hacer la conjunción de ambos y pues bueno, voy a cargar los dos para mostrarles cuál es el cambio en cada uno de ellos.

00:38:41:03 Entonces les decía vamos a menú, estadísticas, modelos espaciales, auto regresivos y justo acá, pues entonces vamos a iniciar con el trabajo que queremos darle.

00:38:42:10 A esta parte.

00:38:48:16 Entonces lo primero y es la organización, nosotros vamos a llegar simplemente hasta el gráfico.

00:38:49:02 Sí.

00:39:13:12 Pero se pueden hacer opciones con matrices espaciales, se puede trabajar con el coeficiente de Morán, se puede trabajar ya con la parte de econometría espacial, podrían incluso optar por por la parte Cracking de Coughlin, revisar por ejemplo semi varios gramos y cosas por el estilo. Entonces lo primero que vamos a hacer es la organización, porque necesitamos una estructura para poder visualizar nuestros.

00:39:14:09 Datos, cierto?

00:39:40:22 Entonces vamos a indicar ya está Data, que lo que va a hacer es traducir un archivo de un formato SP y luego a combinar con mis datos, que muchos es la primera opción y luego lo vamos a decir. Mire, yo tengo un archivo en un formato ese HP o en un formato de web, así que lo que yo quiero es leerlo en un formato entendible por estado, porque lo quiero trabajar dentro de Stat, es decir, voy a cargar un archivo de temp.

00:40:00:12 Por esa razón lo que le vamos a pedir es que traduzca de un SP y a un dataset. Si lo tenemos comprimido antes, simplemente vamos aquí a la opción de descomprimir archivo y no tendremos lío. Entonces, para todas las regiones en general, lo que buscamos en Google simplemente es el nombre de la región que queremos ver y le ponemos al final.

00:40:01:20 Seis o.

00:40:02:17 -

00:40:03:03 Listo.

00:40:11:05 Orador 2 Y ahorita les cuento un poquito más sobre esto. Entonces, como nosotros hemos definido el directorio de trabajo aquí, pues va a ser imperativo esto, porque si no los va a guardar.

00:40:12:10 Y.

00:40:33:12 El mapa por allá en cualquier parte, entonces vamos a abrir aquí el mapa, ni que también departamentos y municipios hagamos primero departamentos. Entonces voy a cargar el archivo de departamentos desde HP y le voy a decir que me lo guarde como el nombre con el nombre siguiente, pues entonces departamento.

00:40:37:02 Colombia.

00:40:52:16 Lo voy a poner todo en minúscula. Y qué sigue entonces? Pues ya leímos la información que tiene que traducir, ya le dimos la información que tiene que transformar, ya seleccionamos el el mapa y lo enviamos. Entonces fíjense que cuando le vamos a enviar.

00:40:55:04 A ver, permítame, corresponde por.

00:40:59:08 Ese lado, cuando le vamos a enviar, entonces nos Sí que ha creado dos tipos de archivo.

00:41:00:00 Si.

00:41:07:17 Ambos con el mismo nombre y depto y depto por acá. Y me dice además.

00:41:25:03 Pues que yo le indique que trabajará con cada uno de los archivos. Por esa razón es que es importante que tengamos el archivo en ese HP y el archivo en PDF. Ya les cuento también qué otra cosa pasa para que lo tengamos presente.

00:41:25:15 Listo.

00:41:41:13 Entonces tenemos cargado el de departamentos y vamos por acá a revisar lo siguiente en la sección gráficos. Aquí me muestra la estructura y aquí me define pues los datos. Fíjense que hasta ahora si quieren volvamos a enviar aquí.

00:41:43:04 Este para que nos guarde con este nombre.

00:41:45:15 También.

00:41:46:01 Listo.

00:41:51:18 Y entonces fíjese que hasta ahora no me aparece algo, no me aparece con la estructura.

00:41:52:10 Sin.

00:41:55:20 Tanto. Está pensado muy para ir, digamos.

00:41:56:02 De manera sistemática. Paso uno, paso dos, paso tres en nuestras estructuras. Entonces voy a moverme ahora sobre la opción de archivo abrir, porque noten que yo hice una transformación. Él me dice Ah, bueno, yo importé unos archivos, cree las coordenadas espaciales, creo las coordenadas en X, las coordenadas en ye y pues definidos y pos de archivo. Pero noten que aún no hemos cargado al listo.

00:42:33:23 Lo que vamos es a cargar esos datos. Vamos a ir archivo, le vamos a decir que nos ahora, que nos ahora esos datos. Miren que acá pues me muestra mi información y aquí me muestra los dos que.

00:42:35:10 Creo creados por error, no?

00:42:45:10 Entonces los que creé para para el ejercicio dos departamentos, vamos a abrir esta primero que tiene el guión bajo ese HP y luego abrimos la que no tiene el guión.

00:42:46:19 Bajo y siempre listo.

00:43:02:18 Entonces es la que tiene el guión bajo. Ese HP me muestra justamente esto que hemos generado a partir de la visualización y de las coordenadas. Entonces tenemos una ID, la coordenada en X, la coordenada y, el orden que le vamos a dar la información bien. Y acá.

00:43:11:03 La visualización. Noten lo siguiente y es que si yo me voy aquí a la opción gráficos y yo le digo que haga un gráfico de doble entrada.

00:43:13:12 O por acá.

00:43:26:21 Le voy a decir crear, voy a decirle que juegue con un gráfico de dispersión en Yelp, pues le voy a poner la coordenada Angie y en x la coordenada en x le voy a decir aceptar. Y qué?

00:43:32:20 Perdón que me salió dentro de otra pantalla. Listo.

00:43:53:06 Miren que hace las conjunciones justo para para los choques de los puntos. Y aquí ya vemos la estructura del mapa. Si ya vemos que cargó correctamente. Y los valores para X, los valores para qué? Y se ha generado pues la información adecuadamente y esto solo como una medida de verificación, sin embargo.

00:43:57:00 Pues entonces vamos a quitar este de acá.

00:44:00:13 Sin embargo, pues lo que nosotros queremos es ver el mapa.

00:44:01:05 Con la información que le hemos cargado. Entonces voy sólo por por el ejercicio para no borrarles estos datos a crear otro marco de datos, ya sabemos, pues entonces para que los creamos, con qué funcionalidad no lo hacemos y cuál es la idea de estos? Desciframos, entonces le voy a decir crear, lo voy a poner mapa dos para que? Para que veamos los cambios de las.

00:44:27:20 Tablas de aquí.

00:44:52:15 Y me voy a mover ahora sobre mapa dos. Entonces aquí teníamos cargado, recuerden el que se llama departamentos es de HP dos, entonces vamos a cargar el otro, abrir el que no tiene ls HP no tenga. Aquí pues hay otra información, si bien aparecen las coordenadas en X, las coordenadas en Yen.

00:45:00:17 Nos aparece el nombre del departamento o el área, el perímetro como forma adicional. Noten lo siguiente también.

00:45:04:09 Voy a ir por acá.

00:45:24:11 Recuerdan los nombres que aparecían en el otro lado en la tabla uno? Pues miren que causan los nombres de los departamentos asociados a esa información y pues en mi conjunto de datos y los códigos de cada uno de esos departamentos, entonces voy a minimizar acá y pues entonces.

00:45:32:13 Sólo por el, por el ejercicio a mostrar es esta parte, vamos a traerlo por acá, tenemos la estructura nuevamente.

00:45:32:19 Si yo me voy a gráficos, miren que cuando cargue la tabla de datos ya me apareció la información. Si te enseña la organización previamente qué le di a mi conjunto de datos y ahora tengo la opción de graficar mi variable. Entonces aquí me detengo un momento para hacer algunas especifica naciones. Lo primero que tenemos que tener presente es que las variables que vamos a poder graficar en esta sección, tal como sucede por ejemplo con los histograma o como sucede con los diagramas de calle botes, pues son variables que estén denominadas aquí como numéricos.

00:46:17:15 Por esa razón le cambié la naturaleza a los días de cautiverio y le cambié la naturaleza a otra de las variables. Ya les cuento un poquito también.

00:46:18:13 Ahora para esta parte.

00:46:29:22 También vamos a poder hacer condicionales como lo trabajamos en en las demás ventanas y aquí pues entonces también tendremos algunas opciones de restricción.

00:46:30:11 Si.

00:46:37:06 Solo hagamos el ejercicio principal, entonces Graphic vemos el área primero, entonces aquí le damos a enviar.

00:46:40:06 Listo y fíjense.

00:46:44:12 Nos trae nuestro mapita para los departamentos, no tengo acá.

00:46:49:20 Ya lo podemos visualizar, lo podemos tener ordenadito.

00:47:01:02 Tal como sucede con cualquier otro gráfico en Stata vamos a poder modificar y editar cada una de las regiones simplemente con el editor de.

00:47:05:08 Gráficos. Listo entonces y de.

00:47:11:10 Esta manera pues vamos a ir realizando como este tipo de tareas, voy a irme aquí nuevamente.

00:47:17:06 Y lo que me queda abierto esté acá, listo.

00:47:19:12 Y entonces lo que voy a hacer.

00:47:22:05 Caramba, que por allá me queda abierto.

00:47:22:23 El editor de los.

00:47:25:18 De los gráficos ya está, entonces.

00:47:40:15 Lo que voy a hacer es moverme ahora sobre mi pantalla principal. Recuerden, no teníamos los datos que habíamos combinado. Entonces me voy a regresar aquí. Yo ya hice la modificación de los municipios.

00:48:00:12 Entonces me voy a regresar acá se doble. F Quedamos en los casos, se acuerdan? Y aquí que tenemos? Miren, vamos a graficar sobre el nombre del municipio, el otro es el nombre del departamento, yo quiero cargarlo sobre el nombre el municipio, entonces tengo que verificar cómo está escrito acá y como va a quedar escrito en el otro.

00:48:01:08 Lado y eso.

00:48:02:00 Entonces voy a hacer.

00:48:07:20 Lo siguiente se le voy a ese mapa.

00:48:08:22 Tengo uno, voy a cargar y.

00:48:13:01 Otro archivo abrir. Fíjense en una casa vari

Georreferenciación de datos con Stata 17


La gestión y graficación de información cuantitativa hacen posible realizar diversos tipos de análisis sobre los datos, que enriquecen las posibilidades de presentación de resultados y hallazgos relacionados. En esta presentación, se explorarán las herramientas con las que cuenta Stata 17 para preparar, combinar y gestionar la información, de forma que pueda ser representada posteriormente en mapas geográficos.

Etiquetas relacionadas

  • Análisis de datos
  • Datos
  • Gestión de datos
  • Gráficas
  • Importar Datos

¡Comparte este video con tus colegas!

Compartir

Ver más

Cotizar
Próximos
Eventos

X

Mis cotizaciones:

Comentarios a tu solicitud:

Cotizar