Demografía con Cartas Marinas

Cartas Marinas

En Argentina, una carta marina es una lista de establecimientos donde se va a desarrollar un proceso electoral. Incluye la lista de centros de votación (en general escuelas), los datos de las mesas y cantidad de electores e incluye también la sección y el circuito electoral al que corresponde cada uno.

Lamentablemente este documento se publica en formato PDF y además (al menos los casos 2015 y 2017) muy difícil de transformar a una planilla reutilizable.

Este post trata de como transformando las cartas marinas 2015 y 2017 pueden obtenerse datos interesantes de movimiento demográficos de población en la Provincia de Córdoba. Vale la pena recordar que nuestra Organización OpenDataCordoba nació con motivos de las disputas electorales legislativas del año 2013. En aquel momento, entre otros trabajos, se libero un mapa de resultados por escuela para toda la provincia de Córdoba. Se lo llamó DemocraciaConCodigos:

En este caso se cuenta ya con las cartas marinas 2015 y 2017 ya procesadas y documentado en repositorios abiertos (20152017).

Lo primero que uno puede trabajar es un mapa de las escuelas o centros de votación.  Lamentablemente la geolocalización es estimada. Para mejorar se debería usar un hermoso proyecto (Donde Voto?) que libero Manuel Aristarán en 2013.

Como el que escribe trabaja actualmente en la Municipalidad de Córdoba todos estos datos quedarán liberados en el Portal de Gobierno Abierto: Cartas Marinas procesadas

Una vez con esto datos es posible comparar como evolucionaron los padrones electorales en cada departamento. Antes de eso vale la pena destacar algunos datos de contexto. La justicia electoral nacional libero (adiviná, en JPG) una lista de electores por distrito.

Aquí se puede ver como el padrón nacional se incrementó en un 3.48%; Córdoba un poco más: 3.68%. El dato extraño es CABA: 0.18%, mucho menos.

Departamentos de Córdoba

Tomando las cartas marinas de Córdoba pueden acumularse los datos por sección electoral (departamentos) y ver:

El 38% del padrón corresponde a la Ciudad de Córdoba.

Este CSV pasó además con un proceso de conexión a los polígonos de estos distritos y quedo disponible en CSV (con WKT) y en un mapa de Carto:

Aquí se ven claramente un crecimiento en la zona centro. El Departamento Colón es segundo de mayor crecimiento y 11 de los 17 circuitos electorales (ciudades en general) que mas crecieron son de ese departamento.

El departamento Colon desplazó a Rio Cuarto como segunda sección electoral en la provincia de Córdoba.

TABLA:

Algunos casos como el de Mendiolaza son interesantes, es el municipio que más creció de los que tienen más de 10.000 electores: más del 16%. Cinco veces el promedio nacional y provincial y el doble que el de su departamento. Son muchas ciudades en situaciones similares.

Ojalá estos datos estén en manos de aquellos que planifican la infraestructura y los servicios de estas ciudades.

Ciudad de Córdoba

La ciudad de Córdoba creció poco menos que el promedio provincial. Podemos suponer que la ciudad crece hacia los departamentos vecinos mirando los números.

Tomando los circuitos electorales de la Ciudad de Córdoba puede mostrarse dos mapas; uno de los electores por distrito y otro de la variación de electores 2015 – 2017 en cada uno de ellos.

(click en los mapas para ampliar)

Un caso similar es el de Río Cuarto. Este circuito electoral fue el único de más de 10.000 electores que decreció. Al igual que la Ciudad de Córdoba se percibe un incremento en los circuitos vecinos.

Más datos

El resumen de datos y mapas de los movimientos de electores (¿población?) quedo libre en el portal de Gobierno Abierto de la Municipalidad de Córdoba.

 

Letras del Folklore Argentino: ¿A qué le cantan?

El siguiente es un análisis exploratorio para resolver una curiosidad: ¿A qué le canta el folclore Argentino?. El Objetivo es, inicialmente, extraer las palabras más utilizadas. Luego trataremos de ampliar el análisis tratando de agrupar las canciones en distintas categorías, descubrir temáticas en común, agrupar autores por estilo, etc. Pero vamos paso a paso…

Conjunto de Datos

Los datos fueron extraidos de http://www.mifolkloreargentino.com.ar/:

  • Cantidad de Artistas: 132
  • Cantidad de Canciones: 3665

Hay que tener en cuenta que el Universo de canciones a analizar no es completamente exhaustivo y está acotado a lo disponible en la fuente de datos, igualmente consideramos que 3600 canciones de las más populares es una muestra interesante para analizar. Otra consideración importante es que si varios artistas cantan la misma canción, las palabras de dicha canción serán contabilizadas todas las veces.

Pre-Análisis del Conjunto de datos

Las siguientes tablas pueden ayudar a dar un poco de contexto de qué estamos analizando:

Algunos ejemplos de canciones analizadas:

Cantidad de Canciones de cada artista (Top 10)

Canciones más repetidas en el conjunto de datos:

 

 

 

 

 

 

Análisis de las Canciones

Lo que hicimos fue simplemente descargar todas las canciones, armar una pequeña base de datos y recorrerla con un pequeño programita que recorre todas las letras y va contando cada una de las palabras. Para los curiosos, acá dejamos el link al código al final del artículo.

Palabra más utilizada en el Folklore Argentino

Nube de Palabras para las 50 palabras más usadas

Conclusiones

El autor del post quiere reconocer que se emocionó cuando descubrió que la palabra más usada en el Folklore Argentino es amor.

Del lado técnico, es una tristeza que no exista una base de datos unificada y libre con esta información. Sería bueno empezar a generarla y tener de manera prolija datos como letra de la canción, autor, fecha, versiones, estilo musical, etc. La misma sería de muchísimo valor para la academia e investigadores de nuestra cultura musical.

Próximos pasos

El siguiente análisis deja ganas de seguir explorando la información: ¿Qué comida se menciona más? ¿Qué bebida? ¿Qué provincia? ¿Cómo se compara el ranking de palabras con otros géneros musicales como el Rock Nacional, el Tango o el Cuarteto? ¿Quién es el artista más meloso? Si pudieramos acceder a más información podríamos realizar análisis mucho más exhaustivos: ¿Cómo evolucionaron las temáticas a lo largo del tiempo? ¿Quién es el autor más versionado? etc. Dejamos las preguntas, y los datos recopilados, para los curiosos que tengan ganas de explorar aún más esta info.

 

Opinión: Uso y Desuso de los Datos Abiertos

Hace ya varios días que la publicación de la nómina de empleados municipales generó un caótico debate. Y digo caótico porque se discutió sobre privacidad, sobre salarios, sobre puja distributiva, sobre eficiencia de los servicios municipales, sobre corrupción política, sobre acomodos, sobre mafias, sobre roles sindicales, sobre transparencia y sobre cloacas desbordadas. Y es que cada uno tomó estos datos y los usó para acompañar su discurso sobre algo que tenía ganas de expresar o decir. La nómina fue como esa pequeña discrepancia que, en los malos momentos, las parejas utilizan como excusa para decirse a la cara lo que se venían guardando o nunca pudieron decir.

Pero todo el debate no es más que la continuación de una sociedad que después años del “no te metás” comenzó nuevamente a debatir algo crucial: El Rol y el Funcionamiento del Estado. En este contexto surge un gran problema y es que aún la definición, la concepción y el funcionamiento del estado sigue siendo una gran caja negra, esto lo digo por la cantidad de acusaciones y argumentos que se arrojan sin un mínimo respaldo.

En el estado están los amigos e hijos de funcionario trabajando ¿Si? ¿Quiénes? ¿Es ilegal? ¿Están por acomodo o entraron por los medios correctos? Ahora, en la Municipalidad, tenemos Nombre, Apellido y DNI: ¿dónde está la lista de “los hijos de…”?

En el estado está lleno de vagos que no hacen nada ¿Si? ¿Quiénes son los vagos? ¿Qué puestos ocupan? ¿Qué tareas deberían hacer que no están haciendo? ¿”Lleno de vagos”, cuántos de la Planta de empleados tienen efectivamente dicho comportamiento como para que sea correcto generalizar a que “está lleno”?

El estado es muy grande y es poco eficiente: ¿Si? ¿Qué tamaño tiene el Estado? ¿Cuántas personas trabajan? ¿Qué áreas de trabajo existen? ¿Cómo definís grande? ¿Cómo definís eficiente? ¿Cómo podés asegurar que no lo es? ¿Dónde está la evidencia del derroche? ¿Dónde está la demostración de que se podría derrochar menos?

Dichas muletillas del “sentido común” estuvieron en boca de todos estos últimos años, y salvo por algún caso concreto o puntual que no habilita la generalización, pocas personas pudieron lamentablemente responder las preguntas que quedaban abiertas. Tenemos que aprender a desconfiar de este sentido común que en general anula nuestro pensamiento crítico y nos ofrece recetas ya pensadas por otros de antemano. Poner en entredicho lo que suponemos escuchando nuevas versiones puede ser un buen ejercicio.

Para finalizar, ¿qué rol pueden jugar los datos abiertos en este contexto? Muchas de las preguntas antes planteadas siguen aún sin respuesta y hay dos grandes tareas para llegar a responderlas: 1) Abrir el estado, hacer que la información sobre su funcionamiento sea pública y de fácil acceso, 2) comunicar dicha información y hacerla llegar a los ciudadanos. La discusión sobre el Rol del Estado es clave y no puede estar librada al “sentido común” y/o el “saber popular”. Las prácticas de Gobierno Abierto y el Periodismo, apoyándose en los Datos Abiertos, deben ayudar a formalizar definiciones y aportar datos duros y evidencia que acompañe el debate. Muchos me preguntan: ¿Pero es realmente necesario publicar los datos de los empleados? Para mi, primordial. Para muchos, excesivo. Pero definitivamente es un gran paso que estemos debatiendo esta pregunta.

Nota de Opinión escrita por uno de nuestros integrantes: Patricio Del Boca

Analizando las ofertas del Hotsale 2017

Esta semana fue el “Hot Sale 2017”, una campaña de marketing organizada por la Cámara Argentina de Comercio Electrónico, de la cual forman parte la gran mayoría de las empresas que venden online en Argentina. Otorgando descuentos especiales y beneficios como “envío gratis” para muchos productos busca fomentar el crecimiento del comercio electrónico y estimular las alicaídas ventas. Se suma a campañas como el “Cyber Monday” y el “Black Friday” que emulan, con cierto éxito motorizado por importantes coberturas mediáticas, a las campañas de igual nombre en otros paises.

Desde hace varias ediciones un programador anónimo realiza, a través de software, un trabajo esencial para saber si la “super oferta” de un producto durante los dias de campaña es real o es un engaño. Lo que hace es el “scraping” de los sitios web de las empresas de venta minorista de electrodomésticos (Garbarino, Musimundo, Compumundo y Frávega), es decir, la navegacion automática y la extracción de la información útil de todos (o muchos) productos en venta en esos sitio. Cuando la campaña empieza, ejecuta nuevamente esta tarea automatizada recavando además cual es la supuesta oferta. Con estos datos duros se puede saber, para cada producto de cada cadena, cuál es el descuento real (y calcular, de yapa, cuánto mienten las grandes cadenas).

Superanálisis de superofertas

El sitio que permite escrutar las ofertas es muy sencillo y efectivo, pero se limita a mostrar los datos en tablas (filtrables y ordenables). Es útil para evaluar el descuento en un producto en particular o para “darse una idea” de los descuentos disponibles (y encontrar veraderas gangas, supongamos), pero es dificil entender de manera más general cual es la política de descuentos de cada cadena.

Desde Open Data Córdoba quisimos indagar un poquito más y para eso realizamos algunos gráficos simples con los mismos archivos de datos que utilizan esas tablas y los analizamos. Si te interesa ver “la cocina” de los siguientes y otros gráficos, podés husmear el notebook.

Musimundo

Esta es la comparativa entre la distribución de descuentos en Musimundo.  El histograma rojo indica lo que promocionaron durante la campaña y el azul son los precios los decuentos reales,
es decir, el porcentaje de diferencia respecto a los precios durante los dias previos.

Como se ve,  (casi) no hay productos que hayan estado “en promoción” durante el HotSale, aunque en realidad, para el 40% de los productos, el descuento fue 0%. Es decir, marketing puro y duro.  También se puede ver cómo hay mucho falso descuento de 30%” y muchísimo en 50%.

El gráfico de puntos (scatter) hace una comparativa entre las variables “descuento real” vs “promocionado”. En ambos casos, el color es indicador del precio real relevado dias previos (amarillo son productos de precios bajos y violeta productos caros, pasando por verde y azul).

Se puede ver que las promociones que menos “mienten” tienden a ser la de productos de precios medios a altos (arriba de $3500, aproximadamente) y para los más altos cuando la “promo” no es tan ostentosa. Tambien vemos que la mayoría de los productos promocionados que en realidad no tienen descuento tienden a ser los productos de menor valor. ¿Será que si es algo barato uno tiende a indagar menos y dejarse llevar por el tentador 50% de descuento?

Compumundo

A primera vista, esta empresa parece no haberse interesado demasiado por la campaña.

Sin embargo, el 40% de los productos en venta fueron promocionados con algun descuento. Cuando comparamos con datos previos vemos estos gráficos:

Se nota un patrón bastante binario: el descuento es totalmente verdadero o es mentira y no hay descuento en absoluto.  En menos casos existe un descuento, pero menor al promocionado.

Garbarino

Garbarino pareció jugar a llenar de puntitos en el gráfico. Lo extraño del caso es que hay productos con descuento real que no están promocionados. ¿El peor equipo de marketing de los últimos 50 años? ¿O tenían los precios realmente muy inflados ?

Frávega

Frávega repite la idea de que es más fácil exagerar en la promoción si el precio del producto es bajo, como se ve en la linea de puntos con descuento real en 0.  Hay promociones de más del 60% cuando en realidad es puro humo y están al mismo precio que los días previos al HotSale.

Pero lo más grave es la cantidad de productos que ¡aumentaron!  Para la mayoria de estos casos tuvieron la decencia de no anunciarles promo, pero hay algunos en los que aumentaron un 30% (con dias de diferencia) y los promocionan con un supuesta rebaja del 20%.

Lo paradójico del caso es que es una de las firmas “fiscalizadas” por la Facultad de Sociales de la UBA.  En fin.

Algunas notas finales

Hay que aclarar que al ser estos datos totalmente no oficiales y al no haber otra fuente de datos disponible para validarlos, es dificil aseverar que la comparativa es certera. Más aún, puede incurrirse en un sesgo si la fecha de relevamiento original es mucho antes que cuando inician las ofertas, dada la inflación que sufre nuestro pais (de hecho, consultamos esto a nuestro amigo “Domingo Dominguez”).  Una solución para robustecer la confiabilidad es que los scrapers sean de código totalmente abiertos, que más programadores colaboren con este proyecto y se ejecuten diversas corridas de scraping independientes durante las mismas fechas alrededor del “hotsale” (o como se llame) para poder contrastar.

No obstante, es un buen aporte que pone el foco en analizar, a traves de los datos al alcance (generándolos lo mejor posible cuando no lo están), el comportamiento tantas veces desleal de la publicidad.  Sería razonable exigir que haya mayores regulaciones y penas efectivas cuando se comprueba, por ejemplo, que se publicita un descuento cuando en realidad el producto al que acaban de aumentar. Pero, huelga decirlo, muchas veces los mismos gobiernos que deberían agarrar el toro por las astas y enfrentar estas “estafas de marketing” son elegidos justamente haciendo uso extensivo de estas en sus campañas electorales.

Por otro lado, este humilde análisis permite abrir un debate que recurrentemente tenemos en nuestro grupo ¿Los datos abiertos son sólo exigibles al gobierno y al sector público?  A mi en particular por supuesto que me interesa que los gobiernos sean totalmente transparentes, porque manejan el dinero público, pero también me gustaria que lo fuesen las grandes empresas, porque también inciden fuertemente en la economía (y en otros aspectos) del pais.

Por último me gustaría destacar lo útil que resulta poder comparar precios para tomar decisiones de compra acertadas.  Consumidores informados hacen un mercado más competitivo, pero justamente las grandes empresas minoristas en su conjunto son celosas de compartir la información porque competir no es algo que los beneficie (recordemos que esta idea surge de la cámara que las nuclea, y dice la sabiduría popular que “entre gitanos no se adivinan la suerte”).  Esa idea básica de compartir información entre consumidores para tomar mejores decisiones es la que quise implementar en Preciosa, una aplicación que permitía, a traves del celu, relevar precios de cualquier producto en un super y saber el “precio de mercado” relevado por otros usuarios.  Resultó ambicioso y difícil de sostener sin apoyo económico (que no supe conseguir, soy el peor equipo de marketing, sin dudas), pero sigue pareciéndome una idea necesaria y valiosa para defendernos de tantos cuentos del tío que a toda hora nos venden, literalmente.

Dándole contexto a las noticias con Datos Abiertos

Objetivo

Este post persigue dos objetivos:

  • Hacer una introducción al portal Sitio del Ciudadano del Ministerio de Hacienda y Finanzas Públicas.
  • Mostrar cómo los Datos Abiertos pueden ayudar a dar contexto a las noticias sobre los gastos del Estado.

Introducción

Los Datos Abiertos sirven, entre otras cosas, para que el ciudadano pueda darle contexto a las noticias.

A modo de ejemplo, el domingo se conoció que el Gobierno Nacional iba a destinar USD 2000 millones a la compra de armamento. Si bien esa cifra puede resultar desorbitante ¿qué tanto representa para el Estado en comparación con otros gastos? ¿Cómo nos pueden ayudar los datos abiertos a darle sentido y contexto a esta cifra? ¿cuánto representa ese gasto en comparación a otros gastos?

Que el Estado invierta en armamento no es un problema per se, después de todo las Fuerzas Armadas son responsabilidad del ejecutivo, pero dado el contexto nacional de recesión, recortes en distintas áreas e intento de disminución del Déficit Fiscal quizá valga la pena analizar un poco dicho gasto.

Existe un portal de datos abiertos donde está el detalle del Presupuesto Nacional junto a su nivel de ejecución, el Sitio del Ciudadano del Ministerio de Hacienda y Finanzas que puede accederse desde http://sitiodelciudadano.mecon.gov.ar. Recordemos que el Presupuesto Nacional es la ley anual que sanciona el Congreso donde planifica los ingresos que recibirá el Gobierno  y cómo se aplicarán para satisfacer las necesidades de la población: salud, seguridad, justicia y educación, entre otras.

 

Manos a la Obra!

Primero vamos a pasar la cifra de dólares a pesos, dado que el Sitio del Ciudadano publica todos sus montos en millones de pesos, tomando la cotización del dólar al día de la fecha (28/03/17) queda: USD 2.000.000.000 * 15,43 = $ 30.860.000.000. (Treinta Mil Ochocientos Sesenta Millones de Pesos). Para compartir el formato con el Sitio del Ciudadano (que muestra los valores en Millones de Pesos), usaremos la cifra $ 30.860 M.

Para poder hacer una comparación, vamos al Portal del Ciudadano y entramos en la solapa de Ejecución Presupuestaria donde encuentra el detalle del Origen y el Destino de los recursos del Estado. Para entender un poco más las cifras que se muestran en los cuadros y su definición contamos con una página de ayuda, si bien la intención del sitio es mostrar la información en un lenguaje sencillo y claro a veces los términos suelen ser un poco confusos.

Comparación con Gastos por Jurisdicción

En cuadros avanzados, estan los Gastos por Jurisdicción, debido a que la página permite poca interactividad descargamos la planilla con el simple objetivo de poder añadir el nuevo gasto en armamento y ordenar los montos. El cuadro resultante es el siguiente:

 

Algunas conclusiones del Cuadro:

  • Tomando en cuenta los montos, el Gasto en Armamento ocuparía la 12va posición en el Presupuesto Nacional
  • El Gasto en Armamento estaría por encima del presupuesto asignado a:
    • Ciencia y Tecnología: 2.06 veces más
    • Cultura: 8.68 veces más
    • Turismo: 13.14 veces más
  • El Gasto en Armamento estaría por debajo del presupesto asignado a:
    • Ministerio de Trabajo, Empleo y Seguridad Social: 3.03% del monto.
    • Ministerio de Educación.: 23.55% del monto.
    • Ministerio de Salud: 66.69% del monto.
  • Según una entrevista Radial a la Diputada Juliana de Tullio en Radio 10, el 2017 no tenía presupuestado gastos en armamento, por lo que esta compra no está incluida en ningún sub-ítem del Presupuesto lo que hace este cuadro aún más interesante, se agregó un nuevo gasto al Presupuesto y en el puesto número 12 (un monto no menor).

Comparación con Gastos por Programa:

Este es el más interesante según el criterio del autor, debido a que permite comparar concretamente el gasto en equipamiento militar con acciones concretas del Estado como Mejora de la Calidad Educativa, Fomento, Producción y Difusión del Teatro, Sanidad Escolar, etc. Para ver los gastos por programa, tenemos que seleccionar, dentro de Cuadros Avanzados, la opción Gastos por Programa. Dejamos a Criterio del Usuario el explorar la información en búsqueda de referencias de interés, dejamos algunos ejemplos:

  • Se invirtiría el doble en armamento que en el Programa de Apoyo al Empleo

  • Se invirtiría 4.75 veces más en armamento que en la Modernización de la Red de Transporte Ferroviario

  • Se invirtiría en armamento el 38.89% de lo invertido en Desarrollo de la Educación Superior (salarios de los docentes universitarios, preuniversitarios, personal no docente, y becas)
  • Se invirtiría 112 veces más en armamento que en el Programa Mejoramiento de la Calidad Educativa

Conclusiones

El debate sobre los diferentes montos y las diferencias entre lo asignado en el Presupuesto y el nuevo Gasto en Armamento Militar es amplio y tiene muchas aristas. Como mencionamos anteriormente, per se está dentro de las facultades del Poder Ejecutivo el mantener las Fuerzas Armadas. Además, también entendemos que las diferencias en los montos dependen de muchos factores y que no necesariamente es válida la comparación en crudo de los montos como una medida de mayor eficiencia en la inversión estatal. No obstante, creemos que es completamente válida la pregunta: ¿Porqué el Estado invirtió el doble en Armamento que en Ciencia y Tecnología? como disparadora de dicho debate político.

Queda demostrado también que el acceso a los gastos del Estado es relativamente sencilla, lo cual provee al ciudadano de herramientas para entender un poco más las noticias y nutrirse de datos e información concreta, poner en contexto gastos y generar preguntas y disparadores al debate político.

Desde Open Data Córdoba nos interesa aportar datos y cifras concretas a la discusión, como así también darle herramientas al ciudadano para que pueda acceder fácilmente a la Información sobre la Gestión Pública, generando mayor transparencia y participación. Quedará en manos de analistas políticos y económicos el realizar las aclaraciones e interpretaciones correspondientes.

Día de la Mujer: Jubilaciones Femeninas vs Jubilaciones Masculinas

Siguiendo un poco los análisis que hicimos sobre datos de la Caja de Jubilaciones de Córdoba, quisimos aprovechar el día de la mujer para arrojar alguna estadística de género. Esta vez, accedimos al portal de la Ciudad de Córdoba para extraer el histórico del Haber Medio de los jubilados según la Caja de Jubilaciones, Pensiones y Retiros de Córdoba. Este análisis está bastante en sintonía e inspirado en un anterior post sobre Evolución de Sueldos por Género en Córdoba.

El objetivo de este post era tratar de visualizar la brecha en las jubilaciones entre los hombres y las mujeres. ¿Existe? ¿De cuánto es? ¿Va en aumento o en disminución? ¿Hay igualdad entre la jubilacion de un hombre y de una mujer?

Empezamos con la Evolución en el monto del Haber Jubilatoirio por sexo. ¿Cómo evolucionaron las jubilaciones Masculinas y Femeninas en el tiempo?

¿Cuál es la diferencia entre las jubilaciones (en porcentaje) entre el Hombre y la Mujer?

Un par de Conclusiones:

  • Historicamente, la jubilación promedio masculina siempre fue mayor a la femenina.
  • En el 2003, la diferencia entre el haber promedio masculino y el haber promedio femenino era de poco más del 35%
  • En el 2017, dicha diferencia se acortó al 25%
  • Si bien los Jubilados de la Ciudad de Córdoba cobran en promedio más que las Mujeres, se ve que la tendencia es hacia la igualdad.
  • En 14 años, la brecha se acortó un 10%, es decir a una tasa de 0.71% anual. Por lo que una rápida y burda estimación sugiere que se necesitan aproximadamente 35 años más para que la brecha se reduzca a 0.
  • Recordemos, que historicamente en la ciudad de Córdoba, el desempleo Femenino siempre fue superior al desempleo Masculino.

Historico de Ventas Minoristas para Argentina

Siguiendo un poco los debates en las Redes Sociales, uno de los temas más debatidos es la caida en las Ventas Minoristas durante el 2016 y lo que va del 2017. La mayoría de estos datos viene de la Red CAME (Confederación Argentina de Medianas Empresas) que publica excelentes informes y estadísticas todos los meses.

Buscando tener un pantallazo general de los últimos años, no encontramos un dataset o informe que lo hiciera, por lo que nos propusimos relevar a mano la información publicada en la página para generar un Histórico. La Visualización histórica es la siguiente:

Los datos los subimos a un csv para que cualquiera que los necesite y se encuentran en el github de Open Data Córdoba.

Como sugerencia, sería bueno que estas organizaciones y entidades gremiales que trabajan con datos, no solo realicen y publiquen informes sino que además aporten a la comunidad el conjunto de datos producto del relevamiento. De esta forma, la comunidad entera de analistas, periodistas e investigadores podrían tener acceso a ella para reutilizarla en nuevos estudios.

Algunas ideas sobre Gobierno Abierto y Datos Abiertos

Esta semana se armó una linda discusión con los compañeros de Open Data Córdoba sobre nuevas implementaciones de Políticas basadas en Datos Abiertos. Este no es un post académico y acabado, la intención es tener una transcripción un tanto informal sobre los temas que solemos debatir con el objetivo de transparentar un poco a qué nos referimos cuando hablamos de Datos Abiertos, Gobierno Abierto y qué hacemos en Open Data Córdoba cuando no estamos analizando datos.

Todo empezó con una pregunta de uno de los miembros en el canal de chat:

¿Que idea política creen ustedes que la rompería en relación a datos abiertos? No me refiero a datos específicos sino a ideas políticas más generales.

Algunos de las ideas que salieron:

Trámites Digitales

Sería bueno que los trámites que se deban hacer (carnet de conducir, dni, cambio domicilio, partida de nacimiento, etc) puedan hacerse digitales un 90%, una forma de remover las colas que suelen formarse y agilizar el trámite al ciudadano. Si bien este es un tema más ligado al Gobierno Electrónico, si la informatización del trámite genera datos para liberar entonces estaría muy ligado a políticas de Datos Abiertos y Gobierno Abierto.

Visualización y Difusión

Es necesario mostrar y difundir más qué hacemos aquellos que trabajamos en Datos Abiertos y Gobierno Abierto. No solo visualizar la información de manera que el vecino pueda hacer uso de ella, sino también capacitar y difundir nuestra tarea. Invitar a ONGs, Universidades, Medios y Periodistas a encuentros nucleados bajo una simple consigna: “¿Qué datos o información maneja el Estado y te gustaría que sea pública? ¿Qué información que maneja el estado te ayudaría a realizar un mejor trabajo/investigación?”. Políticas Públicas de difusión dentro de los Gobiernos ayudarían a visibilizar más la importancia de los Datos Abiertos y cómo las personas y organizaciones pueden beneficiarse.

Software Público

El Software que se usa en el Estado debería ser público, auditado, y reutilizable. Que se utilicen tecnologías Open Source y Públicas en los Gobiernos ayuda a los ciudadanos a entender mejor cómo funciona y qué información generan los estados. A su vez, permitiría la participación activa de la comunidad tecnológica en la mejora continua de los sistemas utilizados.

Impacto de los Programas de Gobierno

El Gobierno debería publicar informes y análisis (basados en datos) sobre los impactos que generan en la vida de los ciudadanos las políticas que llevan a cabo.

Transparencia en los Criterios de Decisión

Siguiendo la linea del punto anterior, sería bueno que los gobiernos generen Políticas Orientadas por Evidencia con alguna justificación en datos abiertos. Básicamente, si el Estado toma una decisión, que el ciudadano tenga acceso a la decisión más los datos que llevaron a la conclusión de que esa era la mejor decisión a tomar.

Balances de Gestión con Datos

Hoy en día tenemos el Portal del Ciudadano con la ejecución Presupuestaria, y sabemos que para tal ítem cuánto de su presupuesto se ejecutó. Pero es difícil saber por ejemplo, ¿Por qué se sub-ejecutó tal programa? ¿Qué pasó/a dónde fue esa plata?. Sería bueno que los gobiernos presenten balances donde se comunique: Esto se quizo hacer y esto realmente se hizo. Esto que no se hizo fue por estas razones y los recursos se utilizaron para este otro programa. La preguna clave a responde, hablando en criollo, es: “¿Dónde está la plata que se destinó a este programa, si dicho programa sub-ejecutó el presupuesto asignado?

“Reproducible Decision”

En la Ciencia hay algo que se conoce como Reproducible Research, es el conjunto de Investigación + Datos Crudos + Procedimiento Realizado. La filosofía detrás de este concepto sería algo así: “Si partis de acá y usas estos datos, entonces llegas a esta conclusión, verificalo por vos mismo.” Si bien sabemos que los criterios de decisión dentro de la política son más complejos, sería bueno que el gobierno pueda con sus Principios de Gobernanza + Recursos transparentar cómo es que llegó a la conclusión de que una decisión que tomó fue la mejor.

Toma de Decisiones en las Licitaciones

Ya para cerrar los temas que surgieron, se propuso una herramienta/plataforma/conjunto de datos que permita navegar las Licitaciones hechas por el estado y sus respectivas decisiones. Que permitan responder preguntas tales como: “¿En cuántas de las licitaciones, ganaron las propuestas más costosas? ¿Por qué? Qué diferencia había para elegirla? ¿Cuál hubiera sido el ahorro total si se elegía la segunda opción en todas ellas?” Sabemos que son números un poco engañosos pero dispararían muchas preguntas y análisis y controles interesantes por parte de los ciudadanos hacia la toma de decisiones de los gobiernos.

En Open Data Córdoba nos dedicamos también a debatir, planificar y diseñar políticas de Transparencia y Gobierno Abierto. Estas propuestas son luego presentadas en distintos espacios como las Mesas de Diálogo de Gobierno Abierto. Creemos firmemente que este tipo de políticas tiene un impacto directo sobre la calidad democrática, la participación ciudadana y la transparencia gubernamental.

Sobre “Trending Topics” y “campañas que sorprenden” en las Redes Sociales

Nuestro compañero Patricio Del Boca estuvo dialogando con al gente de Radio Universidad sobre el reciente hashtag #VoluntarioDocenteNoAlParo inspirado en el excelente informe de la Agencia Digamos.

Creemos fundamental el valor que aporta a la ciudadanía este tipo de informes basados en datos concretos sobre lo que ocurre por detrás de las Redes Sociales, así como también la divulgación y la educación sobre cómo funcionan estas plataformas.

Gastos de Campaña: Elecciones Municipales Córdoba 2015

Hace un par de días, subieron al portal de Datos Abiertos de la Ciudad de Córdoba la Rendición de Cuentas de las Elecciones Municipales del 2015. Si bien son unos PDFs, metimos manos a algunos datos de alto nivel como para generar un poco de información sobre los gastos que tuvo cada Partido/Alianza en dicha elección. Los cruzamos además con los resultados oficiales también extraidos del portal.

Para recordar un poco el contexto, en el 2015 se impuso la Alianza Juntos Por Córdoba. Aquí el resultado en cantidad de Votos para Intendente de dicha elección (algunos partidos no presentaron Rendición al día de la fecha):

Ahora la pregunta principal: ¿Cuánto invirtió cada partido en la campaña electoral? Según los datos extraidos de cada Rendición de Cuentas:

Y cruzando ambos datos: ¿Cuánto tuvo que invertir cada partido para obtener 1 voto?

Las Rendiciones de Cuentas son obligatorias para todos los partidos de acuerdo a la Ordenanza N° 12.235. Esta modifica la ordenanza 10.073 que es el Código Electoral Municipal.

 Lamentablemente dichas ordenanza no especifica que el formato de los datos entregados sea óptimo para hacer análisis más profundos y todos los partidos presentan la rendición en papel. Este formato requiere de técnicas especiales para poder extraer información de valor como el detalle de la nómina de aportantes.

Desde Open Data Córdoba proponemos se arme una reforma para que estas rendiciones de cuenta sean entregadas en un formato digital que permitan a los periodistas acceder más facilmente a los datos de las mismas.