Archivo de la etiqueta: visualizacion de datos

Letras del Folklore Argentino: ¿A qué le cantan?

El siguiente es un análisis exploratorio para resolver una curiosidad: ¿A qué le canta el folclore Argentino?. El Objetivo es, inicialmente, extraer las palabras más utilizadas. Luego trataremos de ampliar el análisis tratando de agrupar las canciones en distintas categorías, descubrir temáticas en común, agrupar autores por estilo, etc. Pero vamos paso a paso…

Conjunto de Datos

Los datos fueron extraidos de http://www.mifolkloreargentino.com.ar/:

  • Cantidad de Artistas: 132
  • Cantidad de Canciones: 3665

Hay que tener en cuenta que el Universo de canciones a analizar no es completamente exhaustivo y está acotado a lo disponible en la fuente de datos, igualmente consideramos que 3600 canciones de las más populares es una muestra interesante para analizar. Otra consideración importante es que si varios artistas cantan la misma canción, las palabras de dicha canción serán contabilizadas todas las veces.

Pre-Análisis del Conjunto de datos

Las siguientes tablas pueden ayudar a dar un poco de contexto de qué estamos analizando:

Algunos ejemplos de canciones analizadas:

Cantidad de Canciones de cada artista (Top 10)

Canciones más repetidas en el conjunto de datos:

 

 

 

 

 

 

Análisis de las Canciones

Lo que hicimos fue simplemente descargar todas las canciones, armar una pequeña base de datos y recorrerla con un pequeño programita que recorre todas las letras y va contando cada una de las palabras. Para los curiosos, acá dejamos el link al código al final del artículo.

Palabra más utilizada en el Folklore Argentino

Nube de Palabras para las 50 palabras más usadas

Conclusiones

El autor del post quiere reconocer que se emocionó cuando descubrió que la palabra más usada en el Folklore Argentino es amor.

Del lado técnico, es una tristeza que no exista una base de datos unificada y libre con esta información. Sería bueno empezar a generarla y tener de manera prolija datos como letra de la canción, autor, fecha, versiones, estilo musical, etc. La misma sería de muchísimo valor para la academia e investigadores de nuestra cultura musical.

Próximos pasos

El siguiente análisis deja ganas de seguir explorando la información: ¿Qué comida se menciona más? ¿Qué bebida? ¿Qué provincia? ¿Cómo se compara el ranking de palabras con otros géneros musicales como el Rock Nacional, el Tango o el Cuarteto? ¿Quién es el artista más meloso? Si pudieramos acceder a más información podríamos realizar análisis mucho más exhaustivos: ¿Cómo evolucionaron las temáticas a lo largo del tiempo? ¿Quién es el autor más versionado? etc. Dejamos las preguntas, y los datos recopilados, para los curiosos que tengan ganas de explorar aún más esta info.

 

Día de la Mujer: Jubilaciones Femeninas vs Jubilaciones Masculinas

Siguiendo un poco los análisis que hicimos sobre datos de la Caja de Jubilaciones de Córdoba, quisimos aprovechar el día de la mujer para arrojar alguna estadística de género. Esta vez, accedimos al portal de la Ciudad de Córdoba para extraer el histórico del Haber Medio de los jubilados según la Caja de Jubilaciones, Pensiones y Retiros de Córdoba. Este análisis está bastante en sintonía e inspirado en un anterior post sobre Evolución de Sueldos por Género en Córdoba.

El objetivo de este post era tratar de visualizar la brecha en las jubilaciones entre los hombres y las mujeres. ¿Existe? ¿De cuánto es? ¿Va en aumento o en disminución? ¿Hay igualdad entre la jubilacion de un hombre y de una mujer?

Empezamos con la Evolución en el monto del Haber Jubilatoirio por sexo. ¿Cómo evolucionaron las jubilaciones Masculinas y Femeninas en el tiempo?

¿Cuál es la diferencia entre las jubilaciones (en porcentaje) entre el Hombre y la Mujer?

Un par de Conclusiones:

  • Historicamente, la jubilación promedio masculina siempre fue mayor a la femenina.
  • En el 2003, la diferencia entre el haber promedio masculino y el haber promedio femenino era de poco más del 35%
  • En el 2017, dicha diferencia se acortó al 25%
  • Si bien los Jubilados de la Ciudad de Córdoba cobran en promedio más que las Mujeres, se ve que la tendencia es hacia la igualdad.
  • En 14 años, la brecha se acortó un 10%, es decir a una tasa de 0.71% anual. Por lo que una rápida y burda estimación sugiere que se necesitan aproximadamente 35 años más para que la brecha se reduzca a 0.
  • Recordemos, que historicamente en la ciudad de Córdoba, el desempleo Femenino siempre fue superior al desempleo Masculino.

Historico de Ventas Minoristas para Argentina

Siguiendo un poco los debates en las Redes Sociales, uno de los temas más debatidos es la caida en las Ventas Minoristas durante el 2016 y lo que va del 2017. La mayoría de estos datos viene de la Red CAME (Confederación Argentina de Medianas Empresas) que publica excelentes informes y estadísticas todos los meses.

Buscando tener un pantallazo general de los últimos años, no encontramos un dataset o informe que lo hiciera, por lo que nos propusimos relevar a mano la información publicada en la página para generar un Histórico. La Visualización histórica es la siguiente:

Los datos los subimos a un csv para que cualquiera que los necesite y se encuentran en el github de Open Data Córdoba.

Como sugerencia, sería bueno que estas organizaciones y entidades gremiales que trabajan con datos, no solo realicen y publiquen informes sino que además aporten a la comunidad el conjunto de datos producto del relevamiento. De esta forma, la comunidad entera de analistas, periodistas e investigadores podrían tener acceso a ella para reutilizarla en nuevos estudios.