Archivo de la categoría: Sin categoría

Transparencia y Toma de decisiones en la era de la Inteligencia Artificial

El objetivo de este artículo es abrir el debate sobre el creciente uso de la Inteligencia Artificial por parte de los Estado y sus posibles consecuencias.

Desde hace unos años la palabra Inteligencia Artificial empieza a resonar en todos los aspectos de la vida social y es una tecnología que está generando grandes disrupciones tanto en el sector privado como en el público. En el mundo son muchos los ejemplos de aplicación tecnológica y es inevitable que, poco a poco, empiecen a usarse cada vez más en nuestro país.

La Inteligencia Artificial es un término que se utiliza para describir aquellos algoritmos (programas de computadora) que utilizan un registro de datos del pasado para “automáticamente” entender qué pasó y en base a esa experiencia tratar de entender si estas mismas cosas pueden volver a pasar en un futuro (“predecir”). 

La Inteligencia Artificial se utiliza, entre otras cosas, para agilizar y automatizar procesos teniendo como beneficio directo una reducción en tiempo y costos. Es muy importante centrar el debate de cuándo estos procesos que queremos automatizar llevan a tomar decisiones en el Sector Público: ¿En base a qué criterios estos algoritmos toman decisiones y cómo afecta a la ciudadanía?

Hace unos meses hubo una fuerte discusión en las redes sociales luego de los anuncios del Gobernador de Salta, Juan Manuel Urtubey, sobre el uso de un algoritmo que le permitía predecir el embarazo adolescente: “Hoy podés prever, con la tecnología, cinco o seis años antes, con nombre, apellido y domicilio, cuál es la niña que está en un 86 por ciento predestinada a tener un embarazo adolescente”, dijo en el programa El Diario de Mariana.

Pues bien: ¿Quién diseñó esa tecnología? ¿Qué criterios de instrumentación se utilizaron? ¿En base a qué datos? ¿Es auditable? ¿Cualquier ciudadano puede saber cómo y porqué se tomó la decisión de que X persona tiene riesgo de embarazo adolescente? ¿Porqué se consideró que A tenía riesgo y B está excluido? ¿Qué política concreta de transparencia existe para asegurarnos de que las personas que se ven afectadas por una decisión o información que arroja un algoritmo entienda realmente porqué están siendo afectadas? Y entiéndase el concepto de “afectada” como aquella persona que fue asistida por el Estado por detectar que tiene riesgo de embarazo adolescente y también aquella persona que NO fue asistida debido a que el algoritmo ignoró y no alertó situación alguna. ¿Y si realmente esta segunda adolescente necesitaba contención y por error “de la inteligencia artificial” se le negó ayuda? Preguntas claves que hay que desmenuzar a fondo porque los algoritmos generan información para la toma de decisiones concluyen en acciones e intervenciones concretas sobre los ciudadanos.

Las preguntas siguen tomando relevancia a medida que se empiezan a aplicar estas tecnologías a otros aspectos como por ejemplo el otorgamiento o no de un subsidio, el ingreso o no a un programa social, la obtención o no de una beca, el acceso o no a un crédito de la banca pública. Hay que señalar expresamente que existe un riesgo enorme de automatizar los sesgos y discriminaciones ya existentes en la manera en que se toman las decisiones. Los algoritmos son creados por personas utilizando datos del pasado y si fuimos racistas, xenófobos o machistas existe el riesgo de que estos algoritmos se conviertan en máquinas automáticas de replicar estereotipos y discriminaciones.

Los usos y escenarios donde se pueden aplicar este tipo de tecnologías son enormes y realmente los avances en materia de Inteligencia Artificial pueden aportar muchísimo valor a la gestión pública pero dicho avance debe hacerse con cuidado teniendo en cuenta que, en muchos casos, se trata de datos privados de las personas y que las decisiones que se toman en base a dicha información tiene impacto directo sobre los ciudadanos.

Desde Open Data Córdoba nos alineamos a nuestros principios de transparencia y adopción de software libre por parte de los estados y organismos estatales. Consideramos que un gran paso para generar transparencia en la toma de decisiones a través de información que genera la Inteligencia Artificial es que dichos programas sean de Código Abierto y auditables. No nos oponemos al uso de estas tecnologías pero si consideramos que su implementación debe darse en el marco de un debate público que integre a miembros de la Sociedad Civil, Universidades, público en general, y se incorporen al mismo implicaciones éticas y legales de su implementación.

Relevamiento de Precios: Septiembre

Introducción

Desde Open Data Córdoba venimos trabajando en armar una herramienta que nos permita monitorear el histórico de precios a través de un relevamiento del programa Precios Claros

El siguiente post analiza el aumento promedio en los precios de los supermercados e hipermercados de la Provincia de Córdoba para el mes de Septiembre de 2018, el código y los datos pueden obtenerse en github.

Fuente de Datos

  • El relevamiento fue hecho los primeros días de Septiembre y los últimos días de Septiembre.
  • De todos los datos obtenidos se analizó un subgrupo de 80000 precios en 24 Sucursales y para 17000 productos

Algunas Conclusiones

  • El promedio de aumento por Cadena de Supermercado osciló entre el 6% y el 10%

  • Algunas marcas, como por ejemplo Matarazzo tuvieron un aumento promedio de 20% con picos de 31% para productos como por ejemplo los Fideos Tirabuzones con 3 Vegetales de 500gr que a principio de mes se vendia a $38.99 y a fin de mes a $51.59.

Consideraciones Finales

Como mencionamos en post anteriores, estos datos son extraidos programáticamente del Portal de Precios Claros y el código que usamos puede accederse aquí. Desde Open Data Córdoba venimos insistiendo para que el Gobierno los publique en su portal de datos abiertos para que los mismos puedan ser accedidos por investigadores, universidades y el público en general sin necesidad de tener conocimientos específicos en programación.

La base de datos histórica que tiene el gobierno es una mina de oro para entender el comportamiento de precios en Argentina y debería estar abierta.

Hackaton en la Feria del Libro

Tenemos el agrado de estar colaborando con Carolina Ávila (La Nación Data) en la organización del Hackaton en Innovación Ciudadana a realizarse el próximo Viernes 14 de Septiembre de 2018 en el marco de la Feria del Libro de Córdoba.

Para más información pueden visitar la página Web del Evento. Nos vemos el Viernes!

HACKATON EN INNOVACIÓN CIUDADANA.

Coordinan: Carolina Ávila (La Nación Data) junto a Open Data Córdoba.

Ciclo: “Tecnología y Conocimiento”

Fecha: Viernes 14 de Septiembre, 10:00 AM

Lugar: Universidad Católica de Córdoba (Obispo Trejo 323), Aula 35

Link para la inscripción: https://goo.gl/forms/osxkisuPeGDfLWb42

Estudio sobre el aumento de precios en las góndolas entre Abril y Mayo del 2018

Introducción

El portal preciosclaros.gob.ar  es una iniciativa de la Dirección Nacional de Defensa del consumidor lanzada en mayo de 2016. Así se anunciaba:

https://www.youtube.com/watch?v=q2Pkbmj46G0

El sitio provee una amplia información sobre los productos en góndola de todas las cadenas de supermercado del país. Desde la descripción de precios y marcas hasta la ubicación en los diferentes puntos de venta.

Desde Open Data Córdoba relevamos y analizamos la publicación de los precios con el objetivo de visualizar el impacto de la última devaluación en los productos que consumen los argentinos.

Conjunto de Datos

Para este informe se analizó una base de datos que consta de:

  • 43932 cantidad de productos
  • 956 cantidad de sucursales de todo el país.
  • Para un período de 5 semanas
  • Generando una fuente de datos de más de 27594485 precios. (Precios de Productos que varian por Sucursal)

Para más detalle, se adjunta al final algunas consideraciones metodológicas.

Principales Descubrimientos

Aumento por Empresa dueña de Cadenas

Aumento por Fabricantes

Aumento por Cadenas

Aumentos por Categoria

Aumentos por Provincia

Algunas conclusiones e inquietudes

Open Data Córdoba considera al análisis de datos relevantes como una importante herramienta para el empoderamiento de la ciudadanía, la mejora en la creación de Políticas y sobre todo generando un necesario debate público.

Además consideramos rotundamente que la base de datos de Precios Claros deberían ser pública y accesible a toda la ciudadanía. Esta base de datos debería incorporarse al Portal de Datos Abiertos de la Nación porque posee un valor enorme para economistas, estudiantes e investigadores. La información existe y que dicho acceso sea solamente a través de herramientas se scraping es un desperdicio.

Este artículo propone ser un disparador de qué preguntas se le pueden hacer a estos datos. En próximos artículos estaremos profundizando sobre distintos subconjuntos. Además, esta base que generamos es abierta y, hasta que definimos dónde publicarla, pueden consultar por la misma a través de nuestro twitter.

Consideraciones Metodológicas

Fuente de Datos

El programa Precios Claros sigue funcionando a pesar del escaso impulso y publicidad. Desde el sitio se pueden comparar los precios y los productos que conforman la canasta alimentaria. Es una importante herramienta de consulta para que los consumidores puedan visualizar los precios de las sucursales más cercanas antes de cualquier compra. El acceso a mayor información sobre los precios de las diferentes cadenas de supermercados empoderan a los compradores en su organización y economía familiar.

El portal está concebido para consultas en tiempo real de un conjunto de productos, no para hacer un análisis de inflación.

Se desconoce la frecuencia de actualización de la información, pero se considera al precio que se publicita como el vigente. Con una radiografía diaria del sitio se puede hacer un análisis comparado de los precios y calcular el porcentaje de aumento durante los últimos dos meses en diferentes provincias y localidades.

En definitiva poder observar las variaciones de precios por sucursales, cadenas de supermercados, analizar las categorías de productos, marcas y fabricantes.

¿Cómo se obtuvieron los precios?

Se realizó un scraper con un software eficaz que navega de forma automática por un sitio web. El software se programa en base a un conjunto de reglas para extraer información “cruda” del portal Precios Claros. Los datos recolectados luego son almacenados de manera estructurada para permitir su análisis.

La totalidad de precios es Inmensa, tal es así que tiene una demora casi de 24 horas por cada relevamiento produciendo una enorme cantidad de datos. Por este motivo, evitamos ejecutarlo en computadoras propias y lo alojamos en la plataforma scrapinghub.com

La etapa posterior fue la de transformar, limpiar y aumentar los datos para que estén computables. Cabe aclarar que todo el código es abierto y libre. (links)

Limpieza de Datos

Se realizó una tarea de limpieza en los datos para remover algunos valores extremos y nos enfocamos en visualizar aquellos productos cuyo aumento variaba entre -35% y 75%. A posterior dejamos aquellos valores fuera del rango para futuros informes que pueden aportar otro valor al estudio.

 

Letras del Folklore Argentino: ¿A qué le cantan?

El siguiente es un análisis exploratorio para resolver una curiosidad: ¿A qué le canta el folclore Argentino?. El Objetivo es, inicialmente, extraer las palabras más utilizadas. Luego trataremos de ampliar el análisis tratando de agrupar las canciones en distintas categorías, descubrir temáticas en común, agrupar autores por estilo, etc. Pero vamos paso a paso…

Conjunto de Datos

Los datos fueron extraidos de http://www.mifolkloreargentino.com.ar/:

  • Cantidad de Artistas: 132
  • Cantidad de Canciones: 3665

Hay que tener en cuenta que el Universo de canciones a analizar no es completamente exhaustivo y está acotado a lo disponible en la fuente de datos, igualmente consideramos que 3600 canciones de las más populares es una muestra interesante para analizar. Otra consideración importante es que si varios artistas cantan la misma canción, las palabras de dicha canción serán contabilizadas todas las veces.

Pre-Análisis del Conjunto de datos

Las siguientes tablas pueden ayudar a dar un poco de contexto de qué estamos analizando:

Algunos ejemplos de canciones analizadas:

Cantidad de Canciones de cada artista (Top 10)

Canciones más repetidas en el conjunto de datos:

 

 

 

 

 

 

Análisis de las Canciones

Lo que hicimos fue simplemente descargar todas las canciones, armar una pequeña base de datos y recorrerla con un pequeño programita que recorre todas las letras y va contando cada una de las palabras. Para los curiosos, acá dejamos el link al código al final del artículo.

Palabra más utilizada en el Folklore Argentino

Nube de Palabras para las 50 palabras más usadas

Conclusiones

El autor del post quiere reconocer que se emocionó cuando descubrió que la palabra más usada en el Folklore Argentino es amor.

Del lado técnico, es una tristeza que no exista una base de datos unificada y libre con esta información. Sería bueno empezar a generarla y tener de manera prolija datos como letra de la canción, autor, fecha, versiones, estilo musical, etc. La misma sería de muchísimo valor para la academia e investigadores de nuestra cultura musical.

Próximos pasos

El siguiente análisis deja ganas de seguir explorando la información: ¿Qué comida se menciona más? ¿Qué bebida? ¿Qué provincia? ¿Cómo se compara el ranking de palabras con otros géneros musicales como el Rock Nacional, el Tango o el Cuarteto? ¿Quién es el artista más meloso? Si pudieramos acceder a más información podríamos realizar análisis mucho más exhaustivos: ¿Cómo evolucionaron las temáticas a lo largo del tiempo? ¿Quién es el autor más versionado? etc. Dejamos las preguntas, y los datos recopilados, para los curiosos que tengan ganas de explorar aún más esta info.

 

Historico de Ventas Minoristas para Argentina

Siguiendo un poco los debates en las Redes Sociales, uno de los temas más debatidos es la caida en las Ventas Minoristas durante el 2016 y lo que va del 2017. La mayoría de estos datos viene de la Red CAME (Confederación Argentina de Medianas Empresas) que publica excelentes informes y estadísticas todos los meses.

Buscando tener un pantallazo general de los últimos años, no encontramos un dataset o informe que lo hiciera, por lo que nos propusimos relevar a mano la información publicada en la página para generar un Histórico. La Visualización histórica es la siguiente:

Los datos los subimos a un csv para que cualquiera que los necesite y se encuentran en el github de Open Data Córdoba.

Como sugerencia, sería bueno que estas organizaciones y entidades gremiales que trabajan con datos, no solo realicen y publiquen informes sino que además aporten a la comunidad el conjunto de datos producto del relevamiento. De esta forma, la comunidad entera de analistas, periodistas e investigadores podrían tener acceso a ella para reutilizarla en nuevos estudios.

Algunas ideas sobre Gobierno Abierto y Datos Abiertos

Esta semana se armó una linda discusión con los compañeros de Open Data Córdoba sobre nuevas implementaciones de Políticas basadas en Datos Abiertos. Este no es un post académico y acabado, la intención es tener una transcripción un tanto informal sobre los temas que solemos debatir con el objetivo de transparentar un poco a qué nos referimos cuando hablamos de Datos Abiertos, Gobierno Abierto y qué hacemos en Open Data Córdoba cuando no estamos analizando datos.

Todo empezó con una pregunta de uno de los miembros en el canal de chat:

¿Que idea política creen ustedes que la rompería en relación a datos abiertos? No me refiero a datos específicos sino a ideas políticas más generales.

Algunos de las ideas que salieron:

Trámites Digitales

Sería bueno que los trámites que se deban hacer (carnet de conducir, dni, cambio domicilio, partida de nacimiento, etc) puedan hacerse digitales un 90%, una forma de remover las colas que suelen formarse y agilizar el trámite al ciudadano. Si bien este es un tema más ligado al Gobierno Electrónico, si la informatización del trámite genera datos para liberar entonces estaría muy ligado a políticas de Datos Abiertos y Gobierno Abierto.

Visualización y Difusión

Es necesario mostrar y difundir más qué hacemos aquellos que trabajamos en Datos Abiertos y Gobierno Abierto. No solo visualizar la información de manera que el vecino pueda hacer uso de ella, sino también capacitar y difundir nuestra tarea. Invitar a ONGs, Universidades, Medios y Periodistas a encuentros nucleados bajo una simple consigna: “¿Qué datos o información maneja el Estado y te gustaría que sea pública? ¿Qué información que maneja el estado te ayudaría a realizar un mejor trabajo/investigación?”. Políticas Públicas de difusión dentro de los Gobiernos ayudarían a visibilizar más la importancia de los Datos Abiertos y cómo las personas y organizaciones pueden beneficiarse.

Software Público

El Software que se usa en el Estado debería ser público, auditado, y reutilizable. Que se utilicen tecnologías Open Source y Públicas en los Gobiernos ayuda a los ciudadanos a entender mejor cómo funciona y qué información generan los estados. A su vez, permitiría la participación activa de la comunidad tecnológica en la mejora continua de los sistemas utilizados.

Impacto de los Programas de Gobierno

El Gobierno debería publicar informes y análisis (basados en datos) sobre los impactos que generan en la vida de los ciudadanos las políticas que llevan a cabo.

Transparencia en los Criterios de Decisión

Siguiendo la linea del punto anterior, sería bueno que los gobiernos generen Políticas Orientadas por Evidencia con alguna justificación en datos abiertos. Básicamente, si el Estado toma una decisión, que el ciudadano tenga acceso a la decisión más los datos que llevaron a la conclusión de que esa era la mejor decisión a tomar.

Balances de Gestión con Datos

Hoy en día tenemos el Portal del Ciudadano con la ejecución Presupuestaria, y sabemos que para tal ítem cuánto de su presupuesto se ejecutó. Pero es difícil saber por ejemplo, ¿Por qué se sub-ejecutó tal programa? ¿Qué pasó/a dónde fue esa plata?. Sería bueno que los gobiernos presenten balances donde se comunique: Esto se quizo hacer y esto realmente se hizo. Esto que no se hizo fue por estas razones y los recursos se utilizaron para este otro programa. La preguna clave a responde, hablando en criollo, es: “¿Dónde está la plata que se destinó a este programa, si dicho programa sub-ejecutó el presupuesto asignado?

“Reproducible Decision”

En la Ciencia hay algo que se conoce como Reproducible Research, es el conjunto de Investigación + Datos Crudos + Procedimiento Realizado. La filosofía detrás de este concepto sería algo así: “Si partis de acá y usas estos datos, entonces llegas a esta conclusión, verificalo por vos mismo.” Si bien sabemos que los criterios de decisión dentro de la política son más complejos, sería bueno que el gobierno pueda con sus Principios de Gobernanza + Recursos transparentar cómo es que llegó a la conclusión de que una decisión que tomó fue la mejor.

Toma de Decisiones en las Licitaciones

Ya para cerrar los temas que surgieron, se propuso una herramienta/plataforma/conjunto de datos que permita navegar las Licitaciones hechas por el estado y sus respectivas decisiones. Que permitan responder preguntas tales como: “¿En cuántas de las licitaciones, ganaron las propuestas más costosas? ¿Por qué? Qué diferencia había para elegirla? ¿Cuál hubiera sido el ahorro total si se elegía la segunda opción en todas ellas?” Sabemos que son números un poco engañosos pero dispararían muchas preguntas y análisis y controles interesantes por parte de los ciudadanos hacia la toma de decisiones de los gobiernos.

En Open Data Córdoba nos dedicamos también a debatir, planificar y diseñar políticas de Transparencia y Gobierno Abierto. Estas propuestas son luego presentadas en distintos espacios como las Mesas de Diálogo de Gobierno Abierto. Creemos firmemente que este tipo de políticas tiene un impacto directo sobre la calidad democrática, la participación ciudadana y la transparencia gubernamental.

Caja de Jubilaciones de Córdoba

El pasado 24 de Julio, la Caja de Jubilaciones de Córdoba abrió un nuevo Portal de Transparencia donde no sólo comunican un buen resumen sobre la situación actual de la caja sino que además liberaron datos en formatos accesibles que permiten su reutilización y redistribución. Desde Open Data Córdoba accedimos a esos datos para responder algunas preguntas extras a las que aparecen en el portal de Transparencia de la Caja.

Cantidad de Jubilados por Rango de Remuneracion

El dataset nos divide la remuneración por rango. ¿Cuántos jubilados hay en cada rango de remuneración?

Cantidad de Jubilaciones por Rango de Remuneracion

De este gráfico, llama la atención que la curva se desvia de una distribución normal (esperable cuando se habla de ingresos) debido al alto porcentaje de jubilaciones mayores a $32000

Jubilaciones mayores a $32000

Entonces cabe preguntar, ¿Quiénes son los que cobran dichas Jubilaciones? ¿Quiénes en Córdoba tienen las jubilaciones más altas?

Quienes cobran Jubilaciones mayores a $32000?

Según los datos públicos liberados por la Caja de Jubilaciones de Córdoba, el 59.35% de las jubilaciones mayores a $32000 son cobradas por ex empleados Bancarios, Municipales y de EPEC.

Jubilaciones EPEC, Bancarios y Municipales

Haciendo Doble click en cada una de estas categorías, podemos ver qué porcentaje de Jubilados de cada uno de estos sectores entra en cada Rango de Remuneración. ¿Qué porcentaje de Jubilados de EPEC/Municipalidad/Bancarios cobra más de $32000?

Porcentaje Jubilados EPEC por Remuneracion

Porcentaje Jubilados Municipalidad por Remuneracion

Porcentaje Jubilados Bancarios por Remuneracion

Conclusión

  • Del total de 99029 de jubilaciones y pensiones, 12015 cobran más de $32000 (12%).
  • El 59.35% de las jubilaciones mayores a $32000 son cobradas por ex empleados Bancarios, Municipales y de EPEC.
  • El 59% de los Jubilados de EPEC cobra más de $32000
  • El 51.5% de los Jubilados Municipales cobra más de $32000
  • El 42.9% de los Jubilados Bancarios cobra más de $32000

Link al análisis.

Voto electrónico y constitucionalidad

En muchas conversaciones sobre el voto electrónico aparece la referencia de su rechazo en Alemania. La Corte Federal Constitucional de Alemania 1 decidió que el votante debe poder verificar el resultado de su voto confiablemente y sin la necesidad de tener conocimientos específicos o pericia sobre el tema.

No se prohíbe expresamente pero se requiere que se cumplan ciertos pasos de escrutinio público para poder usarse. Las máquinas que utilizaban para la votación no cumplían este requisito.

¿Que ocurre en nuestro país?

La constitución en ningún lado especifica que el voto tenga que ser rápido, o cómodo. Las propiedades fundamentales que están en juego son transparencia y anonimidad del voto.

En Argentina, la consitución establece que el sufragio es universal, igual, secreto y obligatorio 2 . El sistema de voto electrónico pone en duda estas propiedades, al no poder saberse fácilmente si el voto fue computado y cuántas veces (igualdad), al guardarse información periférica sobre el voto y el votante (secreto), al agregar una capa de complejidad e infraestructura sobre el proceso (universalidad), etc. Ante todo, es la transparencia del proceso lo que está cuestionado.

[1] Bundesverfassungsgericht – Decisions – Use of voting computers in 2005 Bundestag election unconstitutional

[2] Honorable Senado de la Nación Argentina – Constitución Nacional \ Capítulo II: Nuevos derechos y garantías

Transporte público y datos públicos

Publicar información sobre un sistema de transporte tiene al menos dos consecuencias. La primera es dar satisfacción a los pasajeros que ya lo usan brindándoles quizás alternativas de viaje. La segunda es hacer accesible a potenciales nuevos pasajeros opciones para abandonar sus vehículos particulares y usar el transporte masivo.

De estas dos consecuencias, la segunda es la que tiene posibilidad de incrementar la cantidad total de pasajeros activos. Esta es la única manera en que puede lograrse que los operadores accedan a aumentar la flota y como consecuencia directa, mejorar la frecuencia para todos los pasajeros.

En síntesis, la información pública sobre el transporte trae nuevos pasajeros y esto mejora las frecuencias.

Hay dos formas de publicar datos sobre transporte público en internet. Una es hacerse cargo de todo y la otra publicar solo los datos en un formato estándar y libre.

Fatto in casa

Elegir hacer todo por cuenta propia implica:

  1. Obtener, organizar y mantener los datos de paradas, recorridos y horarios,
  2. Crear páginas web que exhiban los datos,
  3. Crear páginas web que permitan planear viajes usando el transporte público,
  4. Crear aplicaciones móviles para las mismas cosas para cada plataforma,
  5. Lograr posicionar estos productos para que sean encontrados por los usuarios
  6. Dar soporte a todo lo anterior

En este escenario cada agente de transporte o ente regulador elige su propia manera desarrollar estas actividades o, en el peor de los casos, decide ignorarlas por el esfuerzo y costo que implican.

Ejemplos de este caso en Argentina son el gobierno de la ciudad de buenos aires (http://comollego.ba.gob.ar/) y el ministerio de transporte de la nación (http://trenes.mininterior.gov.ar/apps/web_/), ambos con diferentes grado de éxito.

Como es de esperar de una lista de requerimientos como la anterior, solo estos dos entes de transporte son capaces de costear el esfuerzo y el mantenimiento.

Publicar en un formato estándar y libre

Un formato abierto de publicación de datos de transporte es el GTFS, creado en conjunto entre Google y prestadoras de servicios en Estados Unidos. Este formato describe un pequeño número de tablas que permiten almacenar información sobre

  • Paradas (nombre, ubicación, …)
  • Recorridos
  • Horarios
  • Tarifas
  • Otros

Un operador de transporte o un ente regulador que desee publicar sus datos puede llenar estas tablas y construir con ellas un archivo que puede ser consumido por prestadores de información de ruteo. De la lista de requerimientos mencionados en el anterior enfoque solo resta

  1. Obtener, organizar y mantener los datos

Este escenario resulta más propicio para que prestadores de servicios o entes reguladores de menor envergadura consigan publicar sus datos.

Además da lugar a la competencia y participación en la exposición de los datos de proveedores privados quienes desarrollan y mantienen servicios en internet y dispositivos móviles.

En Argentina, al momento, solo la ciudad de Córdoba utiliza el formato GTFS para lograr que los datos de transporte público estén disponibles en Google Maps (https://www.google.com.ar/maps).

Editor de GTFS

Participé en la implementación del GTFS en Córdoba con el apoyo de la CAF (Corporación andina de fomento) y comencé el desarrollo de una aplicación web que permitiera cargar, mantener y compilar los datos de la ciudad.

El proyecto ha recibido el apoyo del ministerio de transporte de la provincia de Mendoza y puede encontrarse en https://github.com/avilaton/gtfseditor en estado beta. El código es abierto bajo una licencia AGPL. Consiste en una aplicacion servidor escrita en Python y Postgresql y un cliente web que utiliza Backbone y Handlebars. Permite cargar paradas, recorridos y horarios y construir con ellos el feed que Google Maps luego publica.

Paquetes de datos

Los datos que conforman el GTFS de la ciudad de Córdoba son derivados de los datos base que se encuentran en https://github.com/avilaton/gtfscba-data. Una simplificación en el caso de la ciudad de Córdoba se da porque en ésta operan viajes regulares que mantienen sus paradas y recorridos, solo cambiando sus horarios dependiendo del día de la semana.
En el caso de la provincia de Mendoza, el seed inicial de los datos base está en https://github.com/avilaton/tptmdz-data y los demas estan siendo adecuados para ser publicados. La provincia de Mendoza tiene una diversidad mucho mayor de proveedores de transporte y modos de operación. Estos utilizan horarios de salida para cada viaje y están en proceso de carga.

Cuando Viene?

La opinión de quien escribe es que no importa tanto. Es difícil motivar a las empresas a emprender la implementación de sistemas de información en tiempo real por su costo. Desde su posición, esto solo satisface a los pasajeros cautivos y no trae nuevas ganancias. Ademas brindar esa información es un problema tecnológico mucho más complejo. Si, es interesante como reto técnico, pero enfrentarlo a costas del dinero del estado solo por la satisfacción de lograrlo es un lujo que solo los académicos pueden suelen darse.

Lo imperativo es proveer información clara para captar a nuevos pasajeros y así, conseguir mejorar la regularidad y disminuir el uso de los vehículos privados.