¿Qué son los datos abiertos?
Site: | Universidad de la República |
Course: | Datos Abiertos como Recursos Educativos Abiertos - 2021 |
Book: | ¿Qué son los datos abiertos? |
Printed by: | Guest user |
Date: | Wednesday, 4 December 2024, 1:37 PM |
1. Entendiendo los datos
Necesitamos mirar a toda la sociedad y pensar: "¿Estamos realmente pensando en lo que estamos haciendo a medida que avanzamos y estamos preservando los valores realmente importantes que tenemos en la sociedad?
Tim Berners Lee
Por Javiera Atenas
Colaboradores:
- Dra. Carla Bonina, Universidad de Surrey, Inglaterra
- Dr. Juan Pane, Universidad de Asunción, Paraguay
- Juan Belbis, Universidad Austral, Argentina
2. Introducción
Los datos son características o información, generalmente numérica, que se recopilan mediante la observación. En un sentido más técnico, son un conjunto de valores de variables cualitativas o cuantitativas sobre una o más personas u objetos, mientras que un dato es un valor único de una sola variable. Los datos se transforman en información cuando se crean, extraen, elaboran y utilizan con objetivos preestablecidos. El sistema de información, a menudo compuesto por datos del mismo o diferente tipo (el conjunto de datos se define como un “conjunto de datos”), se transforma en conocimiento cuando se interpreta gracias a herramientas, aplicaciones, métodos, indicadores, etc.
Los datos pueden ser pequeños o grandes, privados, personales, gubernamentales, militares, científicos, públicos, confidenciales, comerciales, financieros o abiertos, y normalmente pertenecen a información entregada en formatos de archivo legibles por máquina en un formato sin procesar conocido como datos crudos. Los formatos más comunes son integer, número coma flotante, carácter, “string” (cadena de caracteres) y “boolean” (datos lógicos). Con la constante evolución de la tecnología, los contenidos informativos y los datos en poder de las administraciones públicas representan excelentes oportunidades para promover la transparencia en la actuación de gobiernos y administraciones. Además, pueden ofrecer servicios más eficientes y, dado que facilitan la reutilización por otros sujetos públicos y privados, también pueden ser utilizados en áreas distintas de aquellas para las que han sido producidos o recolectados. El conocimiento, en la práctica, adquiere el valor de conciencia - en el caso de los datos abiertos se puede definir como "colectivo", entendido como el "bien común" - cuando se utiliza para el cambio y la mejora de la realidad (los hechos).
Si bien los datos son características de la información que se recolectan a través de la observación, la información se entiende como una representación simbólica que describe hechos, condiciones, valores o situaciones, recolectados y ordenados de manera adecuada para cumplir con el objetivo de la institución que los administra. Por sí solos, estos valores carecen de valor semántico, es decir, no tienen significado para alguien, por lo que no aportan valor al destinatario del mensaje. Para que estos datos tengan sentido, deben procesarse, asociarse o agruparse dentro del mismo contexto para formar información. Por lo tanto, podemos concluir que la información es un conjunto organizado de datos procesados y relacionados de una manera que nos permite comunicarnos o adquirir conocimientos.
3. Definiendo los datos abiertos
"Los datos abiertos son datos que pueden ser utilizados, reutilizados y redistribuidos libremente por cualquier persona, y que se encuentran sujetos, cuando más, al requerimiento de atribución y de compartirse de la misma manera en que aparecen" (open data handbook).
Según la Carta Internacional de Datos Abiertos, “Los Datos Abiertos son datos digitales que se ponen a disposición con las características técnicas y legales necesarias para que puedan ser utilizados, reutilizados y redistribuidos libremente por cualquier persona, en cualquier momento y en cualquier lugar”. La Carta ha surgido a partir de diálogos entre gobiernos y sociedad civil, que han dado como resultado la promoción de la adopción de los seis principios que se describen a continuación. Además, Open Data (o datos abiertos) ha sido definido por Open Knowledge Foundation como aquello que puede ser utilizado, reutilizado y redistribuido libremente por cualquier persona. - sujeto únicamente, como máximo, al requisito de atribuir y compartir. Los principios técnicos básicos de Open Data pueden entenderse de la siguiente manera:
La definición de apertura completa da detalles precisos de lo que significa. Para resumir lo más importante:
- Disponibilidad y acceso: la información debe estar disponible como un todo y a un costo razonable de reproducción, preferiblemente descargándola de internet. Además, la información debe estar disponible en una forma conveniente y modificable.
- Reutilización y redistribución: los datos deben ser provistos bajo términos que permitan reutilizarlos y redistribuirlos, e incluso integrarlos con otros conjuntos de datos.
- Participación universal: todos deben poder utilizar, reutilizar y redistribuir la información. No debe haber discriminación alguna en términos de esfuerzo, personas o grupos. Restricciones “no comerciales” que prevendrían el uso comercial de los datos; o restricciones de uso para ciertos propósitos (por ejemplo sólo para educación) no son permitidos
Para saber más: Leer el manual de datos abiertos
4. Principios de datos abiertos
Según la Carta Internacional de Datos Abiertos, los seis principios de datos abiertos desarrollados por la Carta de Datos Abiertos son un conjunto de normas aspiracionales acordadas globalmente sobre cómo publicar datos, que se pueden resumir de la siguiente manera.
1. Abiertos por defecto: Representa un cambio real en cómo opera el gobierno y cómo interactúa con los ciudadanos. Por el momento, a menudo tenemos que pedir a los funcionarios la información específica que queremos. Datos abiertos por defecto invierte esta ecuación y estipula que debería haber una presunción de publicación para todos: los gobiernos deben justificar los datos que se mantienen cerrados, por ejemplo, por motivos de seguridad o protección de datos. Para que esto funcione, los ciudadanos también deben confiar en que los datos abiertos no comprometerán su derecho a la privacidad.
2. Oportunos y exhaustivos : Los datos abiertos solo son valiosos si siguen siendo relevantes. Hacer que la información se publique de forma rápida y completa es fundamental para su potencial de éxito. En la medida de lo posible, los gobiernos deberían proporcionar datos en su forma original y sin modificaciones.
3. Accesibles y utilizables: Asegurarse de que los datos sean legibles por máquinas y fáciles de encontrar hará que los datos lleguen más lejos. Los portales son una forma de lograrlo, pero también es importante pensar en la experiencia de usuario de quienes acceden a los datos, incluidos los formatos de archivo en los que se proporciona la información. Los datos deben ser gratuitos bajo una licencia abierta, como por ejemplo las desarrolladas por Creative Commons.
4. Comparables e Interoperables: Los datos tienen un efecto multiplicador: cuanto más acceso se tenga a conjuntos de datos de calidad, y más fácil sea hablar entre ellos, más valor se podrá obtener. Los estándares de datos comúnmente acordados juegan un papel crucial para que esto suceda.
5. Para mejorar la Gobernanza y la participación ciudadana: Los datos abiertos tienen la capacidad de permitir que los ciudadanos (y otros en el gobierno) tengan una mejor idea de lo que están haciendo los funcionarios y los políticos. Esta transparencia puede mejorar los servicios públicos y ayudar a que los gobiernos rindan cuentas.
6. Para el Desarrollo Inclusivo y la Innovación: Por último, los datos abiertos pueden ayudar a impulsar el desarrollo económico inclusivo. Por ejemplo, un mayor acceso a los datos puede hacer que la agricultura sea más eficiente o puede usarse para abordar el cambio climático. A menudo pensamos en los datos abiertos como una forma de mejorar el desempeño del gobierno, pero existe todo un universo de emprendedores que ganan dinero con los datos abiertos.
5. Beneficios de los Datos Abiertos
El gobierno de Canadá resume los Beneficios de los Datos Abiertos de la siguiente manera:
Apoyo a la innovación: el acceso a los recursos del conocimiento en forma de datos apoya la innovación en el sector privado al reducir la duplicación y promover la reutilización de los recursos existentes.
- Fomento de la rendición de cuentas del gobierno y la reforma democrática: el mayor acceso a los datos y la información del gobierno brinda al público una mayor comprensión de las actividades gubernamentales, la prestación de servicios y el uso del dinero de los impuestos.
- Aprovechar la información del sector público para desarrollar productos comerciales y de consumo: el acceso abierto y sin restricciones a los datos científicos con fines de interés público, en particular la información estadística, científica, geográfica y ambiental, maximiza su uso y valor, mientras que la reutilización de los datos existentes en aplicaciones comerciales mejora tiempo de comercialización para empresas.
- Mejor uso de la inversión existente en infraestructura de información comunitaria y de banda ancha: Canadá ha invertido en redes de información y comunicaciones en forma de infraestructura técnica y servicios comunitarios, como bibliotecas y agencias de servicios sociales.
- Apoyo a la investigación: el acceso a los datos de investigación federales respalda la investigación primaria basada en evidencia en las comunidades de investigación académica, del sector público y de la industria canadiense e internacional. El acceso a colecciones de datos, informes, publicaciones y artefactos que se encuentran en instituciones federales permite el uso de estas colecciones por parte de los investigadores.
- Brindar acceso a la información de servicios del sector público: para posibilitar la toma de decisiones informadas, por ejemplo, estadísticas de viajes aéreos en tiempo real, puede ayudar a los viajeros a elegir una aerolínea y comprender los factores que pueden provocar retrasos en los vuelos.
- Divulgación proactiva: proporcionar de manera proactiva datos que sean relevantes para la ciudadanía reduce la cantidad de acceso a solicitudes de información, campañas de correo electrónico y consultas de los medios. Esto reduce en gran medida el costo administrativo y la carga asociados con la respuesta a tales consultas.
6. Abriendo datos
Un Dataset (conjunto de datos) es una colección de registros de datos organizados donde cada elemento tiene la misma estructura, ordenados para ser procesados por una computadora. Un conjunto de datos puede ser la lista de escuelas de un país, la lista de todos los contratos estatales para todas sus instituciones o el presupuesto general de la nación, por ejemplo ver: Earthdata
El mismo conjunto de datos puede tener múltiples distribuciones (o recursos) que pueden variar en dos dimensiones de la siguiente manera.
Temporal: en este caso, el mismo conjunto de datos tiene registros asociados con un tiempo. Por ejemplo, el presupuesto general de la nación tiene una versión diferente cada año, al igual que la lista de contratos de un gobierno.
Formato: cada conjunto de datos se puede representar en varios formatos. Por ejemplo, si consideramos que la lista de contratos gubernamentales se puede representar en una tabla, se puede digitalizar para abrirla con Acrobat Reader (en formato .pdf), o Microsoft Excel (.xls), mediante cualquier procesador de texto (. csv) o procesados por sistemas automatizados (.json), entre otros.
Se puede utilizar una amplia variedad de formatos para disponibilizar los datos al público; sin embargo, no todos cumplen los requisitos necesarios para definir dichos datos como "abiertos". El formato en el que se publica la información, es decir, la base digital con la que se almacena la información, puede, de hecho, ser abierta o cerrada. Un formato abierto es aquel en el que las especificidades del software están disponibles para cualquiera, de forma gratuita, para que cualquiera pueda utilizarlas en el propio software sin ninguna limitación de reutilización impuesta por los derechos de propiedad intelectual. Cuando, en cambio, el formato es cerrado, puede significar que el formato es propietario o cerrado y que las características técnicas no están disponibles públicamente o que el formato de archivo es propietario y, aunque las especificaciones técnicas son públicas, su uso es limitado.
La razón fundamental por la que es importante aclarar el significado de "abierto" y por qué utilizar exactamente esta definición se puede resumir en un término: interoperabilidad. Ésta es la capacidad de diferentes sistemas y organizaciones para trabajar juntos. En nuestro caso, es la capacidad de combinar una base de datos con otras. La interoperabilidad es la clave que permite la primera ventaja práctica de la apertura: aumenta exponencialmente la posibilidad de combinar diferentes bases de datos y así, desarrollar nuevos y mejores productos y servicios.
Además, la ventaja de los archivos en formatos abiertos es que esto permite a los desarrolladores producir software y servicios utilizando estos formatos. Esto minimiza los obstáculos para reutilizar la información que contienen. El uso de formatos propietarios puede generar dependencia de software de terceros o de los licenciatarios de los formatos. En el peor de los casos, esto puede significar que la información se puede leer utilizando solo un formato de software específico, lo que podría ser prohibitivamente caro o quedar desactualizado con el tiempo.