Introducción a la ética y privacidad en la apertura de datos

Site: Universidad de la República
Course: Datos Abiertos como Recursos Educativos Abiertos - 2021
Book: Introducción a la ética y privacidad en la apertura de datos
Printed by: Guest user
Date: Wednesday, 4 December 2024, 12:27 PM

1. Introducción

Por Juan Ignacio Belbis. ILDA

Podríamos sintetizar este capítulo con la siguiente frase: no todos los datos públicos son publicables. En este apartado, se explorarán diversos conceptos asociados a derechos que en algunos casos entran en tensión con el acceso a la información pública, y protegen la divulgación de ciertos activos de información, así como una aproximación a los debates éticos respecto a los usos que se les pueden dar.

Las fronteras de la apertura de datos están determinadas por un conjunto de normativas cuyo fin es el de preservar la publicación de ciertos activos de información, aunque estos estén gestionados y almacenados en sistemas de información públicos. Sin embargo, la aparición de nuevas tecnologías y técnicas de tratamiento de estos datos generan nuevas asimetrías entre quienes poseen las herramientas y los sujetos cuyos datos son sujeto de estas aplicaciones. La inteligencia artificial y otras prácticas de explotación de grandes volúmenes de datos, que surgen como producto de la digitalización de la gran mayoría de servicios de información, crean la necesidad de discutir los límites éticos.

Casos como el de la filtración de datos de usuarios de la plataforma Facebook, que luego fueron utilizados por la firma Cambridge Analytica para generar perfiles psicográficos de votantes en diferentes elecciones en el mundo, demuestran que el uso de datos personales puede ser explotado con fines muy distintos a aquellos que los propios usuarios admiten a través de los términos y condiciones de las plataformas. Diversas normativas en el mundo intentan avanzar en la regulación de estos temas. Uno de los mejores ejemplos es el Reglamento General de Protección de Datos (GDPR por su sigla en inglés - General Protection Data Regulation), aprobado en 2016 por el Parlamento Europeo, que reemplaza las leyes de los países sobre la protección de datos personales. Como consecuencia de la aparición del GDPR surgen diversos desafíos para las empresas y actores públicos que gestionan datos, relacionados con sus técnicas de procesamiento y las prácticas de almacenamiento y mantenimiento de las bases de datos. Además fuerza la actualización de los términos y servicios de una gran cantidad de plataformas digitales y productos intensivos en el uso de datos a nivel global.

2. Ética de datos

La ética de datos se refiere a su uso y reutilización responsable y sustentable, por parte de actores públicos o privados. Responde a un conjunto de principios que contemplan el respeto de los derechos humanos y de la privacidad de los individuos, a través de procesos transparentes respecto de la gestión y manipulación de los datos personales, ya sea de forma individual o agregada.

El Reino Unido avanzó en la definición de siete principios a implementar en el marco de la administración pública a través de su “Marco de Trabajo de Ética de Datos”:

1.     Se deben tener claras las necesidades del usuario y el beneficio público. Trabajar con datos de forma innovadora presenta un gran potencial para la prestación de servicios públicos, pero se deben plantear los objetivos de cada acción de forma clara, y sus implicancias para los ciudadanos y los servidores públicos.

2.     Ser consciente de la normativa relevante y los códigos de conducta. Se deben comprender de forma exhaustiva los marcos regulatorios, normativas vigentes y códigos que definen las buenas prácticas y marcan los límites de lo permitido. En caso de duda, consultar con expertos.

3.     Los datos a utilizar deben ser proporcionales a las necesidades del usuario. El uso de los datos debe ser proporcional a la solución necesitada por el ciudadano y se debe utilizar la menor cantidad de datos posibles con el fin de minimizar tensiones.

4.     Comprender los límites de los datos. Los datos utilizados para el diseño de políticas y servicios públicos por parte del gobierno deben ser interpretados en profundidad y de forma correcta. Es esencial considerar los sesgos y límites interpretativos de los datos al momento de evaluar su incorporación como parte de un diseño.

5.     Utilizar prácticas robustas y que estén al alcance del funcionario público. Los resultados que surjan de la incorporación de nuevas herramientas tecnológicas están determinados por la calidad de los datos y las prácticas utilizadas para tratarlos. El utilizar técnicas modernas sin comprender cabalmente su uso puede resultar en resultados sesgados y contraproducentes.

6.     El trabajo debe ser transparente y capaz de rendir cuentas. Se debe ser transparente sobre las herramientas, datos y algoritmos utilizados para realizar este tipo de tareas, utilizando técnicas transparentes que le permitan al ciudadano auditar estos procesos.

7.     Se debe ser responsable en la inclusión de datos. Es esencial que exista un plan definido respecto de la incorporación de fuentes de datos y la exposición de los mismos de forma responsable. Esto implica que tanto los usuarios finales como los que trabajen en los productos intermedios, sepan los límites y responsabilidades asociados a estar expuestos a estos datos y su reproducción.

3. Los límites de la apertura de datos

Se pueden describir grandes conjuntos de datos que conforman las fronteras entre lo público y lo publicable, algunos de ellos por cuestiones individuales y otros por asuntos colectivos. Se distingue en este sentido que se hace referencia a público al estar estos datos gestionados por funcionarios y servidores públicos, pero no es potestad del gobierno publicar estos tipos de datos, dado que por más que su gestión, almacenamiento y procesamiento sea público, los activos de información están resguardados. Por nombrar algunos ejemplos:

-       Datos personales

-       Secreto fiscal

-       Secreto estadístico

-       Secreto comercial/corporativo

-       Datos referidos a estrategias de defensa nacional

-       Datos de estrategias de litigios públicos

-       Datos de inteligencia

En el siguiente apartado se harán algunas aclaraciones sobre los datos personales y la privacidad, sin embargo, el resto de los conjuntos de activos de información mencionados son igualmente importantes, si estos están delimitados como datos privados en los cuerpos normativos vigentes de cada país. Los principios de apertura y los equipos dedicados a la gestión de sus políticas, deben necesariamente considerar estas cuestiones al diseñar sus iniciativas. La apertura de datos públicos, no debe chocar con la normativa vigente y por ello la presencia de asesores legales es clave para garantizar la sostenibilidad de estas políticas, sin que sean consideradas un riesgo por otras áreas gubernamentales.

 

4. Derecho a la privacidad y protección de datos personales

La privacidad es un derecho fundamental consagrado en diversos tratados de derechos humanos a nivel internacional. Es crucial para la protección de la dignidad humana y constituye una de las bases fundamentales de las sociedades democráticas. Es un pilar que habilita el ejercicio de los derechos de libertad de expresión, información y asociación. En este mismo sentido la Protección de Datos Personales (PDP) es una de las formas de garantizar en términos prácticos el derecho a la privacidad en el contexto de sociedad de la información, donde el almacenamiento de datos personales está en manos de actores públicos y privados.

Existe un conjunto de datos denominados “sensibles” que deben ser protegidos en todo caso, salvo que hayan sido expresamente cedidos por su titular.Son datos sensibles aquellos que de divulgarse de manera indebida, afectarían la esfera íntima del individuo o podrían ser motivo de discurso de odio o discriminación por origen racial o étnico, estado de salud, información genética, creencias religiosas, filosóficas o morales, afiliación sindical o partidaria, opiniones políticas y preferencias sexuales. Ejemplos de estos s conjuntos de estos datos, son el padrón de afiliados partidarios, las historias clínicas de los hospitales públicos y los registros de empleados públicos (excepto en el caso de Uruguay en que los registros de empleados públicos son datos públicos según la Ley de Acceso a la Información Pública N° 18.381).

En caso de que sea necesario divulgar esta información, existen técnicas de “anonimización” que permiten la agregación de estos datos y la eliminación de ciertos indicadores que permitan su trazabilidad. Por ejemplo, se podrían publicar análisis estadísticos sobre estos datos, garantizando que no exista forma de rastrear a los individuos que componen los segmentos divulgados.

5. Las fronteras de la discusión

Un eje que cada vez se vuelve más central en la discusión sobre el uso ético de los datos, es la aparición de tecnologías que a través de algoritmos y técnicas de machine learning toman decisiones sobre personas. Machine learning, o aprendizaje automático, es la denominación utilizada para identificar diversos conjuntos de técnicas a través de las cuáles se le “enseña” a computadoras a optimizar procesos de toma de decisiones, en muchos casos basados en decisiones previas tomadas por humanos, en algún problema en particular. Este tipo de prácticas han sido utilizada en las últimas décadas por el sector privado en diversas áreas, como la industria financiera y bancaria. Las “redes sociales” como Facebook o Twitter implementan estas técnicas diariamente para optimizar el alcance de sus contenidos y Google las utiliza para mejorar los resultados de las búsquedas.

El foco que une esta conversación con las políticas de gestión de datos, es visible en el momento en que los gobiernos comienzan a incorporar estas técnicas avanzadas de implementación de algoritmos para la toma de decisiones en procesos de política pública. Existen diversos casos en el mundo y la región en los que se han tomado decisiones a través de herramientas tecnológicas, que han reproducido sesgos pre-existentes, así como casos en donde la tecnología utilizada no era comprendida cabalmente por los servidores públicos y luego no podían explicar los resultados obtenidos.

LDA ha publicado recientemente un análisis sobre el uso de estas tecnologías en América Latina denominado “Automatizar con cautela: Datos e Inteligencia Artificial en América Latina”. Este documento se centra en dos casos principalmente, uno de Uruguay y otro de Argentina, y fue el eje de un taller realizado en Montevideo en el que participaron diversos actores de gobiernos, sociedad civil y academia de la región para debatir sobre los riesgos y alcances de la temática.

Por ello, es necesario ampliar la conversación de la transparencia y la rendición de cuentas de datos e información pública, hacia la transparencia y rendición de cuentas de los algoritmos utilizados en procesos públicos de toma de decisión que afecten de forma directa o indirecta a la ciudadanía. Es una discusión compleja y todavía no está del todo claro cómo se puede saldar en el corto plazo, pero es central que se contemplen estos debates en el futuro..

 

6. Ejemplo práctico

Nota: Los límites de la apertura de datos

 

Se puede abrir toda la Información pública que se genera o está en posesión de cualquier organismo público, sea o no estatal, salvo las excepciones establecidas por la Ley N° 18.381 de Acceso a la Información Pública. A modo de ejemplo, algunas de las excepciones son los datos personales, datos que pueden afectar la seguridad nacional, datos que estén sujetos a otra normativa como la del Secreto Bancario, entre otros.  (ver Guía para publicación de datos abiertos de gobierno. Agesic. https://www.agesic.gub.uy/innovaportal/v/2478/2/agesic/guia-para-publicacion-de-datos-abiertos-de-gobierno.html