Compartiendo datos para bien social: la próxima generación

David Pastor-Escuredo
5 min readApr 17, 2020

--

Los retos y las urgencias no deberían hacer perder de vista el eje vertebrador: el valor de los datos debe ser consolidado de forma colectiva.

En los últimos años hemos presenciado el encumbramiento del Big Data y la Inteligencia Artificial para transformar el sistema productivo. Desde grandes plataformas multinacionales a empresas medianas y pequeñas, la digitalización y la IA han pasado a ser el eje vertebrador más deseado. También podemos encontrar ya un importante portfolio de aplicaciones sociales de los datos y la IA gracias a la trayectoria de colaboración entre actores del sector público, el sector privado, la academia y las organizaciones multilaterales (Data Collaboratives). La actual crisis del COVID-19 ha supuesto una aceleración sin precedentes en la digitalización y el uso de datos. Sin embargo, el escenario puede no ser el más deseable para un desarrollo “human-centered” de los sistemas basados en datos e IA.

A nivel público, varios países incluido España han creado su agenda de I+D+i en Inteligencia Artificial marcando un camino estratégico a nivel nacional. En la misma línea, el nuevo gobierno ha creado una Secretaría de Estado para la digitalización y la IA. Desde Europa ya han incluído en su estrategia que la IA es un sector clave y que es necesario competir con EEUU y Asia. Entre las líneas de acción de Europa también se encuentra crear un marco de uso de datos privados para gobernanza. Las decisiones que se están tomando van a afectar al desarrollo económico, a nuestra privacidad pero más aún van a afectar a nuestras libertades, valores y modelo de sociedad.

Los datos alimentan los algoritmos de IA para generar conocimiento valioso. Los datos privados son generalmente gestionados y custodiados por empresas privadas. En una crisis como la actual los datos adquieren alto valor público, pero también en épocas estables los datos son posibilitadores de mejora y cambio y no usarlos para tal fin es una oportunidad perdida. Entonces ¿cómo aprovechamos todo ese potencial? tiene que haber incentivos y equipos que trabajen con los datos de manera colaborativa, es necesaria la compartición de datos. Este es un reto detrás del cual hay una compleja realidad de intereses de negocio, dificultades organizativas, falta de regulación específica y también gran desconocimiento por parte de la sociedad. La crisis actual desencadena procesos marcados por la urgencia y la necesidad, pero que no son los más apropiados para avanzar hacia una sociedad “evidence-based” y quizás estos procesos son difícilmente reversibles.

Debido al potencial gran impacto de los datos y la IA existen ciertos riesgos que deben ser mitigados desde el diseño. Nuria Oliver, experta y pionera en el uso de Big Data, identificaba los siguientes requisitos: los proyectos deben ser acordes a la legislación, deben ser aceptables socialmente, deben ser viables comercial y financieramente, deben ser técnicamente realizable y finalmente deben ser sostenibles en el tiempo. La reflexión ética debe acelerarse para dar respuesta a las encrucijadas que trascienden lo tecnológico, además de ser una guía para el desarrollo de la propia IA para que gire sobre una visión de lo humano y no viceversa [1–4]. Los Objetivos de Desarrollo Sostenible en este contexto son una guía útil y concreta para dirigir el desarrollo digital [5], pero los retos son grandes y variados y es necesaria una reflexión y sistemas de monitorización del impacto de la IA [6].

Estos retos y las urgencias no deberían hacer perder de vista el eje vertebrador: el valor de los datos debe ser consolidado de forma colectiva. Para ello la custodia de datos privados debe tener ventanas de acceso por parte de consorcios multi-actor y preferiblemente multi-disciplinares para fines públicos y sociales. Estas ventanas deben ser acotadas y bien definidas a priori, en términos de tiempo, uso y alcance, asegurando siempre la privacidad y la seguridad. Esto es, si cabe, más importante en la medida que los problemas de la sociedad actuales son complejos y demandan integrar datos de diferentes sectores. La bilateralidad no es el camino más apropiado ni riguroso a nivel científico para usar los datos en nuestra sociedad. En consecuencia, es necesario invertir en infraestructuras con un objetivo: la conectividad y facilitar los flujos de datos. En crisis como la actual esto queda más en evidencia para la necesidad de disponer de diversas fuentes en tiempo real para la toma de decisiones.

Existen modelos de intercambio de datos, pero no son lo suficientemente potentes y se basan en la privacidad como valor principal. Sin un acople entre el uso y los flujos de datos, incluyendo su agregación, no será posible alcanzar todo su potencial transformador y generador de conocimiento. Un mapa justificado y detallado de utilidad-riesgo-impacto de diversas aplicaciones es la vía para catalizar el potencial social de los datos. Este mapa tendrá variabilidad cultural debido a la diversa percepción de las sociedades, lo cual es de gran valor para entender el desarrollo global de estas tecnologías.

Esta visión implica que los datos pueden migrar fuera de las empresas donde son custodiados, siempre considerando que hay infraestructuras adecuadas. Hasta ahora la tendencia ha sido que los datos permanezcan dentro de las empresas y sean los algoritmos los que viajen (OPAL) o que los datos se exporten empaquetados de forma agregada. Sin embargo, no hay que descartar que los datos puedan migrar si con ello se puede realizar una investigación o implementar una operativa de alto impacto. Hace falta un marco conceptual y modelos de datos que posibiliten la conectividad e integración.

Además, conlleva crear capacidades internas en los diferentes sectores. Existen algunas iniciativas en esta dirección, por ejemplo, la red Data Stewards: expertos que ayuda a catalizar “data collaboratives”. Para una siguiente generación de proyectos, es prioritario pasar de la excepcionalidad de los proyectos actuales a una institucionalización de esta actividad. Algunos recursos útiles son el report del grupo Bussiness-to-Government data sharing de la Comisión Europea o el marco internacional de contratos promovido por UN SDSN Thematic Research Network on Data and Statistics (TReNDS).

Entre la interacción público-privada, debe haber otros agentes: academia y ciudadanía. La academia debe ser parte fundamental de un futuro ecosistema, no sólo en la creación de algoritmos y aportando rigor científico en colaboración con otros actores, sino proponiendo modelos de conocimiento y ayudando a crear un tejido colaborativo para incrementar el impacto social de los proyectos.

La sociedad civil es el punto de partida y de llegada: genera los datos y es el objeto de estudio. Es necesario que la personas participen a lo largo de la cadena de valor de los datos y la IA y que haya nuevas herramientas y mecanismos para una gestión de los datos más humana, eficaz y transparente. Esto es clave para asegurar modelos justos de explotación de los datos privados.

REFERENCIAS

[1] https://www.unglobalpulse.org/policy/

[2] https://www.odiseia.org/

[3] http://www.itd.upm.es/2020/04/13/un-dialogo-improbable-sobre-etica-y-revolucion-digital/

[4] https://arxiv.org/abs/2003.06530

[5] https://www.nature.com/articles/s41467-019-14108-y

[6] https://www.nature.com/articles/s41586-019-1138-y

--

--

David Pastor-Escuredo
David Pastor-Escuredo

Written by David Pastor-Escuredo

Data & AI Scientist. Development & Resilience. Digital Governance & Policy. Life & Biomedical science. Philosopher. Musician. @UCL @LifeDLab @EITHealth @UNICEF

No responses yet