Excel como base de datos de la COVID-19 ¿es la mejor herramienta?

By bloghelas
In noviembre 3, 2020
Comments off
768 Views

El primer fin de semana de octubre saltaron las alarmas en Reino Unido: 16.000 positivos infectados por la COVID-19 pero ¿cómo es posible? Según las informaciones que se barajan se debió a un fallo en una hoja de cálculo de Excel del que nadie se percató. La hoja que contenía los resultados de laboratorio alcanzó su tamaño máximo (número máximo de columnas) lo que provocó que el resto de los datos incluidos no se actualizase.

Los expertos en estadísticas, analistas de datos y “Big Data” de todo el mundo, incluido España, ya pusieron el foco sobre esta situación: las administraciones públicas utilizan la herramienta de Excel para una finalidad para la que no está diseñada lo que supone un gran riesgo. Los problemas evidentes que se derivan del uso de estas herramientas son: (i) la falta de conocimiento del “software”; y (ii) la falta de actualización de las tecnologías utilizadas por el sector público que continúa utilizando meros programas estándar.

El anterior paradigma obliga a reseñar la necesidad de la gestión ética de los datos, es decir, conseguir crear un equilibrio justo entre el uso masivo y responsable de datos por el sector público para mejorar los servicios sociales, pero manteniendo la confianza de los ciudadanos en que los datos se utilizan de manera responsable. Algunos de los principales riesgos que se plantean en el uso de tecnologías de “Big Data” en este contexto son relacionados con:

  • Protección de Datos de Carácter Personal y Privacidad, relacionado con la necesidad de que se cumpla con todos los principios instaurados por el Reglamento (UE) 2016/679 del Parlamento Europeo y del Consejo de 27 de abril de 2016 (en adelante, RGPD), realizar un tratamiento lícito de los datos e inversión en medidas de seguridad adecuadas por los Gobiernos. Algunos de los problemas, en este sentido, viene referido a la anonimización de los datos con usos y fines estadísticos. Es importante que la anonimización sea robusta, pues, aunque una base de datos sea anonimizada, su cruce con otras puede permitir la reidentificación de algunos individuos.
  • La posible discriminación algorítmica o el denominadosesgo del algoritmo”, referida a los procesos a través de los cuales los distintos tipos de discriminación que ocurren en la vida real pueden reproducirse en entornos de datos o, lo que es lo mismo, la toma de una decisión algorítmica equivocada. Como ejemplo, un algoritmo en el que se analicen datos de sentencias judiciales y reincidencia en Estados Unidos aprenderá que en el pasado la población afroamericana sufrió mayores tasas de encarcelación y delincuencia a las de la población caucásica.
  • Falta de transparencia, falta de información en relación con qué clase de información recogen los sistemas, cómo la gestionan, cómo la analizan, con quién la comparten, qué decisiones se toman a partir de ella y con base en qué factores.

Afortunadamente, los expertos, más allá del Excel, dan alternativas y recomiendan el uso de otros programas y “software” como SAS o SPSS, así como, otros lenguajes de programación como “R”, “Phyton” o “SQL” creados para la gestión de “Big Data” de forma sencilla para el usuario. Por favor, ¿no es hora de actualizarnos y trabajar en una gestión ética y útil de los datos?

#BigData #equipoHelas #legaltech #data #gestiónéticadelosdatos #compliance

Marta Serrano Carnicer

Consultor de Helas Consultores

       

Comments are closed.