La privacidad diferencial no es el mejor método para proteger datos censales
Entre el 21 y el 23 de octubre de 2025 se llevó a cabo en Tarragona el primer workshop internacional sobre privacidad y anonimización de datos censales. El workshop contó con la presencia de reputados especialistas de universidades e instituciones de EEUU, Alemania, Francia e Italia que, junto a los miembros del proyecto HERMES, abordaron la problemática surgida tras la implementación del método «privacidad diferencial» a los datos del censo decenal de los EEUU el año 2020.
Como en cada decenio, el año 2020 el United States Census Bureau (USCB) -la oficina de estadística más importante del mundo- publicó el Decennial Census de los EEUU. Se trata de un tipo de padrón, en el que los resultados del informe determinan el número de escaños por cada estado en la Cámara de Representantes de los Estados Unidos y ayudan a delimitar áreas para distribuir centenares de miles de millones de dólares en fondos federales cada año. Dado que los datos recogidos son de carácter personal, tradicionalmente el USCB ha aplicado mecanismos de protección de la privacidad que resultaban efectivos tanto para conseguir el anonimato de las personas como para mantener la calidad de los datos publicados. Pero en la edición de 2020 el USCB implentó, como hemos comentado anteriormente, un nuevo método de protección denominado “privacidad diferencial”, que ha producido errores significativos en los datos publicados. Esto ha sido enormemente perjudicial para los usuarios del censo americano, que han visto cómo no era posible obtener conclusiones fidedignas de su análisis. Tanto es así, que el caso fue sometido a juicio por la corte de Alabama.
Los participantes del workshop eran juristas especializados en privacidad, usuarios expertos en datos censales o investigadores teóricos sobre la limitación de la divulgación estadística, cubriendo de esta manera todo el espectro de las distintas partes interesadas en la anomización del CENSUS. Durante el primer día del taller, este variado grupo de investigadores presentó sus opiniones relacionadas con la privacidad y la exactitud de los censos decenales de Estados Unidos de 2010 y 2020. A partir de estas presentaciones los participantes determinaron en qué medida estos censos satisfacían los requisitos legales de privacidad, los requisitos de los usuarios y la eficacia de la metodología empleada. Basándose en estos debates, se pasó a identificar los requisitos legales, los requisitos de los usuarios y las metodologías potenciales que podrían emplearse para el próximo censo decenal de Estados Unidos de 2030 y que preservarán tanto la privacidad como la precisión a un alto nivel, satisfaciendo al mismo tiempo todos los requisitos legales. Estos requisitos se presentarán en un white paper destinado a orientar a la Oficina del Censo de Estados Unidos y a otros organismos censales.