Av. Països Catalans 26 E-43007 Tarragona, Spain

El desafío del olvido digital: Cómo las IA pueden desaprender información no deseada

  • 9 febrero 2025
  • Publicaciones científicas
El desafío del olvido digital: Cómo las IA pueden desaprender información no deseada

El desafío del olvido digital: Cómo las IA pueden desaprender información no deseada

En la era de la inteligencia artificial, los modelos de lenguaje masivos, conocidos como LLMs, han revolucionado la forma en que interactuamos con la tecnología. Desde la generación de texto hasta la asistencia en la toma de decisiones, su impacto es innegable. Sin embargo, su capacidad para almacenar y reutilizar información plantea un problema crucial: ¿qué ocurre cuando estos modelos aprenden algo que no deberían saber? Aquí es donde entra en juego el concepto de olvido digital o machine unlearning, una técnica diseñada para eliminar información no deseada de estos sistemas sin comprometer su rendimiento.

El problema del olvido digital surge por varias razones. En primer lugar, estos modelos se entrenan con enormes cantidades de datos, a menudo recopilados de internet sin un filtro preciso. Esto puede llevar a que incorporen información privada o sensible, lo que representa un riesgo para la privacidad. Además, pueden generar respuestas problemáticas, como reproducir sesgos sociales, propagar desinformación o incluso infringir derechos de autor al replicar fragmentos de obras protegidas. Por estas razones, tanto la regulación europea como normativas en otros países exigen que se desarrollen mecanismos para eliminar información específica de estos modelos cuando sea necesario.

Para abordar este desafío, los investigadores han desarrollado diversas estrategias. Algunas técnicas modifican el modelo en su totalidad, reentrenándolo para que «olvide» lo que ha aprendido de ciertos datos. Aunque este enfoque es efectivo, resulta extremadamente costoso en términos de tiempo y recursos computacionales. Otras metodologías se centran en cambiar solo ciertas partes del modelo, identificando y alterando los parámetros específicos que contienen la información a olvidar. También existen enfoques que agregan capas adicionales a la arquitectura del modelo para reconfigurar su comportamiento sin necesidad de modificarlo por completo.

Más allá de cambiar la estructura interna de estos sistemas, también se han explorado estrategias más sutiles, como la manipulación de entradas y salidas. En este caso, el modelo no se modifica directamente, sino que se utilizan técnicas como la ingeniería de prompts (instrucciones diseñadas para guiar su respuesta) o el uso de bases de datos externas para filtrar y corregir la información generada.

El desafío de evaluar si un modelo ha olvidado correctamente sin afectar su desempeño es complejo. Los investigadores han desarrollado métricas y bases de datos específicas para medir tanto la efectividad del olvido como la capacidad del modelo para seguir funcionando en tareas generales. Sin embargo, garantizar un olvido completo sigue siendo un reto, ya que, en algunos casos, el conocimiento eliminado puede reconstruirse indirectamente a partir de otras conexiones dentro del modelo.

En última instancia, el desarrollo de técnicas eficientes de machine unlearning es esencial para garantizar el uso responsable de la inteligencia artificial. La clave está en encontrar un equilibrio entre eliminar información problemática y mantener la utilidad de estos modelos, asegurando que sean herramientas seguras, justas y alineadas con los valores éticos y legales de la sociedad.

 

Referencia:

A. Blanco-Justicia, N. Jebreel, B. Manzanares-Salor, D. Sánchez, J. Domingo-Ferrer, G. Collell and K. E. Tan, «Digital forgetting in large language models: a survey of unlearning models», Artificial Intelligence Review, Vol. 58, 90, Apr 2025, ISSN: 0269-2821. DOI

 

También puede interesarte…

Volver a Notícias
Las Smart Grids y su potencial transformador

8 noviembre 2024

Las Smart Grids y su potencial transformador

  • Publicaciones científicas
La «amenaza» de los ordenadores cuánticos

11 julio 2024

La «amenaza» de los ordenadores cuánticos

  • Publicaciones científicas