En esta guía te voy a explicar cómo puedes saber si han usado tus datos para entrenar una IA. Además, te muestro diferentes casos en los que se ha dado eta situación y algunos consejos para evitar que empresas de inteligencia artificial entrenen sus propios modelos con el contenido que subes a la red. Si te preocupa tu privacidad o, simplemente, tienes curiosidad, lo que aquí te cuento te interesa mucho. ¡No te lo pierdas!
Usa Have I been Trained para saber si han usado tus datos en el entrenamiento de la IA
Have I been Trained es una herramienta a la que puedes acceder a través de cualquier navegador. Tiene una interfaz realmente sencilla, por lo que utilizarla no tiene mayor complicación. Una vez accedas a su página principal, verás que en la zona central hay un campo de búsqueda.
Desde este campo vas a poder localizar diferentes datos que han sido utilizados por las empresas de inteligencia artificial para alimentar sus modelos. Por ejemplo, he hecho algunas pruebas con los dominios de tuexperto.
Tal y como puedes ver en la imagen superior, hay algunos elementos de este grupo que se han utilizado para que las IA generativas sean capaces de crear nuevo contenido. Recuerda que esta web no controla los conjuntos de datos, por lo que si localizas una fotografía tuya, no vas a poder enviar una solicitud para que deje de utilizarlas.
Por otro lado, debe saber que este es un buscador de material gráfico. Por eso, es indicado para artistas, fotógrafos y profesionales de sectores similares. Se trata de una plataforma que ayuda a determinar en qué grado se ha usado el trabajo de una persona o una empresa para alimentar los distintos modelos.
Además de introducir un dominio, también puedes subir una imagen. Eso sí, antes de hacerlo, te recomiendo que leas su política de privacidad para confirmar que realmente estás de acuerdo con ella. Al enviar una imagen a esta plataforma, lo que va a hacer es lo mismo que hizo con el nombre de dominio: buscar en conjuntos de datos masivos para determinar si en alguno de ellos se encuentra la misma imagen.
Finalmente, también vas a poder introducir cadenas de texto simples y, de este modo, localizar archivos por palabras clave. Esto te sirve, por ejemplo, para encontrar fotografías o imágenes tuyas, incluso si no tienes una copia o no cuentas con una página web.
Desactiva el entrenamiento de modelos siempre que se pueda
Son muchas las empresas que están empezando a utilizar datos de los usuarios para entrar modelos de IA y crear mejores algoritmos. Dejando a un lado si esto es ético o no, lo cierto es que si tienes una cuenta en ciertas plataformas, lo más probable es que ya se esté utilizando el contenido que subes a ellas para el entrenamiento.
Es el caso de Meta, que ya está avisando a sus usuarios de que a partir de este mismo mes de junio, se va a aprovechar de la ingente cantidad de datos de sus plataformas (Facebook, WhatsApp, Instagram y Threads) para entrenar algoritmos de IA.
En el enlace superior, mi compañero Sergio te cuenta los pasos que debes seguir para evitar que esto suceda. Bajo mi punto de vista, es recomendable seguir los pasos mencionados en esta guía si lo que buscas es mejorar tu (maltrecha) privacidad en las apps de Meta.
Otro ejemplo de esta práctica es Slack. Tal y como confirma la compañía en su propia página de soporte, el contenido de tus conversaciones en la plataforma se va a utilizar para “crear una experiencia de IA intuitiva”. En este caso, los administradores de los grupos deben ponerse en contacto con la compañía para pedir expresamente que no se utilicen los datos.