La inteligencia artificial necesita cada vez más datos. Ahora las empresas están espiando el contenido privado de los usuarios y quieren evaluarlo en busca de inteligencia artificial. En Meta, sin embargo, las autoridades de protección de datos ahora están desacelerando.
El director ejecutivo de Meta, Mark Zuckerberg, quiere utilizar los datos de los usuarios de Facebook e Instagram para la inteligencia artificial.
A principios de junio, Meta Group envió correos electrónicos a sus usuarios con el asunto: «Estamos actualizando nuestra política de privacidad a medida que ampliamos la inteligencia artificial en Meta». Uno de esos correos electrónicos que la mayoría de usuarios probablemente ignorarán. En este caso equivocadamente.
Con este correo electrónico, Meta se dio permiso para utilizar imágenes, textos e información que los usuarios compartían en Instagram y Facebook para su inteligencia artificial (IA). La empresa sólo excluye el contenido que los usuarios han compartido en mensajes privados y los datos de usuarios menores de edad.
Meta no es la única empresa que quiere utilizar y explotar los datos de sus usuarios como material de formación en inteligencia artificial. Generalmente se presta poca atención a la ley aplicable. Esto provoca descontento entre los usuarios y los defensores de la protección de datos. Ahora las autoridades han intervenido en el Meta.
Lo que fluye hacia la IA se puede volver a escupir
El hecho de que Meta quiera utilizar imágenes y publicaciones de sus usuarios para entrenar inteligencia artificial es tan preocupante como parece. Algunos de los datos que fluyen hacia un modelo durante la creación de la IA, el llamado entrenamiento, permanecen almacenados en él.
Así es como Chat-GPT reproduce palabra por palabra artículos completos del New York Times. Y los generadores de imágenes producen repetidamente imágenes que son confusamente similares a imágenes individuales del material de capacitación.
Los estudios lo demuestran entre ellos uno de Florian Tramèr, quien dirige un grupo de investigación sobre la seguridad de los sistemas de inteligencia artificial en ETH. Esto muestra que el generador de imágenes Stable Diffusion no sólo reproduce cosas familiares como carteles de películas o logotipos de empresas, sino también rostros de personas no famosas. “Entiendo las protestas contra el entrenamiento de IA con datos de usuarios”, afirma Tramèr.
Si bien existen opciones técnicas que al menos hacen menos probable que los datos de entrenamiento se reproduzcan con total precisión, todavía no son estándar. Hasta ahora se trataba principalmente de una cuestión de derechos de autor. Pero Tramèr dice: «Cuantos más datos de usuario fluyen hacia los modelos, más se convierte en una cuestión de privacidad».
Las autoridades de la UE frenan los planes de Meta
En la mayoría de las regiones del mundo, Meta apenas informó a sus usuarios sobre el nuevo uso de datos. En la UE y Suiza se ve obligado a hacerlo. Porque los ciudadanos locales tienen derecho a la protección de datos. Cualquier persona que quiera tratar sus datos necesitará obtener el consentimiento. Cuanto más personales y sensibles sean los datos, más estrictos serán los requisitos.
Por este motivo, muchos defensores de la protección de datos criticaron que Meta se limitara a informar a sus usuarios de su derecho de oposición, en lugar de obtener el consentimiento explícito. Cualquiera que no quisiera que la IA procesara sus datos tenía que completar un formulario.
Peter Hense es abogado especializado en derecho cibernético. En su opinión, la oferta de exclusión voluntaria de Meta está lejos de ser suficiente para proporcionar el consentimiento explícito e informado de los usuarios que exigiría la ley. «El enfoque de Meta obviamente tiene enormes problemas», afirma. Es lógico que las autoridades de protección de datos hayan intervenido para investigar el asunto más de cerca.
Alboroto por los cambios en las condiciones de uso de Adobe
Meta no es la única empresa cuyos usuarios temen actualmente que sus datos puedan incorporarse a la inteligencia artificial.
Adobe también acaba de recibir muchas críticas por cambiar sus condiciones de uso mediante una ventana emergente. Para abrir sus programas de Adobe, los usuarios tenían que aceptar que su contenido pudiera ser procesado por máquinas.
Entonces estoy leyendo esto, ¿verdad? @Adobe @Photoshop
¿No puedo usar Photoshop si no acepto que usted tenga acceso completo a todo lo que creo con él, INCLUYENDO el trabajo de NDA? foto.twitter.com/ZYbnFCMlkE
-Sam Santala (@SamSantala) 5 de junio de 2024
Se trata de documentos en la nube: en el caso de Photoshop e Illustrator, trabajos creativos, en el caso del lector de PDF, a veces documentos confidenciales.
Al mismo tiempo, los usuarios han notado que Adobe otorga derechos muy amplios sobre el contenido del usuario en los términos de uso «para mejorar el software». En la era de la inteligencia artificial, esto tiene un nuevo sabor. Los usuarios inmediatamente sospecharon que Adobe tenía la intención de utilizar su contenido para software de inteligencia artificial. Una tormenta de indignación estalló en las redes sociales.
Adobe él respondió rápidamente con la aclaración de que la innovación siempre se refiere únicamente a la detección de contenidos ilegales. El objetivo nunca fue convertir los datos de los usuarios en material de formación.
El abogado Peter Hense no está convencido. «En Estados Unidos dicen: ‘Si quieres sacar provecho de la fiebre del oro, deberías vender tus palas’. En la fiebre del oro de la IA, los datos son la pala». Sospecha que vender datos de entrenamiento es la forma en que Adobe y Meta quieren sacar provecho del revuelo de la IA.
Su bufete de abogados ya está preparando una demanda judicial por violación de la confidencialidad del cliente. Para acceder al PDF, los usuarios que pagaban debían aceptar los términos y condiciones y así permitir que Adobe accediera al contenido restringido.
El investigador de inteligencia artificial Tramèr también se muestra crítico con el episodio: “El hecho de que estas empresas no sean transparentes sobre lo que pretenden hacer es molesto y problemático”.
Es probable que el conflicto se intensifique aún más en el futuro. Porque las empresas de IA dependen cada vez de más datos para entrenar sus sistemas. Pero los datos disponibles públicamente se están agotando. Esto hace que el contenido del usuario sea aún más interesante, ya sea almacenado en la nube o compartido en las redes sociales.
No siempre está claro qué es legal y no todo el mundo sigue las reglas. Esto lleva a situaciones extrañas. Se supone que la empresa de inteligencia artificial Open AI utiliza datos de YouTube para su inteligencia artificial, mientras que Google, propietario de YouTube, no puede hacerlo porque tiene un contrato con los creadores de los vídeos que no cubre este uso.
Los expertos consideran útiles las normas europeas de protección de datos
Después de que las autoridades de protección de datos hayan consultado a Meta, la empresa anunció querer retrasar la introducción de sus robots de IA en Europa.
Sin embargo, el abogado Peter Hense no está muy seguro de si Meta dejará de procesar datos de usuarios europeos para la inteligencia artificial. Es más probable que suponga que Meta accederá a los datos a través de una filial de la empresa y, en caso de duda, preferiría pagar una multa más tarde, como ha ocurrido en el pasado. Meta lleva años en conflicto con las autoridades europeas y ha sido sancionada varias veces por uso cuestionable de datos. Sin embargo, hasta ahora los resultados de las sanciones oficiales no se han notado, afirma Hense.
En su presione soltar Mientras tanto, Meta destaca que Europa se encuentra en una encrucijada en lo que respecta a la IA y advierte contra las “posiciones extremistas” que inhiben el desarrollo de la IA. Este argumento no convence ni a Hense ni a Tramèr. Las normas europeas de protección de datos son sensatas e importantes y no obstaculizan una verdadera innovación.
