La cumbre de inteligencia artificial de Bletchley Park en 2023 fue un evento histórico en la regulación de la IA simplemente por su existencia.
Entre el anuncio del evento y su primer día, la conversación general había cambiado de un tono de ligero desconcierto a un acuerdo general de que vale la pena discutir la regulación de la IA.
Sin embargo, la tarea de su seguimiento, celebrada esta semana en un parque de investigación en las afueras de Seúl, es más difícil: ¿pueden el Reino Unido y Corea del Sur demostrar que los gobiernos están pasando de hablar sobre la regulación de la IA a implementarla realmente?
Al final de la cumbre de Seúl, el gran logro que el Reino Unido estaba promocionando era la creación de una red global de institutos de seguridad de IA, basándose en los pioneros británicos fundados después de la última reunión.
La secretaria de tecnología, Michelle Donelan, atribuyó los nuevos institutos al “efecto Bletchley” en acción y anunció planes para liderar un sistema mediante el cual los reguladores de EE.UU., Canadá, Gran Bretaña, Francia, Japón, Corea, Australia, Singapur y la UE comparten información sobre modelos de IA, daños e incidentes de seguridad.
«Hace dos años, los gobiernos estaban siendo informados sobre la IA casi exclusivamente por el sector privado y los académicos, pero ellos mismos no tenían la capacidad de desarrollar realmente su propia base de evidencia», dijo Jack Clark, cofundador y jefe de políticas de la Laboratorio de IA antrópico. En Seúl, “escuchamos del instituto de seguridad del Reino Unido: han realizado pruebas en una variedad de modelos, incluido el de Anthropic, y obtuvieron resultados anónimos para una variedad de usos indebidos. También discutieron cómo construyeron sus propios ataques de jailbreak para romper los sistemas de seguridad en todos estos modelos”.
Ese éxito, dijo Clark, lo había dejado “ligeramente más optimista” que en el año previo a Bletchley. Pero el poder de los nuevos institutos de seguridad se limita a la observación y la presentación de informes, corriendo el riesgo de que se vean obligados a simplemente sentarse y observar cómo los daños de la IA aumentan desenfrenadamente. Aun así, argumentó Clark, “hay un poder tremendo en avergonzar a las personas y a las empresas”.
“Puedes ser un instituto de seguridad y simplemente probar modelos disponibles públicamente. Y si encuentras cosas realmente inconvenientes sobre ellos, puedes publicarlas, igual que sucede en el mundo académico hoy en día. Lo que se ve es que las empresas toman medidas muy importantes en respuesta a eso. A nadie le gusta estar en último lugar en la clasificación”.
Incluso el acto de observarse a sí mismo puede cambiar las cosas. Los institutos de seguridad de la UE y Estados Unidos, por ejemplo, han establecido umbrales de “cómputo”, buscando definir quién está bajo la mirada de sus institutos de seguridad según la cantidad de poder de cómputo que reúnen para construir sus modelos “de frontera”. A su vez, esos umbrales han comenzado a convertirse en una clara línea divisoria: es mejor estar ligeramente por debajo del umbral y evitar la molestia de trabajar con un regulador que estar ligeramente por encima y crear mucho trabajo extra, dijo un fundador. En Estados Unidos, ese límite es lo suficientemente alto como para que sólo las empresas más adineradas puedan permitirse el lujo de superarlo, pero el límite más bajo de la UE ha puesto a cientos de empresas bajo los auspicios de su instituto.
No obstante, la directora de privacidad y confianza de IBM, Christina Montgomery, dijo: “Los umbrales de computación todavía existen, porque es una línea muy clara. Es muy difícil determinar cuáles son las otras capacidades. Pero eso va a cambiar y evolucionar rápidamente, y debería hacerlo, porque dadas todas las nuevas técnicas que están apareciendo sobre cómo ajustar y entrenar modelos, no importa cuán grande sea el modelo”. En cambio, sugirió, los gobiernos comenzarán a centrarse en otros aspectos de los sistemas de IA, como la cantidad de usuarios que están expuestos al modelo.
La cumbre de Seúl también expuso una división más fundamental: ¿debería la regulación centrarse en la IA o debería centrarse únicamente en los usos de las tecnologías de IA? El ex jefe de Google Brain, Andrew Ng, defendió lo segundo, argumentando que regular la IA tiene tanto sentido como regular los “motores eléctricos”: “Es muy difícil decir: ‘¿Cómo podemos hacer que un motor eléctrico sea seguro?’ sin simplemente construir motores eléctricos muy, muy pequeños”.
Janil Puthucheary, ministro principal de Comunicaciones, Información y Salud de Singapur, se hizo eco del punto de Ng. “En gran medida, el uso de la IA hoy en día no está desregulado. Y el público no está desprotegido”, afirmó. “Si se aplica la IA en el sector de la salud, todas las herramientas regulatorias del sector de la salud deben abordar los riesgos. Si luego se aplicó en la industria de la aviación, ya tenemos un mecanismo y una plataforma para regular ese riesgo”.
Pero centrarse en las aplicaciones en lugar de en los sistemas de IA subyacentes corre el riesgo de pasar por alto lo que algunos consideran el mayor problema de seguridad de la IA: la posibilidad de que un sistema de IA “superinteligente” pueda conducir al fin de la civilización. El profesor del Instituto Tecnológico de Massachusetts, Max Tegmark, comparó la liberación de GPT-4 con el “momento Fermi”, la creación del primer reactor nuclear, que prácticamente garantizaba que una bomba atómica no estaría muy lejos, y dijo que el riesgo similar de Era necesario tener presentes los potentes sistemas de IA.
Donelan defendió el cambio de enfoque. “Uno de los pilares clave hoy es la inclusión, que puede significar muchas cosas, pero también debería significar la inclusión de todos los riesgos potenciales”, dijo. «Eso es algo que intentamos conseguir constantemente».
Para Clark, eso fue un escaso consuelo. “Sólo diría que cuantas más cosas intentas hacer, menos probable es que tengas éxito en ellas”, dijo. «Si terminas adoptando un enfoque de fregadero, entonces realmente diluirás la capacidad de hacer cualquier cosa».
