Bing AI de Microsoft proporciona información electoral falsa en Europa, según un estudio

Los chatbots de IA pueden ⁣proporcionar información ⁣errónea sobre elecciones, advierten los expertos

Un ⁣estudio revela que el chatbot Bing AI de Microsoft dio⁢ respuestas inexactas ‍en‍ un tercio de las⁢ preguntas sobre elecciones

Expertos advierten⁤ que no se debe confiar en los ‌chatbots de inteligencia⁣ artificial para obtener información precisa sobre las elecciones, a pesar de que puedan parecer confiables y citar fuentes aparentemente confiables.

Una nueva⁢ investigación realizada por dos organizaciones sin fines de lucro europeas ha descubierto que el chatbot Bing AI de Microsoft, ahora ‌conocido como Microsoft Copilot, proporcionó respuestas inexactas a una⁢ de cada tres preguntas básicas sobre candidatos, encuestas, escándalos y votaciones en ciclos ‍electorales recientes en Alemania y Suiza. En muchos casos, el chatbot citó erróneamente sus fuentes.

Estos problemas no se limitaron a Europa,‌ ya que preguntas similares también generaron respuestas inexactas sobre las elecciones estadounidenses⁣ de 2024.

Los hallazgos de las organizaciones sin‍ fines de lucro AI Forensics y AlgorithmWatch, compartidos con The Washington Post antes de su publicación, no afirman que la información errónea proporcionada por Bing haya ⁣influido en el resultado de las elecciones. Sin embargo, refuerzan la preocupación⁤ de que los ⁢chatbots‍ de inteligencia artificial ⁤actuales puedan contribuir a la confusión y la desinformación en futuras elecciones a medida que Microsoft y‍ otras grandes empresas tecnológicas los integran rápidamente en ‍productos cotidianos, incluida la búsqueda en Internet.

«A medida que la IA generativa se generalice, esto podría afectar a una de las piedras angulares de‍ la democracia: el acceso a información pública confiable y transparente», concluyen los investigadores.

Los chatbots de IA luchan ⁤por brindar información precisa

Las herramientas de inteligencia⁣ artificial de OpenAI, Microsoft y Google enfrentan desafíos

A medida que ⁢los chatbots de IA como ChatGPT de OpenAI, Bing de Microsoft y ‌Bard de Google han ganado popularidad, su propensión a proporcionar información falsa ha quedado ⁢bien documentada. En un esfuerzo por mejorar su confiabilidad, las tres compañías han ⁣agregado la capacidad‌ de buscar en la web y citar⁣ fuentes para ‌respaldar la información que brindan.

Chatbots aún inventan información a pesar de las mejoras

A pesar de estas mejoras, los chatbots todavía tienen dificultades para brindar información precisa. Según⁤ Salvatore Romano, jefe de investigación de AI Forensics, Bing (ahora⁢ Copilot) rutinariamente proporciona respuestas que difieren de la información contenida en los enlaces que cita.

Problemas no ‍limitados a Bing

Si bien los investigadores se centraron en Bing debido a su integración en⁣ servicios ampliamente utilizados en Europa, como la búsqueda de Bing, Microsoft Word y el sistema operativo Windows, Romano señaló que los problemas encontrados no se limitan solo a Bing. ⁤Las pruebas preliminares en GPT-4 de OpenAI también arrojaron imprecisiones similares. ⁢Aunque no se evaluó Bard de Google debido a su indisponibilidad⁣ en Europa durante‍ el estudio.

Desafíos ⁣con idiomas distintos al inglés

Los investigadores ‌descubrieron que las imprecisiones en las respuestas de Bing eran⁣ más comunes cuando las preguntas se formulaban en idiomas distintos al inglés. ⁤Esto plantea preocupaciones ⁢sobre el rendimiento ⁣de las herramientas de IA creadas por empresas estadounidenses en el extranjero.

Errores en diferentes idiomas

Las preguntas en alemán provocaron errores factuales en la respuesta en un 37% de los casos, mientras que en inglés fue del 20%. Las preguntas en francés sobre las elecciones suizas tuvieron un índice de error del 24%.

Respuestas ofensivas o evasivas

Las salvaguardias integradas en Bing para evitar respuestas⁢ ofensivas o inapropiadas parecen aplicarse de manera desigual ⁣en diferentes idiomas. En ⁣francés, se negó a responder o dio respuestas‍ evasivas al 59% de⁢ las consultas, en comparación con el 39% en inglés y el 35% en‌ alemán.

Imprecisiones en las respuestas

Las imprecisiones incluyeron proporcionar fechas incorrectas para las elecciones, ⁢informar números de encuestas obsoletos o incorrectos, incluir a ⁢candidatos ⁣que ya no ⁤estaban en la carrera como principales contendientes e inventar controversias sobre los candidatos⁤ en‌ algunos casos.

Ejemplo de tergiversación ‌en Bing

Un ‌ejemplo notable fue una pregunta sobre un escándalo político en Alemania antes de las elecciones estatales de Baviera. El chatbot‍ proporcionó ‍respuestas diferentes, algunas de ellas falsas, sobre Hubert Aiwanger, líder del partido populista Votantes Libres. El chatbot afirmó falsamente en un momento ‌que Aiwanger nunca ‍distribuyó un folleto antisemita, ‍y en otra ocasión mezcló el escándalo con información errónea sobre el coronavirus.

Además, Bing tergiversó el impacto del escándalo al afirmar que el partido de Aiwanger perdió terreno en las encuestas después ⁤de las acusaciones de antisemitismo, cuando en realidad subió en las encuestas y tuvo un desempeño⁣ superior a las expectativas en las elecciones.

Microsoft trabaja para solucionar problemas de desinformación generados por chatbots

Las organizaciones sin fines de lucro ‌presentaron a Microsoft algunos⁢ hallazgos preliminares este otoño, dijeron, incluidos los ejemplos de Aiwanger. Después de que Microsoft respondió,⁣ descubrieron que Bing había comenzado a dar respuestas correctas a las preguntas sobre Aiwanger. Sin embargo,⁢ el chatbot persistió en brindar información inexacta a muchas otras preguntas, lo ‌que, según Romano, sugiere que ⁢Microsoft está tratando de solucionar estos ‍problemas caso por caso.

Según Romano, Microsoft enfrenta un problema sistémico y carece de herramientas efectivas para solucionarlo.

En respuesta ‍a los⁢ hallazgos, Microsoft afirmó estar trabajando para corregir⁢ los ⁤problemas antes de las elecciones de 2024 en Estados Unidos. Un portavoz de la compañía instó a los votantes a⁤ verificar la exactitud de la información obtenida de los chatbots.

Frank‌ Shaw, jefe de comunicaciones de Microsoft, declaró: «Seguimos abordando problemas y preparando nuestras herramientas para que cumplan ⁢con nuestras expectativas para las elecciones de 2024. Animamos a las personas a utilizar⁣ Copilot con su mejor criterio al ver los resultados. Esto incluye‍ verificar los materiales ⁢originales y consultar ⁣los enlaces web para obtener más información».

La Comisión Europea también está atenta a los efectos negativos de la desinformación en línea, especialmente cuando es impulsada por la inteligencia artificial. Según Johannes Barke, portavoz ‌de la Comisión, la integridad electoral es una máxima prioridad para la aplicación de la ⁣ley, según la nueva Ley de Servicios ⁢Digitales de Europa.

Aunque el estudio se centró en las elecciones en Alemania y Suiza, se encontró que Bing también tuvo problemas con preguntas similares sobre las elecciones⁤ estadounidenses de 2024. El chatbot proporcionó⁣ respuestas incorrectas y enlaces a fuentes inexistentes. Además, el chatbot⁤ dio respuestas inconsistentes a‌ preguntas sobre escándalos relacionados con Biden y Trump.

Aunque no está claro qué impacto pueden tener las respuestas inexactas de los chatbots en las elecciones, Bing, ChatGPT y Bard incluyen descargos de ‌responsabilidad que señalan que pueden cometer errores y alientan a⁤ los usuarios a verificar sus respuestas. Bing, en particular, se presenta como ⁤una alternativa a la búsqueda, pero su ⁤reciente cambio de nombre a Microsoft Copilot busca enfatizar que es un asistente⁤ y no‌ una‍ fuente definitiva de respuestas.

Una encuesta realizada por ‌la Escuela Harris de Políticas Públicas de la Universidad de Chicago y AP-NORC⁢ reveló que el 15% de los estadounidenses planea utilizar la inteligencia artificial para obtener información sobre las próximas elecciones presidenciales.⁣ La encuesta también mostró preocupación bipartidista sobre el uso de ⁢la inteligencia artificial para difundir información errónea sobre las elecciones.

Bing a veces cita erróneamente las fuentes citadas, según una empresa de IA

Los modelos ⁤de lenguaje de IA pueden producir imprecisiones

Según Amin Ahmad, cofundador y director ejecutivo de Vectara, una empresa de inteligencia artificial con ‌sede en‍ Palo Alto,‌ California, Bing a veces comete errores ‌al citar ⁤fuentes. Vectara se dedica a crear herramientas de lenguaje de IA para empresas ⁤y su ⁤investigación ha revelado que ⁤los ‌principales modelos de⁤ lenguaje de IA pueden generar imprecisiones, incluso al resumir⁣ un solo⁢ documento.

Una tasa de error del 30% en cuestiones electorales

Ahmad señala⁣ que, aunque esperaba cierto margen de‍ error, una tasa del 30% en cuestiones electorales es más alta de lo‍ que hubiera esperado. Aunque confía en que los modelos de IA mejorarán rápidamente‌ y reducirán su propensión a inventar información, los hallazgos de las organizaciones sin fines de lucro son preocupantes.

El peligro de las citas erróneas

Ahmad expresa su preocupación por las citas erróneas en los resultados de búsqueda. Cuando se refiere a números y luego ve que la historia original no coincide, es poco probable que haga clic en la historia original. ⁢Considera que copiar un número es una tarea sencilla, por lo⁤ que considera que esto es bastante peligroso.