Olimpiada de IA. Se le ocurrió un viaje por carretera y una receta de budín de pan.

Este es el año del deporte. El campeonato mundial de hockey ha quedado atrás, el campeonato europeo de fútbol está a la vuelta de la esquina y el punto culminante serán los Juegos Olímpicos de París. Por eso organizamos un cuádruple en la redacción, sólo que en disciplinas ligeramente diferentes al deporte. Para comenzar la carrera imaginaria, colocamos uno al lado del otro los generadores de texto más populares actualmente y les asignamos varias tareas. ¿A dónde nos enviaron de vacaciones? ¿Qué creen que deberíamos cocinar con las sobras de la nevera? ¿Y saben cuántos goles marcamos en la final contra los suizos?

Es posible que la inteligencia artificial generativa ya no sea tan popular como lo era cuando OpenAI lanzó el programa ChatGPT a finales de 2022 y desató una ola de euforia. Pero sigue siendo una de las industrias tecnológicas más populares, y las nuevas empresas compiten por el volumen de inversión recibida y las capacidades de sus programas emblemáticos, que lanzan a un ritmo rápido. Dado que recientemente han aparecido muchos programas nuevos impulsados por IA, decidimos compararlos.

Todos los sistemas recibieron casi la misma información de nuestra parte en inglés. Los queríamos para un plan de vacaciones, actualizaciones, una receta para la cena y un plan de acondicionamiento físico. En la mayoría de los casos, fue una tarea única; para algunos temas hicimos un seguimiento con preguntas adicionales. Los sistemas que hemos probado están disponibles en modo completo o limitado de forma gratuita (GPT-4o, Claude 3, Perplexity Pro), o hemos concertado el acceso a la versión de prueba durante el primer mes de forma gratuita (Gemini Advanced, Copilot Pro).

Los ganadores en breve

  • ¿Quieres planificar? Géminis Avanzado (Google)
  • ¿Necesitas orientarte en la actualidad? Géminis Avanzado (Google)
  • ¿No se te ocurre qué cocinar? Perplejidad Pro (Perplejidad AI)
  • ¿Quieres probar un plan de fitness a partir de inteligencia artificial? Perplejidad Pro (Perplejidad AI)

¿Con quién planificar unas vacaciones?

Ganador: Géminis Avanzado (Google)
Mención de Honor: Copilot Pro (Microsoft)
Perdedor: GPT-4o (OpenAI)

Es hora de la primera disciplina, que es la planificación. Y como ya estamos en junio, ¿qué más deberían ser sino unas vacaciones? La tarea fue: “Ayúdame a planificar unas vacaciones asequibles de una semana para una pareja joven en un destino de verano europeo con actividades centradas en la relajación y la exploración de la cultura local. Sugerir alojamiento cerca de lugares interesantes. Elabore un programa de viaje detallado, recomiende actividades y opciones gastronómicas adecuadas. Cree también una estimación de costos”.

El sistema Gemini Advanced de Google fue el que mejor hizo frente a la tarea, que nos envió a la capital portuguesa de Lisboa. Recomendó alojarse en uno de los dos albergues del centro de la ciudad, a los que él mismo proporcionó enlaces. A continuación se presentó un breve itinerario que en pocas frases sugería actividades para cada día. Una vez más, había enlaces funcionales que facilitaban comprobar si una persona estaría realmente interesada en el viaje en cuestión. En nuestra opinión, es ideal como base para arreglos más detallados.

Pero Copilot Pro de Microsoft también fue útil. Aunque recomendó como destino su Praga natal, tras pedir un sustituto, sugirió varias opciones: de nuevo Lisboa, Valencia en España y Tallin en Estonia.

GPT-4o y Claude 3 también nos enviaron a la capital portuguesa. Ambos vinieron con un itinerario detallado con programa y precio estimado. Pero el problema del primero mencionado fue que no dio los enlaces solo como Géminis. Cuando una persona los solicitaba, se los proporcionaba, pero la mayoría de ellos no funcionaban. Claude, en cambio, no tiene acceso a Internet, lo que imposibilita las líneas.

También vale la pena mencionar el programa Perplexity Pro, que solicita aclaraciones de manera proactiva. Pero se le ocurrió un plan bastante curioso. Inicio de semana en Bratislava y luego traslado a Valencia, España. No sabíamos cómo íbamos a superar los aproximadamente tres mil kilómetros que separan las dos ciudades. Además, la información proporcionada no tenía enlaces, pero apareció y funcionó cuando se solicitó.

¿A quién pedirle noticias?

Ganador: Géminis Avanzado (Google)
Mención de Honor: GPT-4o (OpenAI)
Perdedor: Copilot Pro (Microsoft)

La segunda ronda de la competición se quedó en casa, en sentido figurado. El sistema de Google, el motor de búsqueda número uno de Internet, fue el que mejor respondió a las preguntas actuales. Gemini Advanced respondió brevemente, pero con precisión. Sabía que en la final del campeonato mundial de hockey la República Checa venció a Suiza por 2:0. También fue consciente del récord de audiencia que había caído y que había alcanzado el número de visitantes. GPT-4o, en cambio, sí sabía que la selección nacional había ganado 2-0 a los suizos y los nombres de los jugadores que marcaron el gol. También respondió correctamente que se representó en Praga y Ostrava y que se batió el récord de audiencia. Sin embargo, a diferencia de la competencia de Google, no alcanzó el número exacto de espectadores.

Pero el resto del campo inicial tuvo problemas con las preguntas actuales. Por ejemplo, Perplexity Pro respondió incorrectamente que Canadá ganó este año. Cuando se le preguntó cómo terminó exactamente la final, respondió que fue 2:0 en el partido entre la República Checa y Suiza. Ni siquiera Copilot Pro de Microsoft funcionó de manera convincente. Aunque nombró correctamente al rival de la final de este año, no acertó en el marcador, según él, el partido terminó 4:2 para la República Checa. Sin embargo, sabía que el campeonato se jugaría en Praga y Ostrava. También indicó correctamente un nuevo récord de asistencia.

Con diferencia, el peor en esta área fue el Claude 3 de Anthropic, que ganó Canadá. Sin embargo, hay que recordar que el programa no tiene acceso a Internet, por lo que sus últimas informaciones están relacionadas con el Mundial del año pasado, cuando los jugadores canadienses de hockey sobre hielo ganaron.

Receta de cena sobrante

Ganador: Perplejidad Pro (Perplejidad AI)
Mención de Honor: Gemini Advanced (Google), Claude 3 (Antrópico)
Perdedor: GPT-4o (OpenAI), Copilot Pro (Microsoft)

Otra disciplina se nos ocurrió al mirar el contenido de una bolsa llena de alimentos con fecha de caducidad próxima, que pedimos a través de la aplicación Neszeneno. El pedido incluía medio kilo de salami gothai, medio kilo de salami de caza y de nuevo alrededor de medio kilo de baguettes. Entonces decidimos torturar a la IA. Ella debía idear un plato realista y sabroso a partir de estos y algunos otros ingredientes básicos, nombrarlo y preparar un proceso claro paso a paso para que lo cocináramos.

El programa Perplexity Pro demostró ser un cocinero experto y creó una receta llamada Frittata con salami y huevos con baguette crujiente y mantequilla. Realmente sólo utilizó ingredientes permitidos y el proceso de trabajo fue lógico, claro y bien organizado, por lo que el autor de este texto probablemente podría cocinar la creación. La propuesta de Gemini Advanced, que venía con Hearty Hunting Mixture, sonaba igualmente realista y sabrosa. Simplemente mezclas cebollas, huevos y salami con queso y listo. No perdió a Claude 3, a quien se le ocurrió un plato llamado Baguette Boats with Salami and Onions, básicamente baguettes rebozadas.

Foto: CzechCrunch / OpenAI

Budín de pan por IA

Por el contrario, definitivamente no deberías dejar que Copilot Pro de Microsoft entre en la cocina. Ignoró por completo las instrucciones específicas de usar solo los ingredientes enumerados y se le ocurrió espaguetis a la carbonara con pollo. Qué diablos, el plato podría estar bueno, pero la pasta y otros ingredientes no estaban en nuestras especificaciones.

El GPT-4o de OpenAI, al que se le ocurrió algo llamado pudín de pan de cebolla y salami, tampoco funcionó. A primera vista, seguro que no suena como algo que nos gustaría comer. Por otro lado, cuando pidiéramos una ilustración (ver arriba), probablemente mordiéramos algo así con gusto.

¿Con quién empezar a hacer deporte?

Ganador: Perplejidad Pro (Perplejidad AI)
Mención de Honor: otros
Perdedor: –

También intentamos instruir a programas de inteligencia artificial para que crearan un plan de ejercicio semanal para nosotros. En comparación con las disciplinas anteriores, ésta fue la más equilibrada. Todos los sistemas ofrecían diseños realistas a primera vista. Los detalles fueron decisivos, gracias a los cuales Perplexity Pro volvió a dar el mejor rendimiento. A partir de su respuesta, una persona puede acceder fácilmente a varios artículos en sitios web o videos, donde puede ver cómo realizar correctamente los ejercicios sugeridos. Al mismo tiempo, Perplexity ofrece varias otras preguntas relacionadas al final de la respuesta.

altman-x-johansson

Leer tambiénScarlett Johansson vs. OpenAI. A la actriz le molesta la voz de la inteligencia artificialScarlett Johansson entró en batalla contra OpenAI. La voz de la inteligencia artificial le molesta, será mejor que la empresa la elimine

De nuestra pequeña olimpiada tecnológica se desprende que los distintos sistemas se diferencian en diferentes ámbitos de aplicación. Lo más sorprendente fue el desempeño de Gemini Advanced de Google, que se destacó en la planificación de vacaciones y en brindar información actualizada. Perplexity Pro ha demostrado ser una excelente ayuda en la cocina y en la creación de un plan de fitness. Copilot Pro y especialmente GPT-4o, que actualmente es probablemente el programa de IA más conocido, no cumplieron con las expectativas.

Pero la inteligencia artificial generativa, por supuesto, no sólo puede crear textos. Los sistemas más recientes, como el GPT-4o, se denominan multimodales, por lo que pueden trabajar con imagen, sonido y vídeo. Durante su presentación, el nuevo modelo de OpenAI llamó especialmente la atención por su capacidad de hablar con fluidez y mantener una conversación. Pero nuevamente planteó dudas sobre el trabajo con datos al entrenar inteligencia artificial, y la actriz Scarlett Johansson recurrió a OpenAI por la similitud de la voz de GPT-4o.

You may also like

Leave a Comment