¿Por qué las calificaciones Elo están en todas partes ahora?

by tiempoantenacom

En octubre de 2003, Mark Zuckerberg creó su primer sitio viral: no Facebook, sino FaceMash. Entonces, un estudiante de primer año de la universidad, hackeó los directorios de dormitorios en línea de Harvard, reunió una colección masiva de fotografías de estudiantes y las usó para crear un sitio web en el que los estudiantes de Harvard podían calificar a sus compañeros de clase por su atractivo, literal y figurativamente, cara a cara. El sitio, una broma malvada relatada en la escena inicial de La red socialconsiguió tanta tracción tan rápido que Harvard cerró su acceso a Internet en cuestión de horas. Se dice que las matemáticas que impulsaron FaceMash y, por extensión, encaminaron a Zuckerberg hacia la construcción del imperio de redes sociales dominante en el mundo, fue, entre todas las cosas, una fórmula para clasificar a los jugadores de ajedrez: el sistema Elo.

Fundamentalmente, lo que hace una calificación Elo es predecir el resultado de las partidas de ajedrez asignando a cada jugador un número que fluctúa basándose únicamente en el rendimiento. Si vences a un jugador con una clasificación ligeramente superior, tu calificación aumenta un poco, pero si vences a un jugador con una clasificación mucho más alta, tu calificación sube mucho (y la de ellos, por el contrario, baja mucho). Cuanto mayor sea la calificación, más partidos deberías ganar.

Eso era Elo diseñado por al menos. Dejando a un lado a FaceMash y Zuckerberg, la gente ha implementado clasificaciones Elo para muchos deportes (fútbol americano, fútbol americano, baloncesto) y para dominios tan variados como las citas, las finanzas y la primatología. Si algo se puede convertir en una competición, probablemente haya sido Elo-ed. De alguna manera, un simple algoritmo de ajedrez se ha convertido en una herramienta multiuso para calificar todo. En otras palabras, cuando se trata de la forma preferida de calificar las cosas, las calificaciones Elo tienen la calificación Elo más alta.

La forma más sencilla de clasificar a los jugadores de ajedrez, o a los jugadores de cualquier juego competitivo, es mediante victorias y derrotas. Pero esa métrica es obviamente errónea: por un lado, un jugador mediocre podría acumular un récord invicto derrotando a los novatos, mientras que un gran maestro gana algo y pierde algo contra otros grandes maestros. Por otro lado, un simple recuento de victorias y derrotas indica más qué tan bueno ha sido un jugador que qué tan bueno es ahora. Incluso antes de Elo, el ajedrez tenía un sistema de clasificación que era más complejo que solo victorias y derrotas, pero a mediados de la década de 1950, un niño prodigio del ajedrez de 13 años llamado Bobby Fischer lo rompió. Se había vuelto tan bueno y tan rápido que las clasificaciones, que no tomaban suficientemente en cuenta la calidad de la oposición de un jugador, no podían seguir el ritmo. Aparentemente en respuesta, la Federación de Ajedrez de Estados Unidos convocó un comité para corregir estas deficiencias, y en 1960 adoptó un sistema ideado por un maestro de ajedrez y profesor de física húngaro-estadounidense llamado Arpad Elo. La Federación Internacional de Ajedrez hizo lo mismo una década después.

Más de 50 años después, Elo’s sigue siendo el sistema de clasificación preferido. Se ha modificado con el tiempo, y los diferentes órganos rectores del ajedrez utilizan versiones ligeramente diferentes (algunas, por ejemplo, son más o menos “variables” en cuanto a victorias y derrotas), pero todas siguen siendo variaciones cercanas del original. Elo se ha convertido en el número más importante del ajedrez. “Cada vez que alguien descubre que juegas ajedrez, la pregunta inmediata siempre es: ‘¿Cuál es tu puntuación?’”, me dijo Nate Solon, un maestro de ajedrez y científico de datos que escribe un boletín semanal de ajedrez.

Pero las calificaciones Elo no tienen inherentemente nada que ver con el ajedrez. Se basan en una fórmula matemática simple que funciona igual de bien para cualquier competencia uno contra uno de suma cero, es decir, para casi todos los deportes. En 1997, un estadístico llamado Bob Runyan adaptado la fórmula para clasificar a los equipos nacionales de fútbol, ​​un proyecto tan exitoso que la FIFA finalmente adoptado un sistema Elo para sus rankings oficiales. Poco después, el estadístico Jeff Sagarin aplicado Elo para clasificar a los equipos de la NFL fuera de su clasificación oficial de la liga. Las cosas realmente despegaron cuando la nueva versión propiedad de ESPN del 538 de Nate Silver se lanzó en 2014 y comenzó a generar calificaciones Elo para muchos deportes diferentes. Algunos deportes resultaron más complicados que otros. El baloncesto de la NBA en particular expuso algunas de las deficiencias del sistema, Neil Paine, un experto centrado en las estadísticas Escritor de deportes que trabajaba en el 538, me dijo. Subestimó consistentemente a los equipos de peso pesado, por ejemplo, en gran parte porque tuvo dificultades para explicar la falta de sentido de gran parte de la temporada regular y el hecho de que cualquiera de los equipos podría no estar esforzándose tanto por ganar un juego determinado. El sistema suponía una motivación uniforme en todos los equipos y en todos los partidos.

Resulta que prácticamente cualquier cosa puede enmarcarse como un juego uno contra uno de suma cero. Es posible que haya sido evaluado mediante una calificación Elo sin siquiera saberlo. Las calificaciones Elo se pueden utilizar para evaluaciones de los estudiantes de grado y inspeccionar la tela. Se pueden utilizar para clasificar las empresas de capital riesgo y priorizar diferentes tipos de formación sanitaria. Hasta hace unos años, Tinder puntuaciones Elo usadas para calificar a los usuarios según su conveniencia y mostrarles posibles coincidencias con calificaciones similares. Los científicos informáticos han comenzado a mantener un sistema basado en Elo. tabla de clasificación de grandes modelos lingüísticos. Primatólogos usar Calificaciones Elo para modelar comportamientos de dominancia social. Al menos una persona los ha usado para decidir cuál de sus camisetas tirar.

El atractivo de Elo es claro: la gente está obsesionada con los datos, las estadísticas y la clasificación de las cosas, y Elo proporciona una sensación de rigor cuantitativo, de meritocracia objetiva. “Lo bueno del ajedrez es que tienes un único número que captura tu habilidad con bastante precisión”, me dijo Solon. Por supuesto, en algún nivel querrías algo similar en otros aspectos de la vida. “Pero el lado oscuro de esto es que puede determinar tu posición dentro del mundo del ajedrez e incluso tu autoestima… Es una especie de maldición para muchos jugadores porque simplemente están obsesionados con ese número”. Lo mejor de las calificaciones Elo es que sabes exactamente cuál es tu posición en relación con los demás, y lo terrible de las calificaciones Elo es que sabes exactamente cuál es tu posición en relación con los demás.

En realidad, Elo no garantiza nada. Las clasificaciones son tan buenas o meritocráticas como las competiciones subyacentes. No tienen nada de mágico: por muy sofisticada que sea su fórmula, si sus entradas son basura, sus salidas también lo serán. El verano pasado, alguien creó un sitio web llamado Elo Everything, que hace exactamente lo que uno imagina. Cuando visita el sitio, le ofrece dos cosas y le pregunta: “¿Cuáles?” ¿Tiene un rango más alto? Algunos ejemplos de enfrentamientos incluyen el gobierno de EE. UU. contra las arañas, la testosterona contra lo crujiente y el Anillo Único de señor de los Anillos versus la muerte de Adolf Hitler. Tu selección afecta la puntuación Elo de las dos cosas en disputa y eso, a su vez, afecta la clasificación general. Actualmente, en lo más alto de la clasificación se encuentran: (1) El universo, (2) el agua, (3) el conocimiento, (4) la información y (5) el amor. El lenguaje, la materia y la “forma del cuerpo femenino” estaban, a partir de esta tarde, empatados a tres bandas en el puesto 24.

El propio Elo comprendió las limitaciones de su invento. En su concepción, su función era bastante limitada: “Es una herramienta de medición, no un dispositivo de recompensa o castigo”, comentó una vez. “Es un medio para comparar actuaciones, evaluar la fuerza relativa, no una zanahoria agitada ante un conejo o un caramelo regalado a un niño por su buen comportamiento”. Inevitablemente, eso es en lo que se ha convertido.

You may also like

Leave a Comment