El sistema de puntuación Elo utilizado en el modelo de recompensa RM

Ahora eres profesor universitario, describe detalladamente el ranking Elo, exprésalo con una fórmula

2. Fórmula de cálculo de puntos
Ra: Clasificación actual del jugador A
Rb: Clasificación actual del jugador B
Sa: valor real de victoria/derrota, victoria=1, empate=0,5, derrota=0
Ea: valor esperado de ganancia/derrota del jugador A, Ea=1 /(1+10^[(Rb-Ra)/400])
Eb: El resultado esperado del jugador B, Eb=1/(1+10^[(Ra-Rb)/400])
porque el valor E también es Estimado, entonces Ea+ Eb=1

 

El sistema de clasificación Elo es un método para calcular los niveles de habilidad relativos de los jugadores , que normalmente se usa en juegos y deportes competitivos. El Dr. Arpad Elo diseñó originalmente este sistema para evaluar a los jugadores de ajedrez.

La idea principal del sistema Elo es: si A vence a B en un partido, entonces el sistema aumenta el rango de A y el rango de B disminuye. Sin embargo, la magnitud del cambio depende de su porcentaje de victoria esperado . Si A es un jugador avanzado y vence al jugador junior B , entonces el rango de A aumentará ligeramente y el rango de B disminuirá ligeramente. Sin embargo, si B vence a A, entonces la clasificación de A caerá significativamente y la clasificación de B aumentará significativamente.

La fórmula básica del sistema de clasificación Elo es la siguiente:

1. Calcular la puntuación esperada de cada jugador:

Tasa de ganancia esperada: Ea = 1 / (1 + 10 ^ ((Rb - Ra) / 400)) , de manera similar, Eb = 1 / (1 + 10 ^ ((Ra - Rb) / 400))

 Aquí, Ra y Rb representan las clasificaciones actuales de A y B, respectivamente. Ea y Eb son las probabilidades esperadas de ganar A y B.

 

2. Actualización de clasificación:

Nueva Ra = antigua Ra + K * (Sa - Ea), nueva Rb = antigua Rb + K * (Sb - Eb)

 

Aquí, K es el coeficiente K (generalmente de 10 a 60, dependiendo de la situación específica ), Sa y Sb son los resultados del juego (si A gana, Sa=1, Sb=0; si B gana, Sa=0, Sb = 1; si hay empate, Sa = Sb = 0,5).

  1. donde R'_A y R'_B son las calificaciones Elo actualizadas, S_A y S_B son las puntuaciones reales (1 para una victoria, 0.5 para un empate, 0 para una derrota) y K es el coeficiente que afecta cuánto cambia la calificación .

Selección del factor K

La elección del factor K depende de varios factores, incluido el nivel de experiencia del jugador y la importancia del juego. Elegir un valor de K adecuado puede ayudar a que el sistema de puntuación de Elo refleje mejor la fuerza real del jugador.

Los valores más altos de K (por ejemplo, 40) pueden hacer que la calificación de un jugador sea más volátil , más adecuada para jugadores principiantes o intermedios , de modo que su calificación pueda reflejar su mejora de habilidad más rápidamente . Mientras que un valor K más bajo (como 10 o 20) puede resultar en una calificación más estable y es más adecuado para jugadores avanzados.

En algunos casos, el valor K se puede ajustar según la clasificación actual del jugador o el tipo de partido . Por ejemplo, con el ajedrez, un jugador joven puede tener una K de 40, un jugador intermedio puede tener una K de 20 y un jugador superior puede tener una K de 10.

Recuerde, todas estas son solo formas aproximadas de tratar de cuantificar la fuerza del jugador. En realidad, cualquier juego tiene un cierto grado de aleatoriedad, por lo que cualquier sistema de puntuación no puede reflejar de forma completa y precisa la fuerza del jugador . El sistema de calificación Elo es solo un intento de asignar una calificación razonable a cada jugador utilizando datos históricos de partidos . Al mismo tiempo, dado que el resultado de cada juego afecta el puntaje Elo del jugador, este sistema también aporta una capa estratégica adicional al juego.Los jugadores deben hacer un compromiso entre mantener o mejorar su puntaje Elo y probar nuevas estrategias . "

Lo anterior es el principio básico y la fórmula del sistema de clasificación Elo.

3. Descripción del ejemplo
Si la calificación actual del jugador A es 1500 y la calificación del jugador B es 1600, el
valor estimado de ganancias y pérdidas del jugador A es Ea = 1/(1+10^[(1600-1500)/400 ]) ≈ 0.36 y el
valor estimado del jugador B El valor de ganancia-pérdida Eb = 1-Ea = 1-0.36 = 0.64

Suponiendo que el jugador A gana, el valor real de ganancias y pérdidas es Sa = 1.
La puntuación final del jugador A es R'a = 1500 + 32*(1-0,36) = 1500+20,5 = 1520. El jugador A gana por 20 puntos y el jugador B pierde por 20 puntos.

Suponiendo que el jugador B gana, el valor real de victorias y derrotas es Sa = 1. La
puntuación final del equipo B es R'b = 1600 + 32*(1-0,64) = 1600 + 11,52 = 1612. El jugador B gana por 12 puntos y el jugador A pierde por 12 puntos.
PD: El símbolo ^ representa una operación de potencia.

4. El propósito del sistema de escalera
1. Proteger a los novatos de ser abusados ​​por jugadores experimentados, para que no haya novatos en el juego principal.
2. Cree un juego justo y competitivo para maximizar la diversión del jugador.
3. No es necesario esperar demasiado para encontrar un oponente para ingresar al juego.

V. Ejemplos específicos
11 Ejemplo de la escalera de la plataforma de batalla.
La siguiente fórmula es una buena ilustración del método de cálculo de los puntos de la escalera, y el cálculo de Si se basa en el algoritmo ELO Aunque la escalera 11 todavía tiene errores, hay que admitir que es un gran diseño.


 

¿Cuál es el principio de dividir por 400 en la fórmula?

La porción de división por 400 de la fórmula utilizada por el sistema de clasificación de Elo tiene como objetivo asignar la escala logarítmica de base 10 a la escala de juego o competencia adecuada . Para el ajedrez, Arpad Elo eligió 400 porque consideró que era un valor apropiado que permitiría a un jugador clasificado 400 más alto vencer a un jugador clasificado 400 más bajo con una probabilidad de alrededor de 0,75.

Las razones específicas para elegir 400 incluyen: En ese momento, la clasificación de los ajedrecistas era de alrededor de 2000, y esperaba tener un rango apropiado para que la brecha de clasificación entre maestros y novatos no fuera demasiado grande o demasiado pequeña. Y el número 400 puede satisfacer sus necesidades.

Sin embargo, en otras aplicaciones este valor puede variar. Por ejemplo, un juego en línea puede elegir un valor mayor o menor para acomodar una base de jugadores más amplia y velocidades de juego más rápidas.

Supongo que te gusta

Origin blog.csdn.net/qq_39970492/article/details/131251163
Recomendado
Clasificación