En la teoría de juegos, el Valor de Shapley, nombrado así en honor de Lloyd Shapley (quién lo introdujo en 1953), es un método de distribución de riquezas usado en la teoría de juegos cooperativos. Para cada juego cooperativo se asigna un único reparto (entre los jugadores) del beneficio total generado por la coalición de todos los jugadores.
El valor de Shapley se representa como una colección de propiedades deseables o axiomas.
Explicación Shapley Values
La configuración de esta teoría sería así: una coalición de jugadores coopera, y obtiene una cierta ganancia general de dicha cooperación. Dado que algunos jugadores pueden contribuir más a la coalición que otros, o pueden poseer diferente poder de negociación (por ejemplo, amenazando con destruir todo el excedente), ¿qué reparto final de los beneficios de la cooperación entre los jugadores debemos esperar que surjan en cualquier juego en particular? O expresado de otra manera: ¿qué importancia tiene cada jugador para la cooperación global, y qué recompensa puede él o ella razonablemente esperar? El valor de Shapley ofrece una posible respuesta a esta pregunta.
Para estimar una predicción de un juego en el que queremos predecir el pago, podemos asumir que cada valor de la coalición es un “jugador”. Bajo este supuesto, los Valores de Shapley o Shapley Values nos indicarán cómo distribuir equitativamente el “pago” entre los jugadores.
Un ejemplo de uso de los Shapley Values
Imagina que has entrenado un modelo de aprendizaje automático para predecir los precios de unos apartamentos. Y que para un determinado apartamento, el modelo de Machine Learning predice 300.000 euros y tienes que explicar esta predicción. El apartamento tiene una superficie de 50 m2, está situado en la 2ª planta, tiene un parque cerca y los gatos están prohibidos.

Si la predicción media de todos los pisos es de 310.000 euros, ¿cómo podemos saber cuánto ha contribuido a la predicción cada una de estas características?
La respuesta es muy sencilla para un modelo de regresión lineal. El efecto de cada característica es el peso de la característica multiplicado por el valor de la misma. Sin embargo, para modelos más complejos, para modelos de Machine Learning, necesitamos otra solución. Podemos utilizar modelos de interpretabilidad como LIME o SHARP, o podemos utilizar los valores de Shapley.
Para poder aplicar los Shapley Values a este caso, debemos hacer las siguientes asunciones:
- El “juego” es la tarea de predicción para un solo registro del conjunto de datos.
- La “ganancia” es la predicción real para este registro menos la predicción media de todas las instancias.
- Los “jugadores” son las características de cada registro que colaboran para recibir la ganancia.
Nuestro objetivo en este caso es explicar la diferencia entre la predicción real (310.000 euros), en este caso la media por apartamento, y la predicción obtenida para el caso de estudio (300.000 euros), en este caso el apartamento de 50 m2, situado en 2ª planta, con un parque cerca, donde los gatos están prohibidos.
Una respuesta podría ser: el parque-cercano
contribuyó con 30.000 euros; el área-50
contribuyó con 10.000 euros; el piso-2º
contribuyó con 0 euros; el gato-prohibido
contribuyó con -50.000 euros. Todas las contribuciones suman -10.000 euros, justo el resultado de la predicción final de nuestro apartamento menos el precio medio (precio esperado) de los apartamentos.
Deja una respuesta