El coeficiente de Gini fue creado un estadístico italiano que decidió darle a esta medida su propio nombre (Corrado Gini). Se trata de un cálculo estadístico que se utiliza para medir la desigualdad en una distribución, aunque su uso más conocido en el mundo es el de medir la desigualdad entre los salarios (por ejemplo, entre los empleados de una empresa).
El coeficiente de Gini es un número entre 0 y 1:
- Donde 0 se identifica como la igualdad perfecta (todos tienen los mismos ingresos).
- Y donde 1 es el valor que se corresponde con la perfecta desigualdad (una persona tiene todos los ingresos y los demás ninguno).
Vamos a ver como calcular el Coeficiente de Gini en R
Podemos calcular el Índice de Gini en R de forma muy sencilla, gracias a la fórmula predefinida que podemos encontrar en la librería reldist. Instalar una librería en R por primera vez es muy sencillo, te lo explico aquí.
Vamos a instalar y cargar esta libreria, así vemos el formato de la fórmula de Gini:
library(reldist)
gini(x, n = rep(1, length(x)), unbiased = TRUE,
conf.level = NA, R = 1000, type = "bca", na.rm = FALSE)
No es necesario rellenar todos los componentes de la fórmula. Por ejemplo, vamos a calcular el Gini en R para una variable tipo vector.
x <- c(541, 1463, 2445, 3438, 4437, 5401, 6392, 8304, 11904, 22261)
gini (x)
[1] 0.4620911
Vamos a ver ahora algunos ejemplos de cálculo del Índice de Gini utilizando R para la distribución de salarios en una empresa:
1 persona con 1.000€ de salario 1 persona con 1.500€ de salario 1 persona con 2.000€ de salario 1 persona con 2.500€ de salario 1 persona con 3.000€ de salario
sueldos <- c(1000,1500,2000,2500,3000)
frec <- c(1,1,1,1,1,1)
gini(sueldos, frec)
[1] 0.1666667
Tenemos una empresa con solo 5 empleados, donde todos tienen salarios relativamente cercanos… por tanto, existe bastante igualdad entre los salarios de la misma, y por eso estamos ante un Índice Gini relativamente bajo.
1.000 personas con 10€ de salario 100 personas con 100€ de salario 10 personas con 200€ de salario 1 persona con 100.000€ de salario
sueldos <- c(10,100,200,100000)
frec <- c(1000,100,10,1)
gini(sueldos, frec)
[1] 0.8999277
Como vemos en este segundo ejemplo, el Coeficiente Gini se dispara hasta casi 0.9 (recordemos que el valor máximo es 1). Esto es debido a que hay una sola persona en la empresa que está ganando prácticamente todo el dinero que la empresa gasta en salarios.
Oreste Bruno dice
Muchas gracias!!
Javier dice
Gracias a ti! Siempre es un placer leerte.
Adriano dice
Hola, qué pasa si tengo datos faltantes? cuál sería el comando para que omita esos datos?. Gracias.