• Saltar al contenido principal
  • Saltar a la barra lateral principal

Estadísticamente

Aprende Estadística, R y Python

  • Contacto
  • Newsletter

Coeficiente de Gini en R (Índice Gini en R)

17 junio, 2020 por Javier Mendoza 3 comentarios

El coeficiente de Gini fue creado un estadístico italiano que decidió darle a esta medida su propio nombre (Corrado Gini). Se trata de un cálculo estadístico que se utiliza para medir la desigualdad en una distribución, aunque su uso más conocido en el mundo es el de medir la desigualdad entre los salarios (por ejemplo, entre los empleados de una empresa).

El coeficiente de Gini es un número entre 0 y 1:

  • Donde 0 se identifica como la igualdad perfecta (todos tienen los mismos ingresos).
  • Y donde 1 es el valor que se corresponde con la perfecta desigualdad (una persona tiene todos los ingresos y los demás ninguno). 

Vamos a ver como calcular el Coeficiente de Gini en R

Podemos calcular el Índice de Gini en R de forma muy sencilla, gracias a la fórmula predefinida que podemos encontrar en la librería reldist. Instalar una librería en R por primera vez es muy sencillo, te lo explico aquí.

Vamos a instalar y cargar esta libreria, así vemos el formato de la fórmula de Gini:

library(reldist)
gini(x, n = rep(1, length(x)), unbiased = TRUE,
     conf.level = NA, R = 1000, type = "bca", na.rm = FALSE)

No es necesario rellenar todos los componentes de la fórmula. Por ejemplo, vamos a calcular el Gini en R para una variable tipo vector.

x <- c(541, 1463, 2445, 3438, 4437, 5401, 6392, 8304, 11904, 22261)

gini (x)
[1] 0.4620911

Vamos a ver ahora algunos ejemplos de cálculo del Índice de Gini utilizando R para la distribución de salarios en una empresa:

1 persona con 1.000€ de salario
1 persona con 1.500€ de salario
1 persona con 2.000€ de salario
1 persona con 2.500€ de salario
1 persona con 3.000€ de salario
sueldos <- c(1000,1500,2000,2500,3000)
frec <- c(1,1,1,1,1,1)
 
gini(sueldos, frec)
[1] 0.1666667

Tenemos una empresa con solo 5 empleados, donde todos tienen salarios relativamente cercanos… por tanto, existe bastante igualdad entre los salarios de la misma, y por eso estamos ante un Índice Gini relativamente bajo.

1.000 personas con 10€ de salario
100 personas con 100€ de salario
10 personas con 200€ de salario
1 persona con 100.000€ de salario
sueldos <- c(10,100,200,100000)  
frec <- c(1000,100,10,1)       

gini(sueldos, frec)
[1] 0.8999277

Como vemos en este segundo ejemplo, el Coeficiente Gini se dispara hasta casi 0.9 (recordemos que el valor máximo es 1). Esto es debido a que hay una sola persona en la empresa que está ganando prácticamente todo el dinero que la empresa gasta en salarios.

Publicado en: Estadística, Programar en R

Interacciones con los lectores

Comentarios

  1. Oreste Bruno dice

    18 junio, 2020 a las 00:06

    Muchas gracias!!

    Responder
    • Javier dice

      18 junio, 2020 a las 17:47

      Gracias a ti! Siempre es un placer leerte.

      Responder
  2. Adriano dice

    9 agosto, 2021 a las 16:43

    Hola, qué pasa si tengo datos faltantes? cuál sería el comando para que omita esos datos?. Gracias.

    Responder

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

· Javi Mendoza © 2022 ·