Datos sesgados

Los datos pueden estar “sesgados”, lo que significa que tienden a tener una cola larga en un lado u otro:

data skewed left data no skew data skewed right
Inclinación negativa Sin sesgo Inclinación positiva
skewed distribution negative

¿Inclinación negativa?

¿Por qué se llama sesgo negativo ? Porque la larga “cola” está en el lado negativo del pico.

La gente a veces dice que está “sesgada a la izquierda” (la larga cola está en el lado izquierdo)

La media también está a la izquierda del pico.

La distribución normal no tiene sesgo

A Distribución normal no está sesgada.

Es perfectamente simétrico.

Y la media está exactamente en el pico.

 

normal distribution with mean median mode at center

Inclinación positiva

 

Y positivo sesgo es cuando la cola larga está en el lado positivo del pico, y algunas personas dicen que está “sesgada a la derecha”.

 

La media está a la derecha del valor máximo.

 

skewed distribution
income distribution

Ejemplo: distribución de ingresos

Aquí hay algunos datos extraídos de un censo reciente.

Como puede ver, está positivamente sesgado … de hecho, la cola continúa más allá de los $ 100,000

Cálculo de la inclinación

Se puede calcular la “inclinación” (la cantidad de inclinación), por ejemplo, puede usar la función SKEW () en Excel u OpenOffice Calc.