Física

Variable categórica: características y ejemplos


La variable categórica es la que se usa en estadística para asignar una característica o propiedad no-numérica o cualitativa a algún objeto, individuo, entidad, condición o procedimiento. Es posible definir toda clase de variables categóricas de acuerdo a cada necesidad. 

Ejemplos de variables categóricas son: color, sexo, grupo sanguíneo, estado civil, tipo de material, forma de pago o tipo de cuenta bancaria, y se utilizan mucho cotidianamente.

Las anteriores son las variables, pero sus posibles valores son cualitativos, es decir de cualidad o característica y no de una medición numérica. Por ejemplo los valores posibles para la variable sexo son: varón , hembra.

Cuando esta variable se almacena en un programa informático puede ser declarada como variable de texto y los únicos valores aceptados serán los ya nombrados: Varón , Hembra.

Sin embargo la misma variable sexo puede ser declarada y almacenada como un número entero si es que a Varón se le asigna 1 y a Hembra se le asigna el valor 2. Es por esta razón que a las variables categóricas se les denomina  a veces de tipo enumerado.

La principal característica de las variables categóricas es que a diferencia de otras variables, como las continuas y las discretas, no es posible hacer aritmética con ellas. Sin embargo se puede hacer estadística con ellas, como se verá más adelante.

Índice del artículo

Ejemplos

Obsérvese los siguientes ejemplos de variables categóricas y sus valores posibles:

Grupo_Sanguíneo, Rango de valores: A, B, AB, O

Estado_Civil, Valores Categóricos: Soltero (A), Casado (B), Viudo (C) , Divorciado (D).

Tipo_de_Material, Categorías o valores: 1=Madera, 2=Metal, 3=Plástico

-Forma_de_Pago, Valores o categorías: (1)Efectivo, (2)Débito, (3)Transferencia, (4)Crédito

En los ejemplos anteriores se ha asociado un número a cada categoría en forma completamente arbitraria. 

Pudiera pensarse entonces que esa asociación numérica arbitraria la hace equivaler a una variable cuantitativa discreta, pero no lo es puesto que no pueden hacerse operaciones aritméticas con estos números.

Para ilustrar la idea, en la variable Forma_de_Pago, la operación suma no tiene sentido:

 (1)Efectivo + (2)Débito nunca equivaldrá a (3)Transferencia

Clasificación de las variables categóricas

La clasificación se basa en si tienen o no una jerarquía implícita o si el número de resultados posibles es más de dos o dos.

Una variable categórica con un solo resultado posible no es una variable, es una constante categórica.

Categóricas nominales 

Cuando no pueden ser representadas por un número ni tienen algún orden. Por ejemplo la variable: Tipo_de_Material, tiene valores nominales (Madera, Metal, Plástico), no tienen jerarquía ni orden, aun cuando se le asigne un número arbitrario a cada respuesta o categoría.

Categóricas ordinales

Variable: Rendimiento_Académico

Valores nominales: Alto, Medio, Bajo

Aunque los valores de esta variable no son numéricos, tienen implícito un orden o jerarquía.

Categóricas binarias

Se trata de variables nominales con dos respuestas posibles, por ejemplo:

-Variable: Respuesta

-Valores nominales: Verdadero, Falso

Nótese que la variable Respuesta no tiene implícita una jerarquía y solo tiene dos resultados posibles, por lo que se trata de una variable categórica binaria.

Algunos autores llaman a este tipo variable binaria, y no la consideran perteneciente a las variables categóricas que quedan restringidas a las que tienen más de tres categorías posibles.

Estadística con variables categóricas

Se puede hacer estadística con las variables categóricas, a pesar de no ser  variables numérica o cuantitativas. Por ejemplo, para conocer la tendencia o valor más probable de una variable categórica se toma la moda.

La moda es, en este caso, el resultado o valor más repetido de una variable categórica. En las variables categóricas no es posible calcular ni la media, ni la mediana.

La media no puede calcularse porque no puede hacerse aritmética con variables categóricas. Tampoco la mediana, debido a que las variables cuantitativas o categóricas no poseen un orden o jerarquía, por lo que no es posible determinar un valor central.

Representación gráfica de las variables categóricas

Dada cierta variable categórica, se puede encontrar la frecuencia o número de veces con la que se repite un resultado de esa variable. Si esto se hace para cada resultado, entonces puede hacerse un gráfico de la frecuencia en función de cada categoría o resultado.

A continuación damos algunos ejemplos de cómo las variables categóricas pueden representarse en forma gráfica.

Ejercicios resueltos

Ejercicio 1

Una empresa tiene registros de los datos de 170 empleados. Una de las variables que está en estos registros es: Estado_Civil. Esta variable tiene cuatro categorías o valores posibles:

Soltero (A), Casado (B), Viudo (C) , Divorciado (D).

Aunque se trata de una variable no-numérica es posible saber cuántos del total de registros están en una determinada categoría y ser representados en forma de gráfico de barras, tal y como lo muestra la siguiente figura:

Ejemplo 2

Una zapatería lleva un registro de sus ventas. Entre las variables que manejan sus registros está la del color de zapato por cada modelo. La variable: 

Color_Zapato_Modelo_AW3

Es de tipo categórico y tiene cinco categorías o valores posibles. Para cada categoría de esa variable se totaliza el número de ventas y se establece el porcentaje de las mismas. Los resultados se presentan en el gráfico de la siguiente figura:

Se puede decir entonces que del modelo de zapato AW3 que está de moda, el que se vende con mayor frecuencia es el Blanco, seguido muy de cerca por el Negro

También puede decirse que con probabilidad del 70% el próximo zapato que se venda de este modelo será Blanco o Negro.

Esta información puede ser útil para la tienda al momento de realizar nuevos pedidos, o incluso pudiese aplicar descuentos en los colores menos vendidos por exceso de inventario.

Ejemplo 3

Para una cierta población de donantes de sangre, se quiere representar el número de personas que pertenecen a determinado grupo sanguíneo. Una forma gráfica de visualizar los resultados es mediante un pictograma, el cual es en el fondo una tabla.

En la primera columna se representa la variable grupo_sanguíneo y sus posibles resultados o categorías. La segunda columna tiene la representación en forma icónica o pictórica del número de personas en cada categoría. En nuestro ejemplo se usa como icono una gotita roja, cada una de las cuales representa a 10 personas.

Referencias

  1. Khan Academy. Analyzing categorical data. Recuperado de: khanacademy.org
  2. Universo fórmulas. Variable cualitativa. Recuperado de: univesoformulas.com
  3. Minitab. Que son variables categóricas, discretas y continuas. Recobrado de: support.minitab.com
  4. Tutorial Excel. Caracterización de variables. Recobrado de: help.xlslat.com.
  5. Wikipedia. Variable Estadística. Recuperado de wikipedia.com
  6. Wikipedia. Variable Categórica. Recuperado de wikipedia.com
  7. Wikipedia. Categorical Variable. Recuperado de wikipedia.com