Tau de Kendall (I)

3 min

Es una medida de dependencia no paramétrica que identifica los pares concordantes y discordantes de dos variables. Una vez identificados, se calculan los totales y se hace el cociente.

Las correlaciones clasificadas son una alternativa no paramétrica como medida de dependencia entre dos variables cuando no podemos aplicar el coeficiente de correlación de Pearson.

En otras palabras, asignamos una clasificación a las observaciones de cada variable y estudiamos la relación de dependencia entre dos variables dadas. Hay dos maneras de calcular la Tau de Kendall; nosotros optamos por calcular la relación de dependencia una vez ordenadas las observaciones de cada variable. En nuestro ejemplo, veremos que hemos ordenado en orden ascendente las clasificaciones de la columna X.     

Matemáticamente,

Definimos:

Cn = número total de pares concordantes.

NCn = número total de pares no concordantes (discordantes).

Procedimiento y ejemplo práctico

Para obtener la Tau de Kendall, primeramente debemos saber identificar los pares concordantes y discordantes de dos variables.

Utilizaremos las preferencias de los esquiadores. En este ejemplo suponemos que queremos evaluar si los esquiadores clasifican en el mismo orden sus preferencias para realizar esquí alpino o esquí nórdico en una estación i. Sus valoraciones pueden ir desde 1 (muy preferible) hasta 7 (muy poco preferible).

Nuestra pregunta sería: ¿existe dependencia entre las preferencias de los esquiadores aficionados al esquí alpino y los esquiadores aficionados al esquí nórdico en las estaciones de esquí dadas?

Definimos:

X = valoración de los esquiadores para realizar esquí alpino en la estación i.

Y = valoración de los esquiadores para realizar esquí nórdico en la estación i.

C = pares concordantes.

NC = pares no concordantes/discordantes.

Ei = estación de esquí i.

Procedimiento

  • Partimos de una muestra de n=7 observaciones de estación de esquí. Cada fila de la tabla son clasificaciones que dan los esquiadores. Cada par de estaciones puede ser concordante o discordante. En las columnas C y NC sólo contabilizamos los pares en un sentido. Por ejemplo, el par AB y BA se contabilizan como uno solo par para evitar repeticiones.

Las observaciones obtenidas son:

Estación de esquí (i) X Z
A 1 1
B 2 3
C 3 4
D 4 2
E 5 7
F 6 6
G 7 5
  1. Hemos ordenamos de forma ascendente los elementos de la columna X para poder compararlos con los elementos de la columna Z
  2. Encontramos los pares concordantes y los pares discordantes.
Estación de esquí (i) X Z   CNC
A 1 1 6 0
B 2 3 5 0
C 3 4 5 1
D 4 2 4 0
E 5 7 4 1
F 6 6 4 1
G 7 5 43 3 Total
  • Primeramente nos fijamos en la columna Z dado que la columna X ya está ordenada en orden ascendente. En consecuencia, todas las clasificaciones en la columna Z que no sean ascendentes serán pares de estaciones discordantes.
    • Cuando busquemos pares de estaciones (concordantes y no concordantes) nos sobrará siempre la última fila de las observaciones debido a que buscamos pares (conjuntos de dos observaciones).
    • Serán pares concordantes todos los que estén por debajo de una clasificación de referencia. En el primer caso, ambos esquiadores establecen esa clasificación de referencia en 1. Todas las clasificaciones por debajo de 1 serán pares concordantes con A. En total tenemos 7 estaciones para clasificar. Entonces, habrá 6 pares concordantes de A. Como no tenemos pares discordantes asociados a A, pondremos un cero.

Leer segunda parte de la Tau de Kendall (II)