Sesgo en la recolección de datos

3 min

El sesgo en la recolección de datos ocurre cuando seleccionamos de manera errónea los sujetos que pertenecerán a la muestra aleatoria objeto del análisis.

El problema lo tenemos cuando esa selección hace que la muestra aleatoria no sea representativa de la población estadística. Y por tanto cualquier resultado que saquemos de la muestra está sesgado, y no podríamos afirmar que se cumpliese en la población analizada.Dentro de este sesgo, podemos diferenciar distintos tipos, que pasamos a explicarlos a continuación.

Sesgo de supervivencia

Se produce cuando se excluyen datos del análisis porque ya no existen en el momento de realizar el análisis.

Es decir, que sólo nos centramos en los datos que existen y descartamos los que existían anteriormente en la población. En la práctica hay muchos ejemplos de este tipo de sesgo. Uno de ellos es realizar encuestas sólo a los clientes de una compañía descartando a los potenciales clientes. Otro sería evaluar el comportamiento de índices bursátiles eliminando del análisis a las empresas que estaban y ya no están en ese índice.

La solución a este sesgo es muy simple. Realizar el estudio con todos los datos, los existentes y los que existían anteriormente.

Sesgo de anticipación

Ocurre cuando se realiza un análisis usando datos que no están disponibles en el momento del mismo. Un ejemplo sería hacer un análisis de la relación del precio de una acción con alguna variable del balance financiero. El precio de la acción es una variable dinámica de la cual si disponemos información correcta en el momento del análisis. Sin embargo, las variables establecidas en el balance son estáticas y por tanto, deberíamos esperar a la publicación de estados financieros para ese análisis.

Imaginemos que queremos estudiar la relación entre el precio y el patrimonio neto de una serie de empresas al final del año fiscal. En este caso, no dispondremos del dato de patrimonio neto hasta la publicación de los estados financieros. Publicación que se suele dar un par de meses después del final del año fiscal.

Por lo cual, una solución a este sesgo seria esperar a la publicación de los estados financieros. Y realizar el análisis con los datos publicados junto con el precio en el momento de la publicación.

Sesgo de periodo de tiempo

Este sesgo ocurre cuando el periodo seleccionado para los datos es demasiado corto o demasiado largo.Si es demasiado corto, el análisis podría reflejar unos resultados específicos que sólo se cumplen para ese periodo. Es decir, que no serían representativos para un periodo de tiempo superior.

Imaginemos un periodo de tiempo de cinco años donde las pequeñas compañías han superado a las grandes empresas en bolsa. De aquí podríamos sacar la conclusión de que en el futuro las pequeñas compañías siempre superarán a las grandes. Pero para un periodo de tiempo tan reducido no se pueden sacar tales conclusiones. Debido sobre todo a que en periodos de tiempo más largos podría cambiar la situación. Por tanto, los resultados obtenidos están sesgados a este periodo de tiempo reducido.