martes, 25 de diciembre de 2018

4. Representatividad

Muestreo estratificado.

Una muestra es representativa de la población cuando en ella podemos encontrar las mismas proporciones de las características de estudio que en el conjunto de la población. El proceso de elegir una muestra, a qué individuos elegimos como representantes de la población, es el punto importante y de ello va a depender que el estudio sea útil o no (representativo o no).

Elegir bien la muestra no es sinónimo de representatividad, pero elegirla mal casi si es sinónimo de no representatividad.

Por ejemplo, si queremos estudiar el poder adquisitivo de una población, y solo elegimos a individuos de una determinada zona, o principalmente de una determinada zona, la muestra con toda seguridad no será representativa. La muestra se ha de elegir tomando muestras de individuos proporcionales a la población de cada zona. Este tipo de muestreo, escogiendo un reparto proporcional a los estratos, se llama estratificado.

Para verlo con un ejemplo real, imaginemos que queremos estudiar el poder adquisitivo medio de los españoles. Según la zona de España, los habitantes reciben de media una renta superior o inferior comparado con otra zona. Según un estudio estadístico de los declarantes del Impuesto sobre la Renta de las Personas Físicas por municipios de 2016 (ver estudio), los municipios con mayores rentas se encuentran en Cataluña y Madrid, mientras que los que tienen menor renta pertenecen a Extremadura y Andalucía. Por lo que si no escogemos proporcionalmente los estratos de la muestra, no realizaremos correctamente el estudio del poder adquisitivo. Viendo la imagen siguiente, imagina que seleccionamos para la muestra 12.000 personas de la provincia de Almería y 6.000 de Madrid para nuestro estudio, éste no sería un ejemplo de muestreo estratificado. 


"Densidad población España" by Mortadelo2005 - CC BY-3.0 (2018)

(El mapa con la densidad de población es a nivel ilustrativo. Hay que tener en cuenta que la densidad de población es una medida calculada a partir de la superficie de la región y el número de habitantes. Para el ejemplo expuesto entre Almería y Madrid la comparación es correcta puesto que la superficie en km2 es similar en ambas)

Sesgo. Muestreo Aleatorio.

Sesgo. Se dice que la muestra está sesgada cuando hay diferencia entre los datos de la muestra y los datos de toda la población. 

Ejemplo: llamadas telefónicas voluntarias. Estas encuentras tienen varias fuentes de sesgo. Hay familias que no tienen teléfono, el coste de la llamada no todo el mundo está dispuesto a asumirlo. Pero sobre todo, el factor de respuesta voluntaria, los encuestados se auto-seleccionan. Suelen contestar aquello con una fuerte opinión negativa sobre el tema. El enojo les anima a participar.

Muestreo aleatorio total. A diferencia del estratificado, que guarda las proporciones, esta forma de elegir la muestra considera a toda la población y elige individuos aleatoriamente. Se considera una buena forma de proceder.

En el ejemplo que hemos visto anteriormente del estudio del poder adquisitivo medio de los españoles, no se tendría en cuenta el número de habitantes de las zonas de España para seleccionar la muestra, sino que seleccionaríamos las personas al azar sin tener en cuenta a qué zona pertenecen.

No hay comentarios:

Publicar un comentario