Las distribuciones de muestreo constituyen una pieza importante
de estudio por varias razones. En la mayoría de los casos, la viabilidad de un
experimento dicta el tamaño de la muestra. La distribución de muestreo es
la distribución de probabilidad de una muestra de una población en lugar de
toda la población.
En
palabras más simples, supongamos que de una
determinada población tomas todas las muestras posibles de tamaño n y
calculas una estadística (por ejemplo, media) de todas las muestras. Si luego
preparas una distribución de probabilidad de esta estadística, obtendrás una
distribución de muestreo.
Las propiedades de
la distribución de muestreo pueden variar dependiendo de cuán pequeña
sea la muestra en comparación con la población. Se supone que la población
se distribuye normalmente como generalmente sucede. Si el tamaño de
la muestra es lo suficientemente grande, la distribución
de muestreo también estará cerca de lo normal.
Si éste es el caso,
entonces la distribución de muestreo puede ser totalmente determinada
por dos valores: la media y la desviación estándar. Estos dos
parámetros son importantes para calcular la distribución
de muestreo si se nos da la distribución normal de toda la población.
Distribución
de muestreo de la media y la desviación estándar
La distribución
de muestreo de la media se obtiene tomando la estadística bajo estudio de
la muestra como la media. Calcular esto significa tomar todas las muestras
posibles de tamaño n de la población de tamaño N y luego trazar la distribución
de probabilidad. Se puede demostrar que la media de la distribución de
muestreo es, de hecho, la media de la población. Sin embargo, la
desviación estándar es diferente para la distribución de muestreo en
comparación con la población. Si la población es lo suficientemente grande,
esto está dado por:
Donde σ es la
desviación estándar de la distribución de la población y σx̄ es la media de población.
Estas fórmulas son
válidas únicamente cuando la población se distribuye
normalmente. Si éste no es el caso, entonces la media y la desviación estándar
de la distribución de muestreo serán diferentes y dependerán del tipo
de distribución de la población.
La distribución
normal es una de las distribuciones de probabilidad más simples, por
lo que es muy fácil de estudiar y analizar. Podemos encontrar
fácilmente fórmulas matemáticas para las estadísticas de distribución
de muestreo que queremos encontrar.
Sin embargo, cuando
la distribución no es normal, esto puede ser muy complicado y tales
formulaciones matemáticas sencillas podrían ser difíciles de encontrar o hasta
imposibles en algunos casos. En estos casos, usamos métodos aproximados porque
encontrar el valor exacto implicará el estudio de cada muestra de tamaño n
tomada de la población, lo que es muy difícil y requiere mucho tiempo.