¿Qué es una distribución muestral?
Una distribución de muestreo es una distribución de probabilidad de una estadística obtenida de un mayor número de muestras extraídas de una población específica. La distribución de muestreo de una población dada es la distribución de frecuencias de un rango de resultados diferentes que posiblemente podrían ocurrir para una estadística en una población.
En estadística, una población es el grupo completo del que se extrae una muestra estadística. Una población puede referirse a un grupo completo de personas, objetos, eventos, visitas al hospital o medidas. Por lo tanto, se puede decir que una población es una observación agregada de sujetos agrupados por una característica común.
- Una distribución de muestreo es una distribución de probabilidad de una estadística obtenida a través del muestreo repetido de una población específica.
- Describe un rango de resultados posibles para una estadística, como la media o la moda de una variable, de una población.
- La mayoría de los datos que analizan los investigadores son en realidad muestras, no poblaciones.
Comprensión de la distribución de muestreo
Gran cantidad de datos extraídos y utilizados por académicos, estadísticos, investigadores, especialistas en marketing, analistas, etc. en realidad son muestras, no poblaciones. Una muestra es un subconjunto de una población. Por ejemplo, un investigador médico que desee comparar el peso medio de todos los bebés nacidos en América del Norte entre 1995 y 2005 con los nacidos en América del Sur durante el mismo período de tiempo no puede obtener datos para la población total de más de un millón. diez años en un plazo razonable. En cambio, solo usarán el peso de, digamos, 100 niños, en cada continente para sacar una conclusión. El peso de 100 lactantes utilizado es la muestra, y el peso medio calculado es la media de la muestra.
Ahora suponga que en lugar de tomar una muestra única de 100 recién nacidos de cada continente, el investigador médico toma muestras aleatorias repetidas de la población general y calcula la media muestral para cada grupo de muestra. Luego, para América del Norte, recopilaron datos de 100 pesos de recién nacidos registrados en los Estados Unidos, Canadá y México de la siguiente manera: cuatro muestras de 100 de hospitales seleccionados de EE. UU., cinco muestras de 70 de Canadá y tres registros de 150 de México. , para un total de 1.200 pesos de recién nacidos agrupados en 12 conjuntos. También recopilan datos de muestra de 100 pesos al nacer de cada uno de los 12 países de América del Sur.
Cada muestra tiene su propia media muestral y la distribución de las medias muestrales se conoce como distribución muestral.
El peso medio calculado para cada conjunto de muestras es la distribución muestral de la media. No solo se puede calcular la media a partir de una muestra. Se pueden calcular otras estadísticas, como la desviación estándar, la varianza, la proporción y el rango a partir de los datos de la muestra. La desviación estándar y la varianza miden la variabilidad de la distribución de muestreo.
El número de observaciones en una población, el número de observaciones en una muestra y el procedimiento utilizado para diseñar conjuntos de muestras determinan la variabilidad de una distribución de muestreo. La desviación estándar de una distribución de muestreo se llama error estándar. Si bien la media de una distribución de muestreo es igual a la media de la población, el error estándar depende de la desviación estándar de la población, el tamaño de la población y el tamaño de la muestra.
Saber qué tan lejos está la media de cada uno de los conjuntos de muestras entre sí y de la media de la población te dará una indicación de qué tan cerca está la media de la muestra de la media de la población. El error estándar de la distribución muestral disminuye a medida que aumenta el tamaño de la muestra.
Consideraciones Especiales
Un conjunto de números de población o muestra tendrá una distribución normal. Sin embargo, debido a que una distribución de muestreo incluye múltiples conjuntos de observaciones, no necesariamente tendrá una forma de curva de campana.
Siguiendo con nuestro ejemplo, el peso medio de la población de niños en América del Norte y América del Sur tiene una distribución normal porque algunos niños tendrán un peso inferior al normal (por debajo del promedio) o con sobrepeso (por encima del promedio), y la mayoría de los niños se clasificarán en el medio (alrededor de la media). . Si el peso medio de los recién nacidos en América del Norte es de siete libras, el peso medio de la muestra en cada uno de los 12 conjuntos de observación de muestras registrados para América del Norte también estará cerca de las siete libras.
Sin embargo, si grafica cada una de las medias calculadas en cada uno de los 1200 grupos de muestra, la forma resultante puede resultar en una distribución uniforme, pero es difícil predecir con certeza cuál será la forma real. Cuantas más muestras utilice el investigador de la población de más de un millón de dígitos de peso, más empezará la gráfica a formar una distribución normal.