¿Cuál es el promedio winsorizado?
El promedio Winsorizado es un método de promedio que inicialmente reemplaza los valores más pequeños y más grandes con las observaciones más cercanas a ellos. Esto se hace para limitar el efecto de valores atípicos, valores atípicos extremos o valores atípicos en el cálculo.
Después de sustituir los valores, se utiliza la fórmula de la media aritmética para calcular la media winsorizada.
puntos clave
- El promedio winsorizado es un método de promediar que consiste en reemplazar los valores más pequeños y más grandes en un conjunto de datos con las observaciones más cercanas a ellos.
- Mitigue los efectos de los valores atípicos reemplazándolos con valores menos extremos.
- La media Winsorizada no es lo mismo que la media recortada, que consiste en eliminar puntos de datos en lugar de reemplazarlos, aunque los resultados de los dos tienden a ser similares.
fórmula media winsorizada
medios winsorizados
=
X
no
…
X
no
+
1
+
X
no
+
2
…
X
no
No
Dónde está:
no
=
El número de datos más grandes y más pequeños.
puntos a ser reemplazados por observación
más cerca de ellos
No
=
Número total de puntos de datos
\begin{aligned} &\text{Medios Winsorizados}\ =\ \frac{x_{n}\dots x_{n+1}\ +\ x_{n+2}\dots x_{n}}{N}\ \ &\textbf{donde:}\\ &\begin{alineado} n\ =\ &\text{El número de puntos de datos más grandes y más pequeños}\\ &\text{puntos para reemplazar con la observación}\\ &\ text{más cercano a ellos}\end{alineado}\\ &N\ =\ \text{Número total de puntos de datos} \end{alineado} medios winsorizados = NoXno…Xno+1 + Xno+2…XnoDónde está:no = El número de datos más grandes y más pequeños.puntos a ser reemplazados por observaciónmás cerca de ellosNo = Número total de puntos de datos
Los promedios winsorizados se expresan de dos formas. Una «knoLa media Winsorizada se refiere a la sustitución de las «k» observaciones más pequeñas y más grandes, donde «k» es un número entero. Una media Winsore «X%» implica sustituir un cierto porcentaje de valores de ambos extremos de los datos.
La media winsorizada se obtiene sustituyendo los puntos de datos más pequeños y más grandes, luego sumando todos los puntos de datos y dividiendo la suma por el número total de puntos de datos.
¿Qué te dice la media winsorizada?
La media winsorizada es menos sensible a los valores atípicos porque puede reemplazarlos con valores menos extremos. Es decir, es menos susceptible a valores atípicos que la media aritmética. Sin embargo, si una distribución tiene colas gruesas, el efecto de eliminar los valores más altos y más bajos de la distribución tendrá poca influencia debido al gran grado de variabilidad en las cifras de la distribución.
Una desventaja importante de los medios winsorizados es que, naturalmente, introducen cierto sesgo en el conjunto de datos. Al reducir la influencia de los valores atípicos, el análisis se modifica para un mejor análisis, pero también elimina información sobre los datos subyacentes.
Ejemplo de cómo usar medios winsorizados
Calculamos la media winsorizada para el siguiente conjunto de datos: 1, 5, 7, 8, 9, 10, 34. En este ejemplo, supongamos que la media winsorizada está en primer orden, donde reemplazamos los valores más pequeño y más grande con su observaciones más cercanas.
El conjunto de datos ahora se ve así: 5, 5, 7, 8, 9, 10, 10. Promediar aritméticamente el nuevo conjunto da una media Winsorizada de 7.7, o (5 + 5 + 7 + 8 + 9 + 10 + 10) dividido por 7. Tenga en cuenta que la media aritmética habría sido mayor: 10,6. El promedio Winsorizado reduce efectivamente la influencia del valor 34 como un valor atípico.
O considere una media winsorizada del 20 % que toma el 10 % superior y el 10 % inferior y los reemplaza con el siguiente valor más cercano. Winsorizaremos el siguiente conjunto de datos: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. Los dos i más pequeños y dos puntos de datos más grandes, el 20% de los 20 puntos de datos, se reemplazarán con el siguiente valor más cercano. Por lo tanto, el nuevo conjunto de datos es el siguiente: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61 Promedio Winsored es 33,9, o datos totales (678) divididos por el número total de puntos de datos (20).
Media winsorizada vs media truncada
El promedio Winsorizado incluye la modificación de puntos de datos, mientras que el promedio recortado da como resultado la eliminación de puntos de datos. Es común que la media winsorizada y la media recortada estén cerca o, a veces, tengan el mismo valor entre sí.