¿Qué son las estadísticas no paramétricas?
Las estadísticas no paramétricas se refieren a un método estadístico en el que no se supone que los datos provienen de modelos prescritos que están determinados por una pequeña cantidad de parámetros; ejemplos de tales modelos incluyen el modelo de distribución normal y el modelo de regresión lineal. Las estadísticas no paramétricas a veces usan datos ordinales, lo que significa que no se basan en números, sino en una clasificación u orden de clases. Por ejemplo, una encuesta que transmita las preferencias de los consumidores, desde gustos hasta disgustos, se consideraría información ordinal.
Las estadísticas no paramétricas incluyen estadísticas descriptivas no paramétricas, modelos estadísticos, inferencia y pruebas estadísticas. No se especifica la estructura del modelo de los modelos no paramétricos. primero sino que está determinada por los datos. El término no paramétrico no pretende implicar que tales modelos carezcan de parámetros por completo, sino que el número y la naturaleza de los parámetros son flexibles y no están fijados de antemano. Un histograma es un ejemplo de una estimación no paramétrica de una distribución de probabilidad.
Puntos clave
- Las estadísticas no paramétricas son fáciles de usar, pero no ofrecen la precisión milimétrica de otros modelos estadísticos.
- Este tipo de análisis suele ser más adecuado cuando se considera el orden de algo, donde incluso si los datos numéricos cambian, los resultados probablemente seguirán siendo los mismos.
Comprensión de las estadísticas no paramétricas
En estadística, las estadísticas paramétricas incluyen parámetros como la media, la desviación estándar, la correlación de Pearson, la varianza, etc. Esta forma de estadística utiliza datos observados para estimar los parámetros de la distribución. En las estadísticas paramétricas, a menudo se supone que los datos provienen de una distribución normal con parámetros desconocidos μ (media de la población) y σ2 (varianza de la población), que luego se estiman utilizando la media de la muestra y la varianza de la muestra.
Las estadísticas no paramétricas no hacen suposiciones sobre el tamaño de la muestra o si los datos observados son cuantitativos.
Las estadísticas no paramétricas no asumen que los datos provienen de una distribución normal. En cambio, la forma de la distribución se estima bajo esta forma de medición estadística. Si bien hay muchas situaciones en las que se puede suponer una distribución normal, también hay algunos escenarios en los que el proceso real de generación de datos es cualquier cosa menos una distribución normal.
Ejemplos de estadísticas no paramétricas
En el primer ejemplo, considere a un analista financiero que quiere estimar el valor en riesgo (VaR) de una inversión. El analista recopila datos de ganancias de cientos de inversiones similares durante un horizonte de tiempo similar. En lugar de suponer que los ingresos siguen una distribución normal, utilizan el histograma para estimar la distribución de forma no paramétrica. Por lo tanto, el percentil 5 de este histograma proporciona al analista una estimación no paramétrica del VaR.
Para un segundo ejemplo, considere a otro investigador que quiere saber si las horas promedio de sueño están relacionadas con la frecuencia con la que se enferma. Dado que muchas personas rara vez se enferman, si es que lo hacen, y otras ocasionalmente se enferman con mucha más frecuencia que la mayoría, la distribución de la frecuencia de la enfermedad claramente no es normal, está sesgada hacia la derecha y es propensa a valores atípicos. Por lo tanto, en lugar de usar un método que asume una distribución normal para la frecuencia de la enfermedad, como es el caso, por ejemplo, en el análisis de regresión clásico, el investigador decide usar un método no paramétrico como el análisis de regresión por cuantiles.
Consideraciones Especiales
Las estadísticas no paramétricas han ganado popularidad debido a su facilidad de uso. A medida que se alivia la necesidad de métricas, los datos se vuelven más aplicables a una variedad más amplia de pruebas. Este tipo de estadística se puede utilizar sin la media, el tamaño de la muestra, la desviación estándar o la estimación de otros parámetros relacionados cuando no se dispone de esta información.
Debido a que las estadísticas no paramétricas hacen menos suposiciones sobre los datos de muestra, su aplicación es más amplia que las estadísticas paramétricas. En los casos en que las pruebas paramétricas sean más apropiadas, los métodos no paramétricos serán menos eficientes. Esto se debe a que las estadísticas no paramétricas descartan parte de la información disponible en los datos, a diferencia de las estadísticas paramétricas.