¿Qué son las estadísticas descriptivas?
Las estadísticas descriptivas son coeficientes informativos breves que resumen un conjunto de datos determinado, que puede ser una representación de toda la población o una muestra de una población. Las estadísticas descriptivas se dividen en medidas de tendencia central y medidas de variabilidad (spread). Las medidas de tendencia central incluyen la media, la mediana y la moda, mientras que las medidas de variabilidad incluyen la desviación estándar, la varianza, las variables mínima y máxima, la curtosis y la asimetría.
Puntos clave
- Las estadísticas descriptivas resumen o describen las características de un conjunto de datos.
- La estadística descriptiva consta de tres categorías básicas de medidas: medidas de tendencia central, medidas de variabilidad (o dispersión) y distribución de frecuencia.
- Las medidas de tendencia central describen el centro del conjunto de datos (media, mediana, moda).
- Las medidas de variabilidad describen la dispersión del conjunto de datos (varianza, desviación estándar).
- Las medidas de distribución de frecuencias describen la presencia de datos dentro del conjunto de datos (recuento).
1:36
¿Qué es la estadística descriptiva?
Comprender las estadísticas descriptivas
En resumen, las estadísticas descriptivas ayudan a describir y comprender las características de un conjunto de datos específico al proporcionar breves resúmenes sobre la muestra y las medidas de los datos. Los tipos de estadística descriptiva más reconocidos son las medidas del centro: la media, la mediana y la moda, que se utilizan en casi todos los niveles de las matemáticas y la estadística. El promedio, o promedio, se calcula sumando todos los dígitos dentro del conjunto de datos y luego dividiendo por el número de dígitos dentro del conjunto.
Por ejemplo, la suma del siguiente conjunto de datos es 20: (2, 3, 4, 5, 6). El promedio es 4 (20/5). La moda de un conjunto de datos es el valor que aparece con mayor frecuencia y la mediana es el dígito ubicado en el centro del conjunto de datos. Es el dígito que separa los dígitos más altos de los dígitos más bajos dentro de un conjunto de datos. Sin embargo, hay tipos menos comunes de estadísticas descriptivas que siguen siendo muy importantes.
Las personas usan estadísticas descriptivas para reutilizar conocimientos cuantitativos difíciles de entender en un gran conjunto de datos en descripciones breves. El promedio de calificaciones (GPA) de un estudiante, por ejemplo, proporciona una buena comprensión de las estadísticas descriptivas. La idea de un GPA es que toma puntos de datos de una amplia gama de exámenes, calificaciones y calificaciones y los promedia para proporcionar una comprensión general del rendimiento académico general de un estudiante. El GPA personal de un estudiante refleja su desempeño académico promedio.
Las estadísticas descriptivas, especialmente en campos como la medicina, a menudo representan datos visualmente mediante diagramas de dispersión, histogramas, gráficos de líneas o visualizaciones de tallos y hojas.
Tipos de estadísticas descriptivas
Todas las estadísticas descriptivas son medidas de tendencia central o medidas de variabilidad, también conocidas como medidas de dispersión.
Tendencia central
Las medidas de tendencia central se enfocan en la media o valores medios de los conjuntos de datos, mientras que las medidas de variabilidad se enfocan en la dispersión de los datos. Estas dos medidas utilizan gráficos, tablas y debates generales para ayudar a las personas a comprender el significado de los datos que se analizan.
Las medidas de tendencia central describen la ubicación central de una distribución para un conjunto de datos. Una persona analiza la frecuencia de cada punto de datos en la distribución y la describe utilizando la media, la mediana o la moda, que mide los patrones más comunes del conjunto de datos que se analiza.
Medidas de variabilidad
Las medidas de variabilidad (o medidas de dispersión) ayudan a analizar qué tan dispersa está la distribución de un conjunto de datos. Por ejemplo, mientras que las medidas de tendencia central pueden dar a una persona la media de un conjunto de datos, no describen cómo se distribuyen los datos dentro del conjunto.
Entonces, si bien la media de los datos puede ser 65 de 100, aún puede haber puntos de datos tanto en 1 como en 100. Las medidas de variabilidad ayudan a comunicar esto al describir la forma y la dispersión del conjunto de datos. El rango, los cuartiles, la desviación absoluta y la varianza son ejemplos de medidas de variabilidad.
Considere el siguiente conjunto de datos: 5, 19, 24, 62, 91, 100. El rango de ese conjunto de datos es 95, que se calcula restando el número más bajo (5) del conjunto de datos del más alto (100).
Distribución
La distribución (o distribución de frecuencia) se refiere a la cantidad de veces que ocurre un punto de datos. O bien, es una medición de punto de datos que no se produce. Considere un conjunto de datos: masculino, masculino, femenino, femenino, femenino, otro. La distribución de estos datos puede clasificarse como:
- El número de hombres en el conjunto de datos es 2.
- El número de mujeres en el conjunto de datos es 3.
- El número de individuos que se identifican como otros es 1.
- El número de no hombres es 4.
Univariado versus bivariado
En estadística descriptiva, los datos univariados analizan solo una variable. Se utiliza para identificar las características de un rasgo individual y no se utiliza para analizar ninguna relación o causalidad.
Por ejemplo, imagina una habitación llena de estudiantes de secundaria. Suponga que desea recopilar la edad promedio de las personas en la sala. Este dato univariado depende de un solo factor: la edad de cada persona. Al recopilar esta información de cada persona y dividirla por el número total de personas, puede determinar la edad promedio.
Los datos bivariados, por otro lado, intentan vincular dos variables buscando correlación. Se recopilan dos tipos de datos y la relación entre las dos piezas de información se analiza en conjunto. Dado que se analizan múltiples variables, este enfoque también puede denominarse multivariado.
Digamos que todos los estudiantes de secundaria en el ejemplo anterior toman un examen de ingreso a la universidad y queremos ver si los estudiantes mayores obtienen mejores resultados que los estudiantes más jóvenes. Además de recolectar las edades de los estudiantes, necesitamos recolectar el puntaje de la prueba de cada estudiante. Luego, utilizando el análisis de datos, representamos matemática o gráficamente si existe una relación entre la edad del estudiante y los puntajes de las pruebas.
Preparar y reportar estados financieros es un ejemplo de estadística descriptiva Analizar que la información financiera para tomar decisiones sobre el futuro son estadísticas inferenciales.
Estadísticas descriptivas vs Estadísticas inferenciales
Las estadísticas descriptivas tienen una función diferente a las estadísticas inferenciales, conjuntos de datos utilizados para tomar decisiones o aplicar características de un conjunto de datos a otro.
Imagine otro ejemplo en el que una empresa vende salsa picante. La empresa recopila datos como el recuento de ventas, la cantidad promedio comprada por transacción y la venta promedio por día de la semana. Toda esta información es descriptiva, ya que cuenta una historia de lo que realmente sucedió en el pasado. En este caso, no se utiliza más que como informativo.
Digamos que la misma empresa quiere lanzar una nueva salsa picante. Recopila los mismos datos de ventas que el anterior, pero construye la información para hacer predicciones sobre cuáles serán las ventas de la nueva salsa picante. El acto de usar estadísticas descriptivas y aplicar características a un conjunto de datos diferente hace que el conjunto de datos sea una estadística inferencial. Ya no estamos simplemente resumiendo los datos; lo estamos usando para predecir lo que sucederá con respecto a un cuerpo de datos completamente diferente (el nuevo producto de salsa picante).
¿Qué es la estadística descriptiva?
La estadística descriptiva es un medio para describir las características de un conjunto de datos mediante la generación de resúmenes sobre las muestras de datos. A menudo se representa como un resumen de los datos que se muestran, lo que explica el contenido de los datos. Por ejemplo, un censo de población podría incluir estadísticas descriptivas sobre la proporción de hombres y mujeres en una ciudad específica.
¿Cuáles son ejemplos de estadísticas descriptivas?
Las estadísticas descriptivas son informativas y están destinadas a describir las características reales de un conjunto de datos. Al analizar los números de la temporada anterior de Major League Baseball, las estadísticas descriptivas incluyen el promedio de bateo más alto para un solo jugador, la cantidad de carreras permitidas por equipo y el promedio de victorias por división.
¿Cuál es el objetivo principal de la estadística descriptiva?
El objetivo principal de las estadísticas descriptivas es proporcionar información sobre un conjunto de datos. En el ejemplo anterior, hay cientos de jugadores de béisbol que asisten a miles de juegos. Las estadísticas descriptivas resumen grandes cantidades de datos en varias piezas útiles de información.
¿Cuáles son los tipos de estadísticas descriptivas?
Los tres tipos principales de estadísticas descriptivas son la distribución de frecuencia, la tendencia central y la variabilidad de un conjunto de datos. La distribución de frecuencia registra la frecuencia con la que ocurren los datos, la tendencia central registra el punto central de distribución de los datos y la variabilidad en un conjunto de datos registra su grado de dispersión.
¿Se pueden usar estadísticas descriptivas para hacer inferencias o predicciones?
No. Si bien estas descripciones lo ayudan a comprender los atributos de los datos, se necesitan técnicas estadísticas inferenciales, una rama separada de las estadísticas, para comprender cómo las variables interactúan entre sí en un conjunto de datos.
La línea de fondo
Las estadísticas descriptivas se refieren al análisis, resumen e informe de hallazgos que describen un conjunto de datos. Las estadísticas descriptivas, que a menudo no son útiles para la toma de decisiones, aún tienen valor para explicar resúmenes de alto nivel de un conjunto de información, como la media, la mediana, la moda, la varianza, el rango y el recuento de la información.