Категории: Все - variabilidad - varianza - datos - desviación

по Naye bu 9 месяца назад

64

Medidas Estadísticas Univariantes

La varianza, el coeficiente de variación y la desviación típica son medidas estadísticas esenciales para evaluar la dispersión y variabilidad de un conjunto de datos. La varianza mide cuán dispersos están los valores respecto a la media, siendo sensible a los valores atípicos y utilizada tanto en contextos poblacionales como muestrales.

Medidas Estadísticas Univariantes

Medidas Estadísticas Univariantes

Medidas de Dispersión

Coeficiente de Variación
Principalmente utilizado en la comparación de la variabilidad relativa entre conjuntos de datos con diferentes escalas.
Coeficiente de variación poblacional. Coeficiente de variación muestral (ajustada por grados de libertad).
Se calcula dividiendo la desviación típica entre la media y multiplicando por 100 para expresarlo como porcentaje.
Permite comparar la variabilidad entre conjuntos de datos con diferentes unidades o escalas. Es útil cuando se desea evaluar la variabilidad en relación con el tamaño medio de los valores.
El coeficiente de variación es una medida relativa de la dispersión que compara la desviación típica con la media, expresada como un porcentaje.
Desviación Típica
Ampliamente utilizada en estadística y análisis de datos para describir la dispersión de un conjunto de datos.
Desviación típica poblacional. Desviación típica muestral (ajustada por grados de libertad).
Se obtiene tomando la raíz cuadrada de la varianza.
Expresa la dispersión en las mismas unidades que los datos originales. Más comúnmente usada y fácil de interpretar que la varianza.
La desviación típica es simplemente la raíz cuadrada de la varianza. Proporciona una medida más interpretable de la dispersión.
Varianza
Utilizada en estadística y análisis de datos para evaluar la dispersión de los valores respecto a la media.
Varianza poblacional. Varianza muestral (ajustada por grados de libertad).
Se calcula como la media de los cuadrados de las diferencias entre cada valor y la media.
Sensible a valores atípicos. Mide la variabilidad total de los datos.
La varianza es una medida de dispersión que indica cuán dispersos están los valores de un conjunto de datos respecto a la media.
Rango
Ofrece una visión rápida de la variabilidad total de un conjunto de datos.
Rango simple: Diferencia entre el máximo y el mínimo.
Se calcula restando el valor mínimo del valor máximo.
Proporciona una medida simple de la amplitud total de los datos. Sensible a valores atípicos.
El rango es la diferencia entre el valor máximo y el valor mínimo en un conjunto de datos.

Medidas de Asimetría

Análisis de Riesgo Financiero: La asimetría puede proporcionar información sobre la distribución de rendimientos. Investigación de Mercado: Evaluar la asimetría de datos de ventas o ingresos. Biología y Medicina: En estudios sobre el tamaño de órganos, donde la asimetría puede indicar posibles problemas de desarrollo.
Asimetría Positiva (Derecha): Cola más larga a la derecha. Asimetría Negativa (Izquierda): Cola más larga a la izquierda.
La asimetría se mide mediante coeficientes de asimetría, como el coeficiente de asimetría de Pearson o el coeficiente de asimetría de Fisher.
Simetría: Una distribución simétrica tiene una asimetría igual a cero. Dirección de la Cola: La asimetría positiva indica una cola más larga a la derecha, mientras que la asimetría negativa indica una cola más larga a la izquierda.
Las medidas de asimetría cuantifican la falta de simetría en una distribución de datos, es decir, la tendencia de la distribución a inclinarse hacia un lado.

Medidas de Apuntamiento

Curtosis
Curtosis Positiva (Leptocúrtica): Colas más pesadas y distribución más concentrada. Curtosis Negativa (Platicúrtica): Colas más ligeras y distribución menos concentrada.
La curtosis se mide mediante el coeficiente de curtosis, siendo cero para una distribución normal. Se puede expresar como curtosis positiva o negativa.
Distribución Normal: Una curtosis de cero indica una distribución normal. Colas de la Distribución: Curtosis positiva (leptocúrtica) significa colas más pesadas, mientras que curtosis negativa (platicúrtica) significa colas más ligeras. Importancia Relativa: La curtosis se refiere a la concentración de valores en las colas, no en el cuerpo de la distribución.
La curtosis es una medida estadística que cuantifica la forma de la distribución de un conjunto de datos, específicamente la forma y la altura de sus colas en comparación con la distribución normal.

Medidas de Posición

Percentiles
Evaluación de Rendimiento: Se utilizan en campos como la evaluación académica para clasificar el rendimiento de los estudiantes en percentiles.
Percentil P: P% de los datos por debajo.
Robustos: Menos sensibles a valores extremos que la media.
Son 99 valores que dividen un conjunto de datos ordenado en 100 partes iguales. El percentil p indica que p por ciento de los datos son iguales o inferiores a ese valor.
Deciles
Comparación de Conjuntos: Facilitan la comparación de conjuntos de datos en términos de posición y dispersión.
Primer Decil (D1): 10% de los datos por debajo. Quinto Decil (D5): 50% de los datos por debajo (equivale a la mediana). Noveno Decil (D9): 90% de los datos por debajo.
Ayudan a Identificar la Dispersión: Proporcionan información sobre la dispersión de los datos.
Son nueve valores que dividen un conjunto de datos ordenado en diez partes iguales. El primer decil (D1), el quinto decil (D5) y el noveno decil (D9) son ejemplos comunes.
Cuartiles
Análisis de Distribución de Datos: Ayudan a entender cómo se distribuyen los datos en un conjunto.
Primer Cuartil (Q1): 25% de los datos por debajo. Mediana (Q2): 50% de los datos por debajo. Tercer Cuartil (Q3): 75% de los datos por debajo.
Se calculan ordenando los datos y seleccionando los valores específicos que representan las posiciones relativas.
Representan Posiciones Relativas: Permiten dividir un conjunto de datos en partes proporcionales.
Son tres valores que dividen un conjunto de datos ordenado en cuatro partes iguales. Los cuartiles comunes son el primer cuartil (Q1), la mediana (Q2) y el tercer cuartil (Q3).

Medidas de Tendencia Central

Moda
Se utiliza en marketing, investigación de mercado y en la moda para identificar preferencias o tendencias dominantes.
Moda Simple: Unimodal, bimodal, multimodal, o sin moda.
Moda Simple: Valor más frecuente en el conjunto de datos.
Puede haber una o más modas, o incluso ninguna. No es sensible a valores extremos. Aplicable a datos cualitativos y cuantitativos.
La moda es el valor que ocurre con mayor frecuencia en un conjunto de datos.
Mediana
Empleada en estadísticas de ingresos, para describir la posición central sin verse afectada por valores extremos.
Mediana Simple: Para conjuntos de datos impares, es el valor central. Mediana Ponderada: Considera pesos en los valores antes de calcular la mediana.
Mediana Simple: Selecciona el valor medio después de ordenar los datos.
No se ve afectada por valores extremos. Útil cuando los datos están sesgados o tienen valores atípicos. No utiliza todos los valores del conjunto de datos, solo el valor central.
La mediana es el valor central en un conjunto de datos ordenados de manera ascendente o descendente. Divide el conjunto de datos en dos partes iguales.
Media
Media Aritmética: La más común, se utiliza para datos cuantitativos. Media Ponderada: Asigna pesos a diferentes valores antes de calcular la media. Media Geométrica: Útil para datos que crecen de manera exponencial.
Utilizada en finanzas, estadísticas económicas, puntuaciones académicas, etc.
Media Aritmética: Se calcula sumando todos los valores y dividiendo por el número de valores.
Sensible a todos los valores en el conjunto de datos. Puede ser afectada por valores atípicos o extremos. Se utiliza comúnmente para describir el "promedio" de un conjunto de datos.
La media es la medida de tendencia central que se obtiene sumando todos los valores de un conjunto de datos y dividiendo el resultado por el número total de valores.