Kategorier: Alle - estadística - distribución - asimetría - transformación

af sonic373 sonic373 4 år siden

1232

Estadística

Statistikk spelar ei nøkkelrolle i å analysere og forstå data. Det handlar om å samle, tolke og presentere data for å beskrive eigenskapane til ei datamengde. Ein viktig del av statistikk er å forstå fordelingar, både teoretiske og reelle, og korleis data grupperer seg innanfor desse.

Estadística

Se dedica a analizar, resumir, interpretar y presentar resultados con el fin de describir apropiadamente las diversas caracteristicas de un conjunto de datos

Con junto de técnicas que a partir de datos de una muestra infieren parámetros a una población.

Estadística

Distribución estadística

Distribución teórica
Distibución real
Los datos tienden a agruparse siguiendo una distribución

La estadística se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variable e incertidumbre sea una causa intrínseca de los mismos, asi como realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones

Estadistica inferencial

Transformaciones no lineales
Transformación logarítmica f(x)=ln(x)
Transformación f(x)= 1/x
Transformación f(x)=x^2
Elección de la muestra depende de
Análisis de las conclusiones
Análisis de los datos
Recolección de datos
Diseño del experimento
Planteamiento del problema

Conceptos

Clasificación de la variable no excluyentes
Según el tratamiento del SOFT INFORMÁTICO

Alfanumérica

Los datos son almacenados como caracteres, números y letras

Numérica

Los datos son almacenados como números

Según su naturaleza

Cualitativa

Ordinal

Establecen un orden entre las categorías

Condición física de una persona: Alta, media, baja

Grado jerárquico de una escuela: Director, Vice director, Regente, Preceptores

Escolaridad: Primaria, secundaria, universitaria

Nominal

Mutuamente excluyentes, no asignan un orden o jerarquía

Color: Azul, blanco, negro, rojo...

Sexo: Hombre, Mujer

Grupo sanguíneo: A, B, AB, O

Cuantitativa

Según su nivel de medición

De razón

Existe un intervalo numérico. El cero no significa la ausencia del valor.

N° de empleados en una empresa

N° de accidentes con víctimas ocurrido en una ciudad en un día

N° de hijos: 0,1,2...

Intervalar

Establecen un orden determinado por un intervalo numérico. El cero no significa la ausencia del valor.

Coeficiente intelectual

Temperatura

Puntuación en una prueba de matemáticas

Dato
Fuente de datos secundaria

Los datos fueron producidos por otros investigadores o instituciones y son utilizados como insumos para la propia investigación.

Fuente de datos primaria

Los datos son producidos por el propio investigador a través de la aplicación de diferentes técnicas de recolección de datos.

Valor, categoría o modalidad

Sistema de categorías

Exclusión mutua

Esta condición se cumple cuando se define sin ambigüedad a cada una de las categorías de una variable. 

Lugar de nacimiento en la provincia de Mendoza: Godoy Cruz, San Martín, Luján de Cuyo

Exhaustividad

Esta condición se cumple cuando el sistema de categorías comprende a todos los valores posibles que podría tomar la variable en función de su naturaleza.

Ejemplos

Puntos Cardinales: Norte, Sur, Este, Oeste

Estado en que se encuentra la variable en el momento de ser medida (posibles estados que puede tomar la variable)

Censo
Recopilación de datos sobre todos los elementos que componen a una población estadística.

Indec

Muestra
Estadístico o Estadígrafo

Función definida sobre los valores observados de una muestra

Marco muestral

listado de todas las unidades de muestreo disponibles

Ejemplos: padrón electoral, guía telefónica, censo de habitantes, socios de un club u obra social.

No probabílísticas

Depende del proceso de toma de decición de una persona (decisiones subjetivas tienden a ser sesgadas)

Probabilísticas

Tienen la misma posibilidad de ser escogidos

Muestra Chica

Menor a 30

Muestra Grande

Igual o mayor a 30

Población
Parámetro

Función definida sobre los valores numéricos de características de una población

Unidad de muestreo

cada uno de los elementos que comprende la base de la muestra

Unidad de análisis

Entidad principal que se esta analizando en el estudio es el "que" se esta estudiando o a "quien" se está estudiando

Entidad principal que se esta analizando. Ejemplo: personas, familias, escuelas, casas, etc.

Estadística descriptiva

Gráficos
Cajas y bigotes (boxplot)

Introducción de los datos

Da una visión de los datos global

Datos atípicos (outlets)

Se dice atípico si es menor que Bigote inferior o mayor que bigote superior

Ojiva

se obtiene generando primero el histograma de frecuencias acumuladas

Polígono de frecuencia

se obtiene generando primero el histograma

Histogramas

Para variables cuantitativas continuas o discretas agrupadas.

Grafico de sectores

Para variable cualitativa

Grafico de barras

Para variables cualitatias y variables cuantitativas, por ejemplo:

Estadística descriptiva bivariada
Variables bidimencionales

Tablas de doble estrada

ejemplo: 60 chicos de una escuela los cuales 30 son chicas y 30 son chicos, algunos de ellos juegan al tenis y otros no practican este deporte.

Coeficiente de correlación de Pearson

Indica la intensidad de la relacion

RELACION LINEAL MUY FUERTE entre las variables: r próximo a 1 VARIABLES INCORRELADAS, no existe relacion: r próximo a 0

Propiedades: _Adimensional _Toma valores entre -1 y 1

Covarianza

medida de variabilidad conjunta de dos variables numéricas (cuantitativa)

Sxy>0 relacion lineal directa Sxy relacion lineal inversa

Diagrama de dispersión

Medidas descriptivas
Medidas de forma de distribución

Curtosis

Curva platicurtica (curtosis<0) Curva mesocúrtica (curtosis=0) Curva leptocúrtica (curtosis>0)

Asimetría

Asimetría <0 (asimetría negativa) Asimetría = 0 (simétrica) Asimetría >0 (asimétrica positiva)

Medidas de dispersión

Coeficiente de variación

desviacion estandar

Varianza: mide la dispersión de los valores respecto a un valor medio.

Rango

Diferencia entre el máximo y el mínimo

Mínimo

Maxímo

Medidas de poisson

Rango intercuartiíico

Diferencia entre el tercer cuartil y el primer cuartil

Deciles

Divide la distibución en diez partes

Quintiles

Divide la distribución en cinco partes

Percentiles

Divide a la distribución en cien partes

Cuartiles

Q3

75% de los datos se encuentran a la izquierda y 25% a la derecha

Q2

Es igual a la mediana deja el 50% de los datos a la derecha y el otro 50% de la izquierda

Q1

25% de los datos a la izquierda y el 75% a la derecha

Medidas de tendencia central

Media recortada

Al total de los datos se le quitan cierto porcentaje de los valores extremos superiores e inferiores

Mediana

valor que divide al conjunto ordenado de datos en dos subconjuntos con la misma cantidad de elementos.

Media

es el promedio de los valores que presenta el conjunto de datos

Moda

Es el valor que registra la mayor frecuencia absoluta

Polimodal

Más de 2 modas

Bimodal

2 modas

Unimodal

Una sola moda

Distribucion de frecuencia

conjunto de puntuaciones ordenadas en sus respectivas categorías o valores.

distribución de frecuencias agrupadas

1ºSe obtiene el mínimo, máximo valor y se calcula: _ el rango _longitud del intervalo (k) _intervalo de clase 2ºLimite inferior 3ºMarca de clase 4ºSe calculan frecuencias como en la tabla simple

Distribucion de frecuencias simples

1ºSe odenan los datos de menor a mayor 2ºse calcula frecuencia absoluta 3ºFrecuencia absoluta acumulada 4ºFrecuencia relativa 5ºFrecuencia relativa acumulada