af sonic373 sonic373 4 år siden
1232
Mere som dette
Alfanumérica
Los datos son almacenados como caracteres, números y letras
Numérica
Los datos son almacenados como números
Cualitativa
Ordinal
Establecen un orden entre las categorías
Condición física de una persona: Alta, media, baja
Grado jerárquico de una escuela: Director, Vice director, Regente, Preceptores
Escolaridad: Primaria, secundaria, universitaria
Nominal
Mutuamente excluyentes, no asignan un orden o jerarquía
Color: Azul, blanco, negro, rojo...
Sexo: Hombre, Mujer
Grupo sanguíneo: A, B, AB, O
Cuantitativa
Según su nivel de medición
De razón
Existe un intervalo numérico. El cero no significa la ausencia del valor.
N° de empleados en una empresa
N° de accidentes con víctimas ocurrido en una ciudad en un día
N° de hijos: 0,1,2...
Intervalar
Establecen un orden determinado por un intervalo numérico. El cero no significa la ausencia del valor.
Coeficiente intelectual
Temperatura
Puntuación en una prueba de matemáticas
Los datos fueron producidos por otros investigadores o instituciones y son utilizados como insumos para la propia investigación.
Los datos son producidos por el propio investigador a través de la aplicación de diferentes técnicas de recolección de datos.
Sistema de categorías
Exclusión mutua
Esta condición se cumple cuando se define sin ambigüedad a cada una de las categorías de una variable.
Lugar de nacimiento en la provincia de Mendoza: Godoy Cruz, San Martín, Luján de Cuyo
Exhaustividad
Esta condición se cumple cuando el sistema de categorías comprende a todos los valores posibles que podría tomar la variable en función de su naturaleza.
Ejemplos
Puntos Cardinales: Norte, Sur, Este, Oeste
Estado en que se encuentra la variable en el momento de ser medida (posibles estados que puede tomar la variable)
Indec
Función definida sobre los valores observados de una muestra
listado de todas las unidades de muestreo disponibles
Ejemplos: padrón electoral, guía telefónica, censo de habitantes, socios de un club u obra social.
Depende del proceso de toma de decición de una persona (decisiones subjetivas tienden a ser sesgadas)
Tienen la misma posibilidad de ser escogidos
Menor a 30
Igual o mayor a 30
Función definida sobre los valores numéricos de características de una población
cada uno de los elementos que comprende la base de la muestra
Entidad principal que se esta analizando en el estudio es el "que" se esta estudiando o a "quien" se está estudiando
Entidad principal que se esta analizando. Ejemplo: personas, familias, escuelas, casas, etc.
Introducción de los datos
Da una visión de los datos global
Datos atípicos (outlets)
Se dice atípico si es menor que Bigote inferior o mayor que bigote superior
se obtiene generando primero el histograma de frecuencias acumuladas
se obtiene generando primero el histograma
Para variables cuantitativas continuas o discretas agrupadas.
Para variable cualitativa
Para variables cualitatias y variables cuantitativas, por ejemplo:
Tablas de doble estrada
ejemplo: 60 chicos de una escuela los cuales 30 son chicas y 30 son chicos, algunos de ellos juegan al tenis y otros no practican este deporte.
Coeficiente de correlación de Pearson
Indica la intensidad de la relacion
RELACION LINEAL MUY FUERTE entre las variables: r próximo a 1 VARIABLES INCORRELADAS, no existe relacion: r próximo a 0
Propiedades: _Adimensional _Toma valores entre -1 y 1
Covarianza
medida de variabilidad conjunta de dos variables numéricas (cuantitativa)
Sxy>0 relacion lineal directa Sxy relacion lineal inversa
Diagrama de dispersión
Curtosis
Curva platicurtica (curtosis<0) Curva mesocúrtica (curtosis=0) Curva leptocúrtica (curtosis>0)
Asimetría
Asimetría <0 (asimetría negativa) Asimetría = 0 (simétrica) Asimetría >0 (asimétrica positiva)
Coeficiente de variación
desviacion estandar
Varianza: mide la dispersión de los valores respecto a un valor medio.
Rango
Diferencia entre el máximo y el mínimo
Mínimo
Maxímo
Rango intercuartiíico
Diferencia entre el tercer cuartil y el primer cuartil
Deciles
Divide la distibución en diez partes
Quintiles
Divide la distribución en cinco partes
Percentiles
Divide a la distribución en cien partes
Cuartiles
Q3
75% de los datos se encuentran a la izquierda y 25% a la derecha
Q2
Es igual a la mediana deja el 50% de los datos a la derecha y el otro 50% de la izquierda
Q1
25% de los datos a la izquierda y el 75% a la derecha
Media recortada
Al total de los datos se le quitan cierto porcentaje de los valores extremos superiores e inferiores
Mediana
valor que divide al conjunto ordenado de datos en dos subconjuntos con la misma cantidad de elementos.
Media
es el promedio de los valores que presenta el conjunto de datos
Moda
Es el valor que registra la mayor frecuencia absoluta
Polimodal
Más de 2 modas
Bimodal
2 modas
Unimodal
Una sola moda
conjunto de puntuaciones ordenadas en sus respectivas categorías o valores.
distribución de frecuencias agrupadas
1ºSe obtiene el mínimo, máximo valor y se calcula: _ el rango _longitud del intervalo (k) _intervalo de clase 2ºLimite inferior 3ºMarca de clase 4ºSe calculan frecuencias como en la tabla simple
Distribucion de frecuencias simples
1ºSe odenan los datos de menor a mayor 2ºse calcula frecuencia absoluta 3ºFrecuencia absoluta acumulada 4ºFrecuencia relativa 5ºFrecuencia relativa acumulada