MUESTRAS PEQUEÑAS Y MUESTRAS GRANDES

MUESTRAS PEQUEÑAS (teoria exacta del muestreo)

Se utiliza muestras pequeñas cuando la distribución de donde proviene la muestra tenga un comportamiento normal, cuando los tamaños de las muestras fueran mayores o iguales a 30.

INTERVALO DE CONFIANZA PARA ; CON DESCONOCIDA

Si y s son la media y la desviación estándar de una muestra aleatoria de una población normal con varianza , desconocida, un intervalo de confianza de
()100% para es:

donde /2 es el valor t con = n-1 grados de libertad, que deja un área de /2 a la derecha.

Se hace una distinción entre los casos de conocida y desconocida al calcular las estimaciones del intervalo de confianza. Se debe enfatizar que para el primer caso se utiliza el teorema del límite central, mientras que para desconocida se hace uso de la distribución muestral de la variable aleatoria t. Sin embargo, el uso de la distribución t se basa en la premisa de que el muestreo se realiza de una distribución normal. En tanto que la distribución tenga forma aproximada de campana, los intervalos de confianza se pueden calcular cuando la varianza se desconoce mediante el uso de la distribución t y se puede esperar buenos resultados.

Con mucha frecuencia los estadísticos recomiendan que aun cuando la normalidad no se pueda suponer, con desconocida y n30, s puede reemplazar a y se puede utilizar el intervalo de confianza:

Por lo general éste se denomina como un intervalo de confianza de muestra grande. La justificación yace sólo en la presunción de que con una muestra grande como 30, s estará muy cerca de la real y de esta manera el teorema del límite central sigue valiendo. Se debe hacer énfasis en que esto es solo una aproximación y que la calidad de este enfoque mejora a medida que el tamaño de la muestra crece más.

Si de una población Normal con media u y desviación estándar o se extrae una muestra de tamaño n, entonces el estadístico es:  Que se distribuye como una t de Student con n-1 grados de libertad. 20 𝑡 = 𝑋 − 𝜇 𝑆 𝑛

Ejemplos:
1. El Instituto Eléctrico Edison publica cifras del número anual de
Kilowatt-hora que gastan varios aparatos eléctrodomésticos. Se afirma

que una aspiradora gasta un promedio de 46 kilowatt-hora al año. Si una

muestra aleatoria de 12 hogares que se incluye en un estudio indica que

las aspiradoras gastan un promedio de 42 kilowatt-hora al año con una

desviación estándar de 11.9 kilowatt-hora, ¿esto sugiere con un nivel de

significancia de 0.05 que las aspiradoras gastan, en promedio, menos de

46 kilowatt-hora anualmente? Suponga que la población de kilowatt-hora

es normal.

Solución:
1. Datos:
μ= 46 kilowatt-hora

s= 11.9 kilowatt-hora

x= 42 kilowatt-hora

n = 12

α = 0.05

2. Prueba de hipótesis
Ho; μ = 46 kilowatt-hora
H1; μ < 46 kilowatt-hora
3. Valores críticos
tc para 0.95 (α = 0.05)
con 11 grados de libertad
4. Regla de decisión:
Si t ≥ -1.796 No se rechaza Ho
Si t < -1.796 Se rechaza Ho

Decisión y justificación :
Como –1.16 > -1.796, por lo tanto no se rechaza Ho y se concluye con un
nivel de significancia
del 0.05 que el número promedio de kilowatt-hora
que g
astan al año las aspiradoras no es significativamente menor que 46.

A la teoría de pequeñas muestras también se le llama teoría exacta del muestreo, ya que también la podemos utilizar con muestras aleatorias de tamaño grande.

Para definir grados de libertad se hará referencia a la varianza muestral:

Esta fórmula está basada en n-1 grados de libertad (degrees of freedom). Esta terminología resulta del hecho de que si bien s2 está basada en n cantidades . . . , éstas suman cero, así que especificar los valores de cualquier n-1 de las cantidades determina el valor restante. Por ejemplo, si n=4 y

; y , entonces automáticamente tenemos , así que sólo tres de los cuatro valores de están libremente determinamos 3 grados de libertad.

Entonces, en esta unidad la fórmula de grados de libertad será n-1 y su simbología

DISTRIBUCION "t DE STUDENT"
Supóngase que se toma una muestra de una población normal con media y varianza . Si es el promedio de las n observaciones que contiene la muestra aleatoria, entonces la distribución es una distribución normal estándar. Supóngase que la varianza de la población 2 es desconocida. ¿Qué sucede con la distribución de esta estadística si se reemplaza por s? La distribución t proporciona la respuesta a esta pregunta.

La media y la varianza de la distribución t son = 0 y para >2, respectivamente.

La siguiente figura presenta la gráfica de varias distribuciones t. La apariencia general de la distribución t es similar a la de la distribución normal estándar: ambas son simétricas y unimodales, y el valor máximo de la ordenada se alcanza en la media = 0. Sin embargo, la distribución t tiene colas más amplias que la normal; esto es, la probabilidad de las colas es mayor que en la distribución normal. A medida que el número de grados de libertad tiende a infinito, la forma límite de la distribución t es la distribución normal estándar.

Propiedades de las distribuciones t

Cada curva t tiene forma de campana con centro en 0.
Cada curva t, está más dispersa que la curva normal estándar z.
A medida que aumenta, la dispersión de la curva t correspondiente disminuye.
A medida que , la secuencia de curvas t se aproxima a la curva normal estándar, por lo que la curva z recibe a veces el nombre de curva t con gl =

MUESTRAS GRANDES

Prueba de dos extremos para las medias
Es cuando el nivel de significancia (zona de rechazo) abarca los dos extremos o colas de la campana de Gauss.

EJEMPLO El fabricante de una llanta especial para camiones afirma que la duración media de la parte rodante de agarre es de 60,000 mi. La desviación estándar de los millajes es de 5,000 mi. Una empresa de transportes compró 48 llantas y halló que la duración media para sus vehículos fue de 59,500 mi. ¿Es la experiencia distinta de la expresada por el fabricante al nivel de significación de 0.05?
 = 60,000 mi
 = 5,000 mi
Datos: n = 48 llantas
= 59,500 mi
 = 0.05

Las hipótesis se expresan de la siguiente manera:

H0 :  = 60,000 mi La duración de las llantas es de 60,000 millas
H1 :   60,000 mi La duración de las llantas es distinta a 60,000 millas

Primero, vamos a calcular el error estándar de la media y para ello emplearemos la expresión del error estándar:

Recurrimos a las tablas de la distribución normal y en ellas localizamos 0.475, que se ubica en un valor de Z = 1.96
En el tercer paso, vamos a determinar los límites superior e inferior de confianza para el intervalo de la media poblacional ya que se trata de una prueba de dos extremos. Sustituyendo valores en ella, se tiene:

Lc = 60,000  1.96 (721.69)

Ls = 60,000 + 1,414.51 Ls = 61,414.51 millas.

Li = 60,000 – 1,414.51 Li = 58,585.49 millas



Entonces la media de la población fluctúa entre 58,585.49 y 61,414.51 millas en un nivel de confianza del 95%.

La media muestral se ubica dentro de la zona de aceptación, por lo que podemos decir que la hipótesis nula es verdadera, pero vamos a verificar está aseveración por medio de la expresión siguiente. Entonces la media muestral se ubica en -0.693 y se confirma que cae en la zona de aceptación.
Concluimos que la duración media de las llantas es muy cercana a la que afirma el fabricante de 60,000 millas, con un nivel de significancia de 0.05.

Bajo ciertas condiciones de regularidad, es posible construir intervalos de confianza asintóticos de una manera bastante general.

Si suponemos que un parámetro θ tiene una estimación máximo verosímil θ*, la distribución asintótica del estimador, bajo condiciones generales de regularidad, es Normal, de media el valor verdadero del parámetro θ y varianza igual a la cota de Cramér-Rao σ2(θ*).

Bajo las suposiciones anteriores, es posible construir un intervalo de confianza asintótico y con nivel de confianza (1 − α) · 100 % a partir de

donde los valores de zα/2 se calculan a partir de la distribución N(0, 1) de forma que P(|Z| > zα/2) = α.

Es decir, se utiliza como estadístico pivote