Categorías: Todo - dados - probabilidade - gráficos

por Rodrigo Madera hace 1 año

1195

Estatística

A estatística é uma disciplina ampla que abrange várias técnicas e métodos para analisar e interpretar dados. Uma das suas principais áreas é a inferência estatística, que permite extrapolar conclusões de um subconjunto de dados para um conjunto maior.

Estatística

Estatística

Data Science

Análise Exploratória
Sumarizações
Visualizações
Manipulações
Regressão
Testes de Hipóteses
Significância Estatística
Distribuições de Probabilidade

Organização dos Dados

Como extrair informações de interesse?
Gráficos

Muitas vezes as informações contidas nas tabelas são mais facilmente visualizadas através de gráficos.

Os meios de comunicação usam diariamentegráficos dos + variados formatos para auxiliar na apresentação da informação.

Órgãos públicos e empresas usam gráficos e tabelas em documentos internos de atividades e desempenho

Histogramas

Retângulos contíguos com base nas faixas de valores da variável e com área igual à frequência relativa da respectiva faixa.

Barras

Plano cartesiano com os valores das variáveis no eixo das abcissas e as frequências no eixo das ordenadas.

Para cada valor da variável

Desenha-se uma barra com

Altura igual à frequência.

Esse tipo de gráfico se adapta

Bem a variáveis discretas ou

Qualitativas ordinais.

Disco (ou Pizza)

A tabela de frequências consiste em listar os valores possíveis das variáveis, numéricos ou não e fazer a contagem na tabela de dados brutos do número de suas ocorrências.

Seja ηi a frequência do valor i e por n a frequência total.


Para comparar com outros grupos ou conjuntos de dados devemos colocar uma coluna na tabela de frequência contendo a frequência relativa: fi = ηi/n


Ex. Tabela de Frequências para a variável Sexo


SEXO ηi fi

F 37 0,74

M 13 0,26

Total N= 50 1

Tabelas de Frequências

Definições

Quartis
75% - Q3
50% - Q2 (ou Mediana)
25% - Q1
Mediana
Frequência Acumulada

Para variáveis cujos valores possuem ordenação natural faz sentido incluirmos as frequências acumuladas ( fac ).

A frequência acumulada até um certo valor é obtida pela soma de todos os valores da variável, menores ou igual ao valor considerado.



  • UTILIDADE: ajuda a estabelecer pontos de corte
  • Tabelas de Frequência
    Variáveis
    Qualitativas (Não Numéricas)

    Nominais (Sem Ordenação)

    Quando não contém ordenação.

    Ex. Turma: A ou B

    Sexo: M ou F

    Ordinais (Ordenados)

    Têm uma ordenação natural, indicando intensidade crescente de realização:

    Ex. Tamanho: pequeno, médio, grande

    Classe social: baixa, média, alta

    Quantitativas (Numéricas)

    Contínuas (Mensurados)

    Assumem valores em intervalos de números reais, provenientes de uma mensuração.

    Ex. Peso, Altura

    Discretas (Enumerados)

    São resultante de contagem assumem, em geral, valores inteiros (conjunto finito e enumerável)

    Ex. Número de irmãos: (0,1,2,...)

    Número de defeitos: (0,1,2,000)

    Tabela de Dados Brutos

    É o conjunto de informações disponíveis, após tabulação. Contém os dados da maneira que forma coletados.

    Amostra
    Selecionando uma amostra
    População

    É o grande conjunto de dados que temos interesse,´é o alvo. Ex.: População de SP, Número de lâmpadas produzidas, todo o sangue do corpo de uma pessoa.

    Às vezes podemos acessar toda a informação, às vezes não ( razões econômicas, éticas, incontornáveis

    Áreas

    Inferência Estatística

    Técnicas que possibilitam a extrapolação, a um grande conjunto de dados, das informações e conclusões obtidas a partir de um subconjunto de valores, de dimensão muito menor.

    Teste de hipótese
    Extrapolação dos resultados
    Estimação de quantidades desconhecidas
    Probabilidade

    Teoria Matemática utilizada para se estudar a incerteza oriunda de fenômenos de caráter aleatório.

    Uma resposta correta
    Algumas poucas regras pra se calcular probabilidades
    Auto-contida Logicamente
    Estatística Descritiva

    Parte inicial, quando tomamos contato com os dados – para tirar conclusões de modo informal e rápido, observando os valores escolhidos

    (tarefa pode não ser simples – muitos dados).

    É um conjunto de técnicas destinadas a a descrever e resumir os dados a fim de tirar conclusões a respeito de características e interesses.

    Interpretações iniciais
    Consistência dos dados