Histograma

professor apresenta gráfico no quadro

O que é um Histograma?

Um histograma é uma representação gráfica de distribuição de dados numéricos contínuos.
É similar a um gráfico de barras, mas agrupa os dados em intervalos (chamados de “bins” ou “classes”) e mostra a frequência de observações em cada intervalo.

O histograma é muito importante no estudo de variáveis quantitativas principalmente para variáveis contínuas, com ele podemos saber como as variáveis estão distribuídas

Por meio do histograma conseguimos calcular os quantis

Primeiro precisamos definir o número de intervalos a serem considerados, para este caso consideraremos 6 intervalos.
Vamos obter nos dados o valor mínimo e máximo.
amplitude do intervalo = (valor máximo – valor mínimo) ÷ 6
limite inferior = valor mínimo
limite superior = valor máximo
densidade da frequência = frequência relativa ÷ amplitude do intervalo
Abaixo vamos calcular no R e obter a tabela de frequência e histogramas com frequência absoluta e densidade de frequência .

Exemplo prático em R

Resultado

tabela_frequencia
histograma1_frequencia_absoluta
histograma2_densidade_frequencia

INFORMATIVO: Lembre-se no exemplo anterior a AMPLITUDES DOS INTERVALOS ERAM IGUAIS com tamanho 3866.833 km2.
ATENÇÃO: Caso o seu histograma tenha AMPLITUDES DIFERENTES a sua leitura poderá ser distorcida se forem utilizadas as frequências absolutas ou relativas.

Características Principais de um Histograma

Elementos de um Histograma

  • Eixo horizontal (x): Representa os intervalos de valores (classes)
  • Eixo vertical (y): Representa a frequência ou contagem de observações
  • Barras: Mostram a frequência em cada intervalo
  • Largura das barras: Representa a amplitude do intervalo
  • Altura das barras: Representa a frequência no intervalo

Diferenças para Gráfico de Barras

  • No histograma, as barras são adjacentes (não há espaço entre elas)
  • As categorias no eixo x são intervalos numéricos contínuos
  • Usado para dados quantitativos contínuos
  • Mostra a distribuição e forma dos dados

Técnicas de Amostragem em Pesquisa

Dona de casa selecionando uma amostra da sopa que ela preparou






Técnicas de Amostragem em Estatística

Técnicas de Amostragem em Pesquisa Estatística

A amostragem é fundamental na estatística para inferir características populacionais a partir de um subconjunto representativo. Principalmente quando o censo completo é inviável, técnicas adequadas garantem precisão e eficiência.

Principais Técnicas de Amostragem Probabilística

Amostragem Aleatória Simples

Cada elemento da população possui igual probabilidade de seleção. Similarmente, a escolha é completamente aleatória, sem qualquer critério de agrupamento. A probabilidade de seleção é dada por \(P = \frac{n}{N}\), onde n é o tamanho da amostra e N o tamanho da população.

Vantagens

  • Simplicidade de implementação
  • Requer apenas uma lista completa da população
  • Fácil compreensão teórica

Desvantagens

  • Pode não representar subgrupos importantes
  • Ineficiente para populações heterogêneas
  • Custo elevado se a população for dispersa

Amostragem Estratificada

A população é dividida em estratos homogêneos e amostras são selecionadas de cada estrato. Consequentemente, garante representatividade de todos os subgrupos relevantes. A alocação pode ser proporcional ou uniforme.

Fórmula para alocação proporcional: \(n_h = n \times \frac{N_h}{N}\) onde \(n_h\) é o tamanho da amostra no estrato h, \(N_h\) é o tamanho do estrato h, e N é o tamanho total da população.

Vantagens

  • Maior precisão para subpopulações
  • Permite análise separada por estratos
  • Reduz a variabilidade amostral

Desvantagens

  • Requer conhecimento prévio da população
  • Custo adicional de estratificação
  • Complexidade na implementação

Amostragem por Conglomerado

A população é dividida em conglomerados naturais (como bairros ou escolas) e alguns conglomerados são selecionados aleatoriamente. Todos os elementos dos conglomerados selecionados são investigados ou faz-se subamostragem.

Atenção: Os conglomerados devem ser tão heterogêneos quanto a população geral para garantir representatividade. A variância é geralmente maior que na amostragem aleatória simples.

Vantagens

  • Reduz custos de deslocamento
  • Mais prático para populações geograficamente dispersas
  • Facilita a operacionalização

Desvantagens

  • Maior erro amostral se conglomerados forem homogêneos
  • Precisão inferior à amostragem simples
  • Pode requerer tamanho amostral maior

Amostragem Sistemática

Seleciona elementos a intervalos regulares a partir de uma lista ordenada. O primeiro elemento é escolhido aleatoriamente e os demais seguem um intervalo fixo. É eficiente quando a lista não possui periodicidade.

Intervalo de amostragem: \(k = \frac{N}{n}\) onde k é o intervalo, N é o tamanho da população e n é o tamanho da amostra. O ponto de início aleatório r é escolhido entre 1 e k.

Vantagens

  • Fácil implementação
  • Distribuição uniforme na população
  • Não requer lista completa randomizada

Desvantagens

  • Vulnerável a periodicidades na lista
  • Pode introduzir viés se houver padrão oculto
  • Não garante representatividade de subgrupos

Relação entre as Técnicas e Precisão

A amostragem estratificada geralmente oferece maior precisão para subpopulações, mas com custo adicional de estratificação. Inversamente, a por conglomerados reduz custos operacionais, mas pode comprometer a precisão devido à homogeneidade intra-conglomerados. A sistemática, por sua vez, oferece bom equilíbrio entre praticidade e precisão quando bem aplicada.

Erro amostral: \(SE = \frac{\sigma}{\sqrt{n}} \times \sqrt{1 – \frac{n}{N}}\) onde σ é o desvio padrão populacional e o último termo é o fator de correção para população finita.

Guia de Decisão para Escolha da Técnica

Se a população for homogênea e a lista estiver disponível, a amostragem aleatória simples é adequada. Contudo, se existirem subgrupos importantes conhecidos, a estratificada é preferível. Analogamente, para populações geograficamente dispersas, a por conglomerados é mais eficiente. Eventualmente, quando a lista está ordenada aleatoriamente, a sistemática oferece bom equilíbrio entre custo e precisão.

Considerações Finais

A seleção da técnica de amostragem depende fundamentalmente das características da população, dos recursos disponíveis e dos objetivos da pesquisa. Inclusive, muitas pesquisas utilizam combinações dessas técnicas para otimizar resultados. Afinal, a amostragem adequada é crucial para a validade estatística e para inferências confiáveis sobre a população de interesse.

Exemplo em Python

Exemplo em R

Referências Bibliográficas

  • COCHRAN, W. G. Sampling Techniques. 3rd ed. John Wiley & Sons, 1977.
  • LEVY, P. S.; LEMESHOW, S. Sampling of Populations: Methods and Applications. 4th ed. Wiley, 2008.
  • SIQUEIRA, A. L.; TIBÚRCIO, J. D. Amostragem em Pesquisas Epidemiológicas. Editora UFMG, 2011.
  • BUSSAB, W. O.; MORETTIN, P. A. Estatística Básica. 9ª ed. Saraiva, 2017.