Técnicas de Amostragem em Pesquisa Estatística
A amostragem é fundamental na estatística para inferir características populacionais a partir de um subconjunto representativo. Principalmente quando o censo completo é inviável, técnicas adequadas garantem precisão e eficiência.
Principais Técnicas de Amostragem Probabilística
Amostragem Aleatória Simples
Cada elemento da população possui igual probabilidade de seleção. Similarmente, a escolha é completamente aleatória, sem qualquer critério de agrupamento. A probabilidade de seleção é dada por \(P = \frac{n}{N}\), onde n é o tamanho da amostra e N o tamanho da população.
Vantagens
- Simplicidade de implementação
- Requer apenas uma lista completa da população
- Fácil compreensão teórica
Desvantagens
- Pode não representar subgrupos importantes
- Ineficiente para populações heterogêneas
- Custo elevado se a população for dispersa
Amostragem Estratificada
A população é dividida em estratos homogêneos e amostras são selecionadas de cada estrato. Consequentemente, garante representatividade de todos os subgrupos relevantes. A alocação pode ser proporcional ou uniforme.
Fórmula para alocação proporcional: \(n_h = n \times \frac{N_h}{N}\) onde \(n_h\) é o tamanho da amostra no estrato h, \(N_h\) é o tamanho do estrato h, e N é o tamanho total da população.
Vantagens
- Maior precisão para subpopulações
- Permite análise separada por estratos
- Reduz a variabilidade amostral
Desvantagens
- Requer conhecimento prévio da população
- Custo adicional de estratificação
- Complexidade na implementação
Amostragem por Conglomerado
A população é dividida em conglomerados naturais (como bairros ou escolas) e alguns conglomerados são selecionados aleatoriamente. Todos os elementos dos conglomerados selecionados são investigados ou faz-se subamostragem.
Atenção: Os conglomerados devem ser tão heterogêneos quanto a população geral para garantir representatividade. A variância é geralmente maior que na amostragem aleatória simples.
Vantagens
- Reduz custos de deslocamento
- Mais prático para populações geograficamente dispersas
- Facilita a operacionalização
Desvantagens
- Maior erro amostral se conglomerados forem homogêneos
- Precisão inferior à amostragem simples
- Pode requerer tamanho amostral maior
Amostragem Sistemática
Seleciona elementos a intervalos regulares a partir de uma lista ordenada. O primeiro elemento é escolhido aleatoriamente e os demais seguem um intervalo fixo. É eficiente quando a lista não possui periodicidade.
Intervalo de amostragem: \(k = \frac{N}{n}\) onde k é o intervalo, N é o tamanho da população e n é o tamanho da amostra. O ponto de início aleatório r é escolhido entre 1 e k.
Vantagens
- Fácil implementação
- Distribuição uniforme na população
- Não requer lista completa randomizada
Desvantagens
- Vulnerável a periodicidades na lista
- Pode introduzir viés se houver padrão oculto
- Não garante representatividade de subgrupos
Relação entre as Técnicas e Precisão
A amostragem estratificada geralmente oferece maior precisão para subpopulações, mas com custo adicional de estratificação. Inversamente, a por conglomerados reduz custos operacionais, mas pode comprometer a precisão devido à homogeneidade intra-conglomerados. A sistemática, por sua vez, oferece bom equilíbrio entre praticidade e precisão quando bem aplicada.
Erro amostral: \(SE = \frac{\sigma}{\sqrt{n}} \times \sqrt{1 – \frac{n}{N}}\) onde σ é o desvio padrão populacional e o último termo é o fator de correção para população finita.
Guia de Decisão para Escolha da Técnica
Se a população for homogênea e a lista estiver disponível, a amostragem aleatória simples é adequada. Contudo, se existirem subgrupos importantes conhecidos, a estratificada é preferível. Analogamente, para populações geograficamente dispersas, a por conglomerados é mais eficiente. Eventualmente, quando a lista está ordenada aleatoriamente, a sistemática oferece bom equilíbrio entre custo e precisão.
Considerações Finais
A seleção da técnica de amostragem depende fundamentalmente das características da população, dos recursos disponíveis e dos objetivos da pesquisa. Inclusive, muitas pesquisas utilizam combinações dessas técnicas para otimizar resultados. Afinal, a amostragem adequada é crucial para a validade estatística e para inferências confiáveis sobre a população de interesse.
Exemplo em Python
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 |
import random import numpy as np from typing import List, Dict class Amostragem: def __init__(self, populacao: List, tamanho_amostra: int): self.populacao = populacao self.n = tamanho_amostra self.N = len(populacao) def aleatoria_simples(self) -> List: """Amostragem Aleatória Simples usando random.sample""" return random.sample(self.populacao, self.n) def estratificada(self, estratos: Dict[str, List]) -> Dict[str, List]: """Amostragem Estratificada Proporcional""" amostra_estratos = {} for estrato, elementos in estratos.items(): n_estrato = max(1, int(self.n * (len(elementos) / self.N))) amostra_estratos[estrato] = random.sample(elementos, n_estrato) return amostra_estratos def sistematica(self) -> List: """Amostragem Sistemática com intervalo k""" k = max(1, self.N // self.n) inicio = random.randint(0, k-1) amostra = [] for i in range(self.n): indice = inicio + i * k if indice < self.N: amostra.append(self.populacao[indice]) return amostra def conglomerado(self, conglomerados: Dict[str, List], numero_conglomerados: int) -> List: """Amostragem por Conglomerado com subamostragem""" conglomerados_selecionados = random.sample(list(conglomerados.keys()), numero_conglomerados) amostra = [] total_elementos = sum(len(conglomerados[cong]) for cong in conglomerados_selecionados) if total_elementos > self.n: todos_elementos = [] for cong in conglomerados_selecionados: todos_elementos.extend(conglomerados[cong]) amostra = random.sample(todos_elementos, self.n) else: for cong in conglomerados_selecionados: amostra.extend(conglomerados[cong]) return amostra # Exemplo de uso if __name__ == "__main__": populacao = [f"Pessoa_{i:03d}" for i in range(1000)] amostrador = Amostragem(populacao, 100) # Amostragem Aleatória Simples amostra_simples = amostrador.aleatoria_simples() print(f"Amostra Aleatória Simples: {len(amostra_simples)} elementos") # Amostragem Estratificada estratos = { "Jovens": [f"Pessoa_{i:03d}" for i in range(300)], "Adultos": [f"Pessoa_{i:03d}" for i in range(300, 700)], "Idosos": [f"Pessoa_{i:03d}" for i in range(700, 1000)] } amostra_estratos = amostrador.estratificada(estratos) print("Amostra Estratificada:", {k: len(v) for k, v in amostra_estratos.items()}) # Amostragem Sistemática amostra_sistematica = amostrador.sistematica() print(f"Amostra Sistemática: {len(amostra_sistematica)} elementos") # Amostragem por Conglomerado conglomerados = { "Norte": [f"Pessoa_{i:03d}" for i in range(250)], "Sul": [f"Pessoa_{i:03d}" for i in range(250, 500)], "Leste": [f"Pessoa_{i:03d}" for i in range(500, 750)], "Oeste": [f"Pessoa_{i:03d}" for i in range(750, 1000)] } amostra_conglomerados = amostrador.conglomerado(conglomerados, 2) print(f"Amostra por Conglomerados: {len(amostra_conglomerados)} elementos") |
Exemplo em R
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 |
# Técnicas de Amostragem em R # Criando população de exemplo populacao <- 1:1000 N <- length(populacao) n <- 100 # 1. Amostragem Aleatória Simples amostra_simples <- sample(populacao, n, replace = FALSE) cat("Amostra Aleatória Simples:", length(amostra_simples), "elementos\n") # 2. Amostragem Estratificada # Criando estratos estratos <- list( jovens = 1:300, adultos = 301:700, idosos = 701:1000 ) amostra_estratos <- list() for (estrato_nome in names(estratos)) { estrato <- estratos[[estrato_nome]] n_estrato <- max(1, round(n * (length(estrato) / N))) amostra_estratos[[estrato_nome]] <- sample(estrato, n_estrato, replace = FALSE) } cat("Amostra Estratificada:\n") print(sapply(amostra_estratos, length)) # 3. Amostragem Sistemática k <- floor(N / n) inicio <- sample(1:k, 1) amostra_sistematica <- seq(inicio, N, by = k)[1:n] cat("Amostra Sistemática:", length(amostra_sistematica), "elementos\n") # 4. Amostragem por Conglomerado conglomerados <- list( norte = 1:250, sul = 251:500, leste = 501:750, oeste = 751:1000 ) conglomerados_selecionados <- sample(names(conglomerados), 2) amostra_conglomerados <- unlist(conglomerados[conglomerados_selecionados]) # Subamostragem se necessário if (length(amostra_conglomerados) > n) { amostra_conglomerados <- sample(amostra_conglomerados, n) } cat("Amostra por Conglomerados:", length(amostra_conglomerados), "elementos\n") # Análise comparativa cat("\n--- Análise Descritiva das Amostras ---\n") cat("Média Populacional:", mean(populacao), "\n") cat("Média Amostra Simples:", mean(amostra_simples), "\n") cat("Média Amostra Sistemática:", mean(amostra_sistematica), "\n") cat("Média Amostra Conglomerados:", mean(amostra_conglomerados), "\n") # Teste de representatividade teste_simples <- t.test(amostra_simples, mu = mean(populacao)) cat("\nTeste t para Amostra Simples (p-value):", teste_simples$p.value, "\n") |
Referências Bibliográficas
- COCHRAN, W. G. Sampling Techniques. 3rd ed. John Wiley & Sons, 1977.
- LEVY, P. S.; LEMESHOW, S. Sampling of Populations: Methods and Applications. 4th ed. Wiley, 2008.
- SIQUEIRA, A. L.; TIBÚRCIO, J. D. Amostragem em Pesquisas Epidemiológicas. Editora UFMG, 2011.
- BUSSAB, W. O.; MORETTIN, P. A. Estatística Básica. 9ª ed. Saraiva, 2017.