Técnicas de Amostragem em Estatística

Técnicas de Amostragem em Pesquisa Estatística

A amostragem é fundamental na estatística para inferir características populacionais a partir de um subconjunto representativo. Principalmente quando o censo completo é inviável, técnicas adequadas garantem precisão e eficiência.

Principais Técnicas de Amostragem Probabilística

Amostragem Aleatória Simples

Cada elemento da população possui igual probabilidade de seleção. Similarmente, a escolha é completamente aleatória, sem qualquer critério de agrupamento. A probabilidade de seleção é dada por $P = \frac{n}{N}$, onde n é o tamanho da amostra e N o tamanho da população.

Vantagens

Simplicidade de implementação
Requer apenas uma lista completa da população
Fácil compreensão teórica

Desvantagens

Pode não representar subgrupos importantes
Ineficiente para populações heterogêneas
Custo elevado se a população for dispersa

Amostragem Estratificada

A população é dividida em estratos homogêneos e amostras são selecionadas de cada estrato. Consequentemente, garante representatividade de todos os subgrupos relevantes. A alocação pode ser proporcional ou uniforme.

Fórmula para alocação proporcional: $n_h = n \times \frac{N_h}{N}$ onde $n_h$ é o tamanho da amostra no estrato h, $N_h$ é o tamanho do estrato h, e N é o tamanho total da população.

Vantagens

Maior precisão para subpopulações
Permite análise separada por estratos
Reduz a variabilidade amostral

Desvantagens

Requer conhecimento prévio da população
Custo adicional de estratificação
Complexidade na implementação

Amostragem por Conglomerado

A população é dividida em conglomerados naturais (como bairros ou escolas) e alguns conglomerados são selecionados aleatoriamente. Todos os elementos dos conglomerados selecionados são investigados ou faz-se subamostragem.

Atenção: Os conglomerados devem ser tão heterogêneos quanto a população geral para garantir representatividade. A variância é geralmente maior que na amostragem aleatória simples.

Vantagens

Reduz custos de deslocamento
Mais prático para populações geograficamente dispersas
Facilita a operacionalização

Desvantagens

Maior erro amostral se conglomerados forem homogêneos
Precisão inferior à amostragem simples
Pode requerer tamanho amostral maior

Amostragem Sistemática

Seleciona elementos a intervalos regulares a partir de uma lista ordenada. O primeiro elemento é escolhido aleatoriamente e os demais seguem um intervalo fixo. É eficiente quando a lista não possui periodicidade.

Intervalo de amostragem: $k = \frac{N}{n}$ onde k é o intervalo, N é o tamanho da população e n é o tamanho da amostra. O ponto de início aleatório r é escolhido entre 1 e k.

Vantagens

Fácil implementação
Distribuição uniforme na população
Não requer lista completa randomizada

Desvantagens

Vulnerável a periodicidades na lista
Pode introduzir viés se houver padrão oculto
Não garante representatividade de subgrupos

Relação entre as Técnicas e Precisão

A amostragem estratificada geralmente oferece maior precisão para subpopulações, mas com custo adicional de estratificação. Inversamente, a por conglomerados reduz custos operacionais, mas pode comprometer a precisão devido à homogeneidade intra-conglomerados. A sistemática, por sua vez, oferece bom equilíbrio entre praticidade e precisão quando bem aplicada.

Erro amostral: $SE = \frac{\sigma}{\sqrt{n}} \times \sqrt{1 – \frac{n}{N}}$ onde σ é o desvio padrão populacional e o último termo é o fator de correção para população finita.

Guia de Decisão para Escolha da Técnica

Se a população for homogênea e a lista estiver disponível, a amostragem aleatória simples é adequada. Contudo, se existirem subgrupos importantes conhecidos, a estratificada é preferível. Analogamente, para populações geograficamente dispersas, a por conglomerados é mais eficiente. Eventualmente, quando a lista está ordenada aleatoriamente, a sistemática oferece bom equilíbrio entre custo e precisão.

Considerações Finais

A seleção da técnica de amostragem depende fundamentalmente das características da população, dos recursos disponíveis e dos objetivos da pesquisa. Inclusive, muitas pesquisas utilizam combinações dessas técnicas para otimizar resultados. Afinal, a amostragem adequada é crucial para a validade estatística e para inferências confiáveis sobre a população de interesse.

Exemplo em Python

import random
import numpy as np
from typing import List, Dict

class Amostragem:
    def __init__(self, populacao: List, tamanho_amostra: int):
        self.populacao = populacao
        self.n = tamanho_amostra
        self.N = len(populacao)
    
    def aleatoria_simples(self) -> List:
        """Amostragem Aleatória Simples usando random.sample"""
        return random.sample(self.populacao, self.n)
    
    def estratificada(self, estratos: Dict[str, List]) -> Dict[str, List]:
        """Amostragem Estratificada Proporcional"""
        amostra_estratos = {}
        for estrato, elementos in estratos.items():
            n_estrato = max(1, int(self.n * (len(elementos) / self.N)))
            amostra_estratos[estrato] = random.sample(elementos, n_estrato)
        return amostra_estratos
    
    def sistematica(self) -> List:
        """Amostragem Sistemática com intervalo k"""
        k = max(1, self.N // self.n)
        inicio = random.randint(0, k-1)
        amostra = []
        for i in range(self.n):
            indice = inicio + i * k
            if indice < self.N:
                amostra.append(self.populacao[indice])
        return amostra

    def conglomerado(self, conglomerados: Dict[str, List], numero_conglomerados: int) -> List:
        """Amostragem por Conglomerado com subamostragem"""
        conglomerados_selecionados = random.sample(list(conglomerados.keys()), numero_conglomerados)
        amostra = []
        
        total_elementos = sum(len(conglomerados[cong]) for cong in conglomerados_selecionados)
        
        if total_elementos > self.n:
            todos_elementos = []
            for cong in conglomerados_selecionados:
                todos_elementos.extend(conglomerados[cong])
            amostra = random.sample(todos_elementos, self.n)
        else:
            for cong in conglomerados_selecionados:
                amostra.extend(conglomerados[cong])
        
        return amostra

# Exemplo de uso
if __name__ == "__main__":
    populacao = [f"Pessoa_{i:03d}" for i in range(1000)]
    amostrador = Amostragem(populacao, 100)
    
    # Amostragem Aleatória Simples
    amostra_simples = amostrador.aleatoria_simples()
    print(f"Amostra Aleatória Simples: {len(amostra_simples)} elementos")
    
    # Amostragem Estratificada
    estratos = {
        "Jovens": [f"Pessoa_{i:03d}" for i in range(300)],
        "Adultos": [f"Pessoa_{i:03d}" for i in range(300, 700)],
        "Idosos": [f"Pessoa_{i:03d}" for i in range(700, 1000)]
    }
    amostra_estratos = amostrador.estratificada(estratos)
    print("Amostra Estratificada:", {k: len(v) for k, v in amostra_estratos.items()})
    
    # Amostragem Sistemática
    amostra_sistematica = amostrador.sistematica()
    print(f"Amostra Sistemática: {len(amostra_sistematica)} elementos")
    
    # Amostragem por Conglomerado
    conglomerados = {
        "Norte": [f"Pessoa_{i:03d}" for i in range(250)],
        "Sul": [f"Pessoa_{i:03d}" for i in range(250, 500)],
        "Leste": [f"Pessoa_{i:03d}" for i in range(500, 750)],
        "Oeste": [f"Pessoa_{i:03d}" for i in range(750, 1000)]
    }
    amostra_conglomerados = amostrador.conglomerado(conglomerados, 2)
    print(f"Amostra por Conglomerados: {len(amostra_conglomerados)} elementos")

import random

import numpy as np

from typing import List, Dict

class Amostragem:

def __init__(self, populacao: List, tamanho_amostra: int):

self.populacao = populacao

self.n = tamanho_amostra

self.N = len(populacao)

def aleatoria_simples(self) -> List:

"""Amostragem Aleatória Simples usando random.sample"""

return random.sample(self.populacao, self.n)

def estratificada(self, estratos: Dict[str, List]) -> Dict[str, List]:

"""Amostragem Estratificada Proporcional"""

amostra_estratos = {}

for estrato, elementos in estratos.items():

n_estrato = max(1, int(self.n * (len(elementos) / self.N)))

amostra_estratos[estrato] = random.sample(elementos, n_estrato)

return amostra_estratos

def sistematica(self) -> List:

"""Amostragem Sistemática com intervalo k"""

k = max(1, self.N // self.n)

inicio = random.randint(0, k-1)

amostra = []

for i in range(self.n):

indice = inicio + i * k

if indice < self.N:

amostra.append(self.populacao[indice])

return amostra

def conglomerado(self, conglomerados: Dict[str, List], numero_conglomerados: int) -> List:

"""Amostragem por Conglomerado com subamostragem"""

conglomerados_selecionados = random.sample(list(conglomerados.keys()), numero_conglomerados)

amostra = []

total_elementos = sum(len(conglomerados[cong]) for cong in conglomerados_selecionados)

if total_elementos > self.n:

todos_elementos = []

for cong in conglomerados_selecionados:

todos_elementos.extend(conglomerados[cong])

amostra = random.sample(todos_elementos, self.n)

else:

for cong in conglomerados_selecionados:

amostra.extend(conglomerados[cong])

return amostra

# Exemplo de uso

if __name__ == "__main__":

populacao = [f"Pessoa_{i:03d}" for i in range(1000)]

amostrador = Amostragem(populacao, 100)

# Amostragem Aleatória Simples

amostra_simples = amostrador.aleatoria_simples()

print(f"Amostra Aleatória Simples: {len(amostra_simples)} elementos")

# Amostragem Estratificada

estratos = {

"Jovens": [f"Pessoa_{i:03d}" for i in range(300)],

"Adultos": [f"Pessoa_{i:03d}" for i in range(300, 700)],

"Idosos": [f"Pessoa_{i:03d}" for i in range(700, 1000)]

}

amostra_estratos = amostrador.estratificada(estratos)

print("Amostra Estratificada:", {k: len(v) for k, v in amostra_estratos.items()})

# Amostragem Sistemática

amostra_sistematica = amostrador.sistematica()

print(f"Amostra Sistemática: {len(amostra_sistematica)} elementos")

# Amostragem por Conglomerado

conglomerados = {

"Norte": [f"Pessoa_{i:03d}" for i in range(250)],

"Sul": [f"Pessoa_{i:03d}" for i in range(250, 500)],

"Leste": [f"Pessoa_{i:03d}" for i in range(500, 750)],

"Oeste": [f"Pessoa_{i:03d}" for i in range(750, 1000)]

}

amostra_conglomerados = amostrador.conglomerado(conglomerados, 2)

print(f"Amostra por Conglomerados: {len(amostra_conglomerados)} elementos")

Exemplo em R

# Técnicas de Amostragem em R

# Criando população de exemplo
populacao <- 1:1000
N <- length(populacao)
n <- 100

# 1. Amostragem Aleatória Simples
amostra_simples <- sample(populacao, n, replace = FALSE)
cat("Amostra Aleatória Simples:", length(amostra_simples), "elementos\n")

# 2. Amostragem Estratificada
# Criando estratos
estratos <- list(
  jovens = 1:300,
  adultos = 301:700, 
  idosos = 701:1000
)

amostra_estratos <- list()
for (estrato_nome in names(estratos)) {
  estrato <- estratos[[estrato_nome]]
  n_estrato <- max(1, round(n * (length(estrato) / N)))
  amostra_estratos[[estrato_nome]] <- sample(estrato, n_estrato, replace = FALSE)
}
cat("Amostra Estratificada:\n")
print(sapply(amostra_estratos, length))

# 3. Amostragem Sistemática
k <- floor(N / n)
inicio <- sample(1:k, 1)
amostra_sistematica <- seq(inicio, N, by = k)[1:n]
cat("Amostra Sistemática:", length(amostra_sistematica), "elementos\n")

# 4. Amostragem por Conglomerado
conglomerados <- list(
  norte = 1:250,
  sul = 251:500,
  leste = 501:750,
  oeste = 751:1000
)

conglomerados_selecionados <- sample(names(conglomerados), 2)
amostra_conglomerados <- unlist(conglomerados[conglomerados_selecionados])

# Subamostragem se necessário
if (length(amostra_conglomerados) > n) {
  amostra_conglomerados <- sample(amostra_conglomerados, n)
}
cat("Amostra por Conglomerados:", length(amostra_conglomerados), "elementos\n")

# Análise comparativa
cat("\n--- Análise Descritiva das Amostras ---\n")
cat("Média Populacional:", mean(populacao), "\n")
cat("Média Amostra Simples:", mean(amostra_simples), "\n")
cat("Média Amostra Sistemática:", mean(amostra_sistematica), "\n")
cat("Média Amostra Conglomerados:", mean(amostra_conglomerados), "\n")

# Teste de representatividade
teste_simples <- t.test(amostra_simples, mu = mean(populacao))
cat("\nTeste t para Amostra Simples (p-value):", teste_simples$p.value, "\n")

# Técnicas de Amostragem em R

# Criando população de exemplo

populacao <- 1:1000

N <- length(populacao)

n <- 100

# 1. Amostragem Aleatória Simples

amostra_simples <- sample(populacao, n, replace = FALSE)

cat("Amostra Aleatória Simples:", length(amostra_simples), "elementos\n")

# 2. Amostragem Estratificada

# Criando estratos

estratos <- list(

jovens = 1:300,

adultos = 301:700,

idosos = 701:1000

)

amostra_estratos <- list()

for (estrato_nome in names(estratos)) {

estrato <- estratos[[estrato_nome]]

n_estrato <- max(1, round(n * (length(estrato) / N)))

amostra_estratos[[estrato_nome]] <- sample(estrato, n_estrato, replace = FALSE)

}

cat("Amostra Estratificada:\n")

print(sapply(amostra_estratos, length))

# 3. Amostragem Sistemática

k <- floor(N / n)

inicio <- sample(1:k, 1)

amostra_sistematica <- seq(inicio, N, by = k)[1:n]

cat("Amostra Sistemática:", length(amostra_sistematica), "elementos\n")

# 4. Amostragem por Conglomerado

conglomerados <- list(

norte = 1:250,

sul = 251:500,

leste = 501:750,

oeste = 751:1000

)

conglomerados_selecionados <- sample(names(conglomerados), 2)

amostra_conglomerados <- unlist(conglomerados[conglomerados_selecionados])

# Subamostragem se necessário

if (length(amostra_conglomerados) > n) {

amostra_conglomerados <- sample(amostra_conglomerados, n)

}

cat("Amostra por Conglomerados:", length(amostra_conglomerados), "elementos\n")

# Análise comparativa

cat("\n--- Análise Descritiva das Amostras ---\n")

cat("Média Populacional:", mean(populacao), "\n")

cat("Média Amostra Simples:", mean(amostra_simples), "\n")

cat("Média Amostra Sistemática:", mean(amostra_sistematica), "\n")

cat("Média Amostra Conglomerados:", mean(amostra_conglomerados), "\n")

# Teste de representatividade

teste_simples <- t.test(amostra_simples, mu = mean(populacao))

cat("\nTeste t para Amostra Simples (p-value):", teste_simples$p.value, "\n")

Referências Bibliográficas

COCHRAN, W. G. Sampling Techniques. 3rd ed. John Wiley & Sons, 1977.
LEVY, P. S.; LEMESHOW, S. Sampling of Populations: Methods and Applications. 4th ed. Wiley, 2008.
SIQUEIRA, A. L.; TIBÚRCIO, J. D. Amostragem em Pesquisas Epidemiológicas. Editora UFMG, 2011.
BUSSAB, W. O.; MORETTIN, P. A. Estatística Básica. 9ª ed. Saraiva, 2017.