Média e Mediana: Conceitos e Aplicações

população

Média e mediana são duas medidas de tendência central fundamentais em estatística.
Ambas fornecem informações sobre o “centro” de um conjunto de dados, contudo uma é mais sensível a dados extremos (outliers).

O que é Média?

A média aritmética é calculada somando todos os valores de um conjunto
de dados e dividindo pelo número de elementos. É representada pela fórmula:

\({\color{Red} \sum_{i=1}^{n} x_i} = x_{1} + x_{2} + .. + x_{n}\)
\(\bar{x}_{n} =\frac{1}{n} \times {\color{Red} \sum_{i=1}^{n} x_i} = \frac{{\color{Red} \sum_{i=1}^{n} x_i}}{n}\)

OU

\({\color{Red} S_{n}} = x_{1} + x_{2} + .. + x_{n}\)
\(\bar{x} = \frac{1}{n} \times {\color{Red} S_{n}} = \frac{{\color{Red} S_{n}}}{n}\)

Onde:

  • \(\bar{x}\) é a média
  • \(x_i\) são os valores individuais
  • \(n\) é o número de elementos no conjunto
  • \(\sum_{i=1}^{n} x_i\) ou \(S_{n}\) representa o somatório
  • \(i\) representa um indice ou contador que indica a posição de cada elemento na sequência de dados.

Exemplo com dados reais

Vamos calcular a média dos salários da planilha “media”:

Funcionários Salários (mil R$)
1 13
2 15
3 20
4 13
5 20
6 13
7 13
8 30
9 16
10 20

Cálculo da média:

Soma = 13 + 15 + 20 + 13 + 20 + 13 + 13 + 30 + 16 + 20 = 173

Número de elementos = 10

Média = 173 ÷ 10 = 17.3 mil R$

Em R, podemos calcular assim:

O que é Mediana?

A mediana é o valor que divide um conjunto de dados ordenados em duas partes iguais.
Metade dos valores estão abaixo da mediana e metade estão acima.

Mediana de uma População

Para representar a mediana de uma população, é comum usar:

  • \(\tilde{\mu}\) (mu til) – Por analogia com a média populacional \(\mu\)
  • \(Med\) – Mantendo a mesma abreviatura, mas aplicada à população
  • \(Md\) – Similar ao caso amostral

Conjunto ÍMPAR de elementos

Para um número ímpar de elementos, a mediana é o valor central quando os dados estão ordenados.

Exemplo com a planilha “mediana impar” (11 elementos):

Funcionários Salários (mil R$)
1 13
2 15
3 20
4 13
5 20
6 13
7 13
8 30
9 16
10 20
11 250

Dados ordenados: 13, 13, 13, 13, 15, 16, 20, 20, 20, 30, 250

Mediana = 16 (o 6º elemento, que divide os 11 elementos em duas partes iguais)

Conjunto PAR de elementos

Para um número par de elementos, a mediana é a média dos dois valores centrais.

Exemplo com a planilha “mediana par” (10 elementos):

Funcionários Salários (mil R$)
1 13
2 15
3 20
4 13
5 20
6 13
7 13
8 30
9 16
10 20

Dados ordenados: 13, 13, 13, 13, 15, 16, 20, 20, 20, 30, 250

Mediana = (15 + 16) ÷ 2 = 15.5 (média do 5º e 6º elementos)

Comparação entre Média e Mediana

Média

Vantagens:

  • Considera todos os valores do conjunto
  • Fácil de calcular e interpretar
  • Boa para dados com distribuição simétrica

Desvantagens:

  • Sensível a valores extremos (outliers)
  • Pode não representar bem o centro em distribuições assimétricas

Mediana

Vantagens:

  • Robusta a valores extremos (outliers)
  • Melhor representante do centro em distribuições assimétricas
  • Fácil de entender como “o valor do meio”

Desvantagens:

  • Ignora a magnitude dos outros valores
  • Pode não ser representativa em conjuntos muito pequenos
  • Mais difícil de usar em análises estatísticas avançadas

Quando usar cada medida?

Use a média quando: Os dados têm distribuição simétrica e não há valores extremos.

Use a mediana quando: Os dados têm distribuição assimétrica ou contêm valores extremos.

No exemplo dos salários, note como a média (17.3) é maior que a mediana (15.5),
indicando uma assimetria à direita causada por salários mais altos que puxam a média para cima.

Conclusão

Média e mediana são ambas medidas de tendência central importantes, mas respondem a perguntas
diferentes sobre os dados. Enquanto a média representa o “centro de gravidade” do conjunto,
a mediana representa o “valor do meio”. A escolha entre elas depende da distribuição dos dados
e da presença de valores extremos.

Em muitos casos, o ideal é reportar ambas as medidas para ter uma visão mais completa
da distribuição dos dados.

Média populacional e média amostral

equilibrista

As médias populacional e amostral são conceitos fundamentais em estatística que nos ajudam a entender e resumir características de conjuntos de dados. Embora ambas representem medidas de tendência central, possuem aplicações e interpretações distintas.

O que é Média?

A média é uma medida de tendência central que representa o valor “típico” de um conjunto de números. É calculada somando todos os valores e dividindo pelo número de elementos.

Média Populacional

A média populacional (representada por \(\mu\)) é a média de todos os elementos de uma população.

Fórmula:

\(\mu = \frac{\sum_{i=1}^{N} x_i}{N}\)

Onde:

  • \(x_i\) = cada valor individual na população
  • \(N\) = número total de elementos na população

Média Amostral

A média amostral (representada por \(\bar{x}\)) é a média de um subconjunto (amostra) da população.

Fórmula:

\(\bar{x} = \frac{\sum_{i=1}^{n} x_i}{n}\)

Onde:

  • \(x_i\) = cada valor individual na amostra
  • \(n\) = número total de elementos na amostra

Diferenças Principais

Média Populacional

  • Calculada usando todos os elementos da população
  • Representada por \(\mu\) (mu)
  • É um parâmetro fixo (não varia)
  • Geralmente desconhecida na prática
  • Não está sujeita a erro amostral

Média Amostral

  • Calculada usando apenas uma amostra da população
  • Representada por \(\bar{x}\) (x-barra)
  • É uma estatística que varia entre amostras
  • Usada para estimar a média populacional
  • Sujeita a erro amostral

Exemplo Prático

Suponha que queremos saber a altura média dos estudantes de uma universidade com 10.000 alunos.

Média Populacional

Para calcular a média populacional, precisaríamos medir a altura de todos os 10.000 estudantes:

\(\mu = \frac{\text{soma de todas as alturas}}{10000}\)

Este valor seria exato, mas impraticável de obter.

Média Amostral

Na prática, selecionaríamos uma amostra de 100 estudantes e calcularíamos:

\(\bar{x} = \frac{\text{soma das alturas da amostra}}{100}\)

Usaríamos então \(\bar{x}\) como estimativa de \(\mu\).

Aplicações no Mundo Real

Pesquisas Eleitorais

As pesquisas eleitorais usam médias amostrais para estimar a intenção de voto da população total de eleitores.

Controle de Qualidade

Indústrias usam amostras de produtos para calcular médias amostrais e inferir sobre a qualidade de toda a produção.

Quando usar cada uma?

Use a média populacional quando você tiver acesso a todos os elementos da população e recursos para medi-los.

Use a média amostral quando a população for muito grande, os recursos forem limitados, ou quando medições forem destrutivas/caras.

Relação entre Média Amostral e Populacional

Pelo Teorema do Limite Central, a distribuição das médias amostrais aproxima-se de uma distribuição normal à medida que o tamanho da amostra aumenta, independentemente da forma da distribuição populacional. Isso nos permite fazer inferências sobre a média populacional com base na amostral.

Cálculo de Médias em Python

Conclusão

A média populacional representa o valor verdadeiro da característica de interesse em toda uma população, enquanto a média amostral é uma estimativa baseada em um subconjunto dessa população. Na prática, quase sempre trabalhamos com médias amostrais devido a restrições de tempo, custo e praticidade. O entendimento da relação entre essas duas medidas é fundamental para a inferência estatística e para a tomada de decisões baseadas em dados.

Referências

  • Triola, M. F. (2017). Estatística. LTC Editora.
  • Bussab, W. O., & Morettin, P. A. (2017). Estatística Básica. Saraiva Educação.
  • Montgomery, D. C., & Runger, G. C. (2018). Estatística Aplicada e Probabilidade para Engenheiros. LTC Editora.