Média e Mediana: Conceitos e Aplicações

população

Média e mediana são duas medidas de tendência central fundamentais em estatística.
Ambas fornecem informações sobre o “centro” de um conjunto de dados, contudo uma é mais sensível a dados extremos (outliers).

O que é Média?

A média aritmética é calculada somando todos os valores de um conjunto
de dados e dividindo pelo número de elementos. É representada pela fórmula:

\({\color{Red} \sum_{i=1}^{n} x_i} = x_{1} + x_{2} + .. + x_{n}\)
\(\bar{x}_{n} =\frac{1}{n} \times {\color{Red} \sum_{i=1}^{n} x_i} = \frac{{\color{Red} \sum_{i=1}^{n} x_i}}{n}\)

OU

\({\color{Red} S_{n}} = x_{1} + x_{2} + .. + x_{n}\)
\(\bar{x} = \frac{1}{n} \times {\color{Red} S_{n}} = \frac{{\color{Red} S_{n}}}{n}\)

Onde:

  • \(\bar{x}\) é a média
  • \(x_i\) são os valores individuais
  • \(n\) é o número de elementos no conjunto
  • \(\sum_{i=1}^{n} x_i\) ou \(S_{n}\) representa o somatório
  • \(i\) representa um indice ou contador que indica a posição de cada elemento na sequência de dados.

Exemplo com dados reais

Vamos calcular a média dos salários da planilha “media”:

Funcionários Salários (mil R$)
1 13
2 15
3 20
4 13
5 20
6 13
7 13
8 30
9 16
10 20

Cálculo da média:

Soma = 13 + 15 + 20 + 13 + 20 + 13 + 13 + 30 + 16 + 20 = 173

Número de elementos = 10

Média = 173 ÷ 10 = 17.3 mil R$

Em R, podemos calcular assim:

O que é Mediana?

A mediana é o valor que divide um conjunto de dados ordenados em duas partes iguais.
Metade dos valores estão abaixo da mediana e metade estão acima.

Mediana de uma População

Para representar a mediana de uma população, é comum usar:

  • \(\tilde{\mu}\) (mu til) – Por analogia com a média populacional \(\mu\)
  • \(Med\) – Mantendo a mesma abreviatura, mas aplicada à população
  • \(Md\) – Similar ao caso amostral

Conjunto ÍMPAR de elementos

Para um número ímpar de elementos, a mediana é o valor central quando os dados estão ordenados.

Exemplo com a planilha “mediana impar” (11 elementos):

Funcionários Salários (mil R$)
1 13
2 15
3 20
4 13
5 20
6 13
7 13
8 30
9 16
10 20
11 250

Dados ordenados: 13, 13, 13, 13, 15, 16, 20, 20, 20, 30, 250

Mediana = 16 (o 6º elemento, que divide os 11 elementos em duas partes iguais)

Conjunto PAR de elementos

Para um número par de elementos, a mediana é a média dos dois valores centrais.

Exemplo com a planilha “mediana par” (10 elementos):

Funcionários Salários (mil R$)
1 13
2 15
3 20
4 13
5 20
6 13
7 13
8 30
9 16
10 20

Dados ordenados: 13, 13, 13, 13, 15, 16, 20, 20, 20, 30, 250

Mediana = (15 + 16) ÷ 2 = 15.5 (média do 5º e 6º elementos)

Comparação entre Média e Mediana

Média

Vantagens:

  • Considera todos os valores do conjunto
  • Fácil de calcular e interpretar
  • Boa para dados com distribuição simétrica

Desvantagens:

  • Sensível a valores extremos (outliers)
  • Pode não representar bem o centro em distribuições assimétricas

Mediana

Vantagens:

  • Robusta a valores extremos (outliers)
  • Melhor representante do centro em distribuições assimétricas
  • Fácil de entender como “o valor do meio”

Desvantagens:

  • Ignora a magnitude dos outros valores
  • Pode não ser representativa em conjuntos muito pequenos
  • Mais difícil de usar em análises estatísticas avançadas

Quando usar cada medida?

Use a média quando: Os dados têm distribuição simétrica e não há valores extremos.

Use a mediana quando: Os dados têm distribuição assimétrica ou contêm valores extremos.

No exemplo dos salários, note como a média (17.3) é maior que a mediana (15.5),
indicando uma assimetria à direita causada por salários mais altos que puxam a média para cima.

Conclusão

Média e mediana são ambas medidas de tendência central importantes, mas respondem a perguntas
diferentes sobre os dados. Enquanto a média representa o “centro de gravidade” do conjunto,
a mediana representa o “valor do meio”. A escolha entre elas depende da distribuição dos dados
e da presença de valores extremos.

Em muitos casos, o ideal é reportar ambas as medidas para ter uma visão mais completa
da distribuição dos dados.

Classe dos Eventos Aleatórios

dados

Em probabilidade, a classe de eventos aleatórios é o conjunto formado por todos os eventos possíveis (todos os subconjuntos) de um espaço amostral \(\Omega\).

\(\mathcal{F} = \{ A \mid A \subseteq \Omega \}\)

Características Principais

  • Também chamada de conjunto das partes do espaço amostral
  • Notação: \(\mathcal{P}(\Omega)\) ou \(2^\Omega\)
  • Inclui todos os subconjuntos possíveis, desde o vazio até o próprio \(\Omega\)

Exemplos

Exemplo 1: Moeda

Espaço amostral:
\(\Omega = \{Cara, Coroa\}\)
Classe de eventos:

\(\mathcal{F} = \{\emptyset, \{Cara\}, \{Coroa\}, \{Cara, Coroa\}\}\)

Exemplo 2: Dado

Espaço amostral:
\(\Omega = \{1, 2, 3, 4, 5, 6\}\)

A classe de eventos contém:

  • Evento “número par”: \(\{2, 4, 6\}\)
  • Evento “número primo”: \(\{2, 3, 5\}\)
  • Todos os 64 subconjuntos possíveis (2⁶)

 

Emulando lançamento de dados na linguagem R

 

Propriedades

Propriedade Descrição
Contém o espaço amostral \(\Omega \in \mathcal{F}\)
Contém o conjunto vazio \(\emptyset \in \mathcal{F}\)
Fechada sob complementação Se \(A \in \mathcal{F}\), então \(A^c \in \mathcal{F}\)
Fechada sob uniões Se \(A, B \in \mathcal{F}\), então \(A \cup B \in \mathcal{F}\)

Importância

A classe de eventos aleatórios é fundamental porque:

  1. Define exatamente quais subconjuntos podem ter probabilidade associada
  2. Permite operações lógicas entre eventos (e, ou, negação)
  3. Forma a base para a definição de uma medida de probabilidade